中经记者 许璐 李晖 北京报道
数据要素市场日渐活跃,相关领域机构动作频频。
近日,合合信息(688615.SH)向香港联交所更新递交发行申请,在登陆科创板不足一年后,谋求“A+H”资本布局。
作为一家以智能文字识别(OCR)和商业大数据为核心技术的大数据科技企业,合合信息近年来毛利率维持在较高水平,账面资金较为充裕。同时,也面临着商业数据类业务板块收缩、产品付费转化率增速低、研发投入减少、数据治理存在合规风险等可持续发展问题。
全联并购公会信用管理委员会常务副主任、北京信用学会副会长刘新海在接受《中国经营报》记者采访时表示,从合规角度看,个人及企业数据业务的风险主要集中在数据加工和用途演变;企业客户授权并不能自动替代个人信息主体授权;数据是否被长期留存并转化为可复用的商业能力,且是否具备清晰、可解释、可审计的数据使用边界。
文字扫描识别业务支撑八成收入
根据财报,合合信息的业务模式主要通过整合商业数据与文档识别数据,以C端数据查询/处理工具和B端数据接口、标准化产品及定制化解决方案为载体,向个人与企业客户提供数据服务并实现商业变现。主要产品包括为C端用户提供的扫描全能王(智能文字扫描及识别 APP)、名片全能王(智能名片及人脉管理APP)及启信宝(企业商业信息查询APP),包括会员订阅和在线广告服务两种形式,以及为B端客户提供的TextIn(智能文本处理企业级AI产品)及启信慧眼(商业数据智能决策企业级AI产品)。
从财务数据看,合合信息的业绩持续增长。招股书显示,2022—2024年,公司营业收入分别为9.88亿元、11.87亿元和14.38亿元,2025年前三季度,公司实现营收13.03亿元;同期归母净利润分别为2.84亿元、3.23亿元、4亿元和3.51亿元。
公司整体毛利率连续多年维持在84%以上。在业务结构上,2022—2024年,合合信息C端产品毛利率接近90%,B端产品毛利率在60%以上(仅2023年为58.8%),在同业中处于较高水平。
进一步拆解收入来源可以发现,合合信息的增长在很大程度上由单一产品支撑。扫描全能王一直是公司最大的营收来源。2022—2024年,扫描全能王业务营收占比分别为72.3%、76.2%、77.3%,2025年前三季度进一步提升至80.6%。同期,名片全能王业务营收占比分别为2.1%、2.1%、2%、1.7%;与之形成对比的是启信宝的收入占比,自2022年的7.8%持续下滑,至2025年前三季度已降至3.4%。
公开信息显示,针对公司对单一产品的依赖等问题,合合信息称类似产品仍在孵化阶段、尚未成熟推向市场。
理财规模超18亿
招股书中披露,自2013年起,扫描全能王曾在Apple App Store上84个国家和地区效率类免费应用下载量排行榜多次排行第一,收入主要来自中国内地,在2022—2024年、2025年前三季度,中国内地营收占比分别为64.2%、66.6%、67.6%和65.9%。
合合信息曾公开称,在CNAS认证实验室的测评中,公司在困难场景、多版式表格、手写文本、多语言等不同场景下的识别性能均领先于境内外大厂,相关核心技术门槛高。
在用户层面,合合信息在招股书中也提到,C端产品用户商业转换率仍有提升空间。截至2025年三季度末,公司C端整体产品月活跃用户数接近1.9亿,但付费转换率为4.9%。2022年以来,付费转化率的提升幅度明显低于月活跃用户增速,前者为22.5%、后者为42%,用户规模扩张与变现效率之间出现错位。
此次港股上市,合合信息在招股书中提到,募资用途包括未来三至四年提升研发能力、潜在并购与战略投资等。但记者注意到,公司的研发费用率从2022年的28.3%降至2025年三季度的25.4%,同时公司销售及营销费用从同期的27.2%升至31.8%。
事实上,公司的账面资金充裕。截至2025年三季度末,合合信息持有的“以公平值计量且其变动计入损益的金融资产”(主要为理财产品)规模达18.79亿元。2025年5月,公司实施了2024年度的2亿元现金分红,分红率接近50%。
对于一家业务出海的大数据科技企业,合合信息在全球展业过程中也面临不同国家数据合规制度的差异。例如美国呈现联邦与州法并存的“碎片化”监管,各州均设有独立的数据保护法规;新兴国家如印度、印度尼西亚、越南等,则普遍推行 “数据本地化”存储和严格出境管制。
对此,北京德和衡律师事务所合伙人、律师庞珊珊表示,这导致企业在出海过程中需针对不同司法辖区建立差异化的合规架构,显著增加了管理复杂度与运营成本。尤其对于跨境数据流动提供服务的企业而言,本地化存储要求可能迫使企业重构技术架构与业务流程。
数据治理面临挑战
在业务属性上,合合信息横跨OCR工具、商业大数据和AI应用多个领域,数据来源复杂、应用场景多元。
记者注意到,在黑猫投诉 【下载黑猫投诉客户端】平台上,存在300余条关于启信宝的相关投诉,其中一条投诉称此前致电启信宝更新信息未果,致使个人申请贷款失败。在裁判文书网上,亦可检索到关于合合信息网络侵权的案例。
庞珊珊认为,当前个人信息与数据安全监管持续趋严,为满足监管的“精细化”与“穿透式”要求,企业首先面对的是基础成本上涨,例如数据出境安全评估、重要数据识别等新规,使得涉及跨境业务的企业必须承担额外的法务、技术及认证成本。
“其次是隐性成本也会增加,尤其在数据资产入表背景下,确权、评估等环节成为新负担。最后,从长远看这种成本的增加将转化为长期的竞争优势,领先企业正通过AI治理工具、隐私计算等技术,将合规投入转化为数据质量和风控能力的提升,使其从‘成本’转向‘生产性投资’。”庞珊珊表示。
刘新海认为,在我国现行《中华人民共和国个人信息保护法》和《中华人民共和国数据安全法》框架下,“用户授权”并不是对数据使用的无限许可,真正的边界在于数据处理是否始终限定于最初、明确、具体的授权目的之内。如果数据从支撑单一功能性服务,进一步被用于模型训练、跨场景分析或能力沉淀,并超出用户或数据主体的合理预期,就可能构成法律意义上的“数据再利用”。
记者注意到,2025年10月,合合信息旗下产品启信宝的运营公司—上海生腾数据科技有限公司被中国人民银行上海分行处以人民币罚款11.55万元,原因是未按要求报告信用报告的模板及内容;未按要求报告信用评价类产品的评价方法、模型、主要维度要素。
在刘新海看来,这也折射出企业征信较为典型的合规风险:对征信产品核心要素的报备与透明度不足。根据现行监管要求,企业征信机构不仅要依法采集和使用数据,还必须对信用报告的模板结构、评价方法、模型逻辑以及主要维度要素向监管部门进行规范报送,确保监管部门能够理解和审查其征信结论的形成机制。
“在实际操作中,企业征信的合规难点主要体现在三个方面:一是征信产品高度依赖算法和模型,更新频率快,企业往往难以及时同步报备;二是部分机构对‘信用评价类产品’与‘信息整合展示类产品’的监管边界理解不够清晰,低估了模型类产品的合规要求;三是企业内部技术、产品与合规团队之间协同不足,导致‘业务先行、合规补报’的情况。”刘新海表示。
关于产品孵化、研发费用率、数据治理等问题,记者发函致合合信息,截至发稿前暂未得到公司回复。