第九届数字中国建设峰会分论坛侧记:数据何以成势
创始人
2026-05-08 01:44:31
0

当算力奔涌,真正决定人工智能能走多远的,究竟是什么?28日,第九届数字中国建设峰会分论坛密集展开,来自学界与产业界的多位专家给出不约而同的回答:数据。其间,一场场围绕“数据如何成为生产力”的深度探讨,在榕城展开,也勾勒出数字中国迈向更高阶发展的关键坐标。

数字福建分论坛现场。记者 陈暖 摄

数字福建分论坛:

让数据“进厂加工”推动价值释放

如何让数据从“沉睡资源”变为“生产力引擎”?在数字福建分论坛上,北京交通大学信息管理理论与技术国际研究中心教授张向宏给出一个形象答案:让数据“进厂加工”。

带着团队一年来的研究成果,张向宏提出:“高质量数据集的设施化、体系化、标准化构建,是当前数据价值释放的关键核心。”而要实现这一目标,亟须一种全新的产业形态——“数据工厂”。

在他看来,当前人工智能发展正面临一个明显“卡点”:模型越做越强,但真正能支撑行业落地的高质量数据却供给不足。“很多数据就像原油,量很大,但不能直接用,必须经过清洗、标注、加工,才能变成可用于大模型训练和应用的‘高端产品’。”张向宏说。

这一加工过程,正是“数据工厂”的价值所在。在这里,原始数据经过分级处理、精细加工和质量检验,最终转化为可支撑大模型微调、智能体训练的高质量数据集。

张向宏指出,从上游的数据采集与加工,到中游模型训练,再到下游行业应用,面向人工智能的数据产业链正加速贯通。其中,高质量数据集是连接上下游的关键一环。

他进一步提出,数据工厂可探索集中式、分布式等多种模式,既可以由数据标注企业升级而来,也可以依托数据中心转型建设,或由人工智能企业向上游延伸布局。“谁先把高质量数据规模化生产出来,谁就掌握了下一阶段人工智能发展的主动权。”

数据基础设施和数据标准化分论坛:

以多层次结构破解AI发展瓶颈

AI为何在面对复杂现实问题时仍显“力不从心”?数据基础设施和数据标准化分论坛上,北京市科协主席李静海直指关键:问题不只在算法,更深层在于数据系统本身的逻辑与结构。

“AI难题的根源,可能在于数据系统逻辑与研究对象内在结构不匹配。”李静海指出,科学数据来源于一个非线性、多尺度、动态变化的复杂系统,但人类对这一系统的认知仍有限,数据体系往往忽视其多层次结构,导致模型“看见的世界”与真实世界存在偏差。

在他看来,过去业界更多关注数据规模和算力提升,而忽略了数据内部结构的表达。“数据多了,并不等于更好。”李静海说,当前制约AI发展的关键,已从“有没有数据”转向“数据是否结构合理、是否真正反映复杂系统本质”。例如,将不同层级问题简单混合、用单一指标“平均化”复杂现象,都会削弱数据的有效性,甚至误导模型判断。

如何破题?李静海给出了一套“重构逻辑”的思路。他提出,未来数据系统应遵循多层次结构原则:一方面,要明确数据所属层级,避免信息混淆;另一方面,要识别不同层级之间的关键变量,刻画跨层级作用机制。

数字中国AI CITY分论坛:

城市迈向全域数智化转型新阶段

中国信息通信研究院副院长魏亮认为,当前,人工智能技术实现多维突破,发展已经步入L3初期,自主智能体成为这一阶段的核心,城市发展也加速迈入全域数智化转型新阶段。

然而,当下新型基础设施缺乏统筹规划,数智化系统架构各异,重复建设、利用不足的现象仍然存在,高质量数据集的供给同样不足。他强调,未来,各城市应该继续梳理场景,强抓需求,推进“人工智能+”行动,强化基础设施统筹运营,构建创新体系运行机制的闭环驱动模式。

他指出,2027年,人工智能有望在重点领域推动广泛深度融合,在超大特大城市率先建成“一网统管”智能决策系统,让城市运行走向“智治”;2030年有望实现全面深化,实现人工智能全面赋能高质量发展,在全国地级以上城市实现跨系统、跨领域智能协同。(见习记者 唐蔚嫱 记者 阮冠达)

相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...