郑纬民院士解读Token新趋势 趋境ATaaS平台发布
创始人
2026-03-28 22:13:23
0

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:网易智能)

3月28日消息,日前,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会举办。

活动特邀九源智能计算生态联合体秘书长、清华大学教授、趋境科技首席科学家武永卫担任主持人。启元实验室副主任刘航、工业和信息化部电子工业标准化研究院副院长郭楠为活动致辞。中国工程院院士、九源智能计算系统生态联合体理事长、清华大学教授、趋境科技首席科学顾问郑纬民受邀出席并做主旨演讲。趋境科技创始人兼CEO艾智远现场发布全新一代AI推理平台趋境 ATaaS 高效能 AI Token 生产服务平台(Approaching.AI Token as a Service)。

郑纬民院士指出,随着智能体、AI Coding等应用的爆发式增长,Token消耗量呈百倍、千倍级跃升,2026年已成为名副其实的“Token爆发元年”。AI产业的核心关注焦点,正从“模型参数规模、模型可用性”全面转向“稳定、低成本、高质量交付的Token产能”。

“未来的智能基础设施应围绕‘Token即服务(TaaS,Token as a Service)’进行重构”。郑纬民院士表示,传统模型服务的核心是保障模型可得性与接口完整性,而Token服务的核心是保障Token产能的可用性,更关注成本、吞吐、延迟与可靠性等生产性指标,是一个极端复杂的多维系统最优化问题,必须完成全链路的系统级创新。

对此,郑纬民院士明确了TaaS发展的三大核心技术底座:一是全系统异构协同,通过将不同计算任务合理分配至GPU、CPU、内存和SSD,打破算力瓶颈;二是存算协同实现“以存换算”,通过前置KV Cache等技术,大幅降低重复计算量,提升推理效率;三是面向SLO的智能调度,精准地将用户业务需求“翻译”为底层资源决策。郑院士表示:“只有让智能生成像水电一样被稳定地调度与供给,才能真正迎来算力制造Token为王的普惠智能时代。”

现场,趋境科技发布了其核心产品趋境ATaaS高效能AI Token生产服务平台。本次发布由趋境科技创始人兼CEO艾智远,与中国工程院院士、九源智能计算生态联合体理事长、清华大学教授、趋境科技首席科学家郑纬民,以及并行科技董事长陈健、中科曙光智能计算产品事业部总经理杜夏威、华为昇腾计算业务副总裁兼首席产品规划师叶耀荣、京东Infra产品负责人郝鹏、浦江实验室代表钟普共同揭晓。

据介绍,针对当前大模型推理服务中普遍存在的硬件资源闲置、软件适配滞后、算力配置粗放、架构演进失衡四大核心难题,该平台将有效破解大额硬件投入难以转化为优质 Token 产能、资源浪费与成本空耗突出的行业困境,以高效能Token生产为核心目标,可支撑万级别AI推理需求,并达到日均万亿级别Token整体产能。

论坛上,来自并行科技、九源智能计算系统生态联合体、中科曙光、京东云、阿里云、华为、商汤科技等企业的代表还围绕国产算力多场景推理优化实践、推理框架实践、Token时代AI引擎、算力底座高效推理等前沿话题以及与趋境科技的深度合作展开深入分享。(定西)

相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...