【环球网科技报道 记者 李文瑶】大模型赛道的竞争正从语言生成加速迈向视觉生成与物理世界理解。
5月19日,智象未来在北京举办首届开放日,正式发布基于原生全模态架构的图像大模型HiDream-O1-Image-Pro。该模型参数量超过2000亿,在多个基准测试中刷新SOTA纪录。
同日,智象未来宣布完成新一轮亿级融资,深创投、金浦投资、财鑫资本、复聚资本等多家机构参与。这也是公司半个月内再次完成融资,资本市场对原生全模态大模型方向的看好程度可见一斑。
原生全模态架构:突破“单模态拼接”瓶颈
据介绍,HiDream-O1-Image-Pro采用智象未来自研的统一Transformer(UiT)架构,将原始图像像素、离散文本标记和任务条件统一纳入连续共享标记空间,实现图像、文本与多任务条件在底层表征上的深度融合。这一设计突破了传统模型图像与文本分离编码带来的语义理解局限,使得模型在通用文生图、高保真文字渲染、图像编辑等任务中均达到新的SOTA水平。
智象未来创始人兼CEO梅涛在开放日上表示:“当前很多‘多模态大模型’,本质上还是‘单模态拼接’。而原生多模态,是从一开始就把‘世界的规则’刻进模型里——它知道物理定律、空间关系、因果逻辑,所以它能真正理解世界、推理世界、重构世界,而不只是‘生成内容’。我们认为,原生全模态是实现AGI的必经之路。”
智象未来联合创始人兼CTO姚霆进一步补充,不久前发布的开源版本HiDream-O1-Image以8B参数登顶Artificial Analysis文生图榜单开源模型全球第一,验证了UiT架构的可扩展性。此次发布的闭源Pro版本参数量超两千亿,在复杂文本渲染、指令编辑、多主体个性化等任务上全面树立新SOTA。
半月内再获融资,多元资本阵容成型
融资方面,智象未来在半个月前刚刚宣布完成超5亿元融资,投资方包括安徽省产投、合肥产投、东方富海等。此次新一轮亿级融资由深创投、金浦投资、财鑫资本、复聚资本等参与。至此,智象未来已形成由安徽、上海、湖南、杭州等多地产业基金持续跟进,深创投、东方富海、峰华资本、敦鸿资本等头部市场化VC参与的多元化资本阵容。
公开资料显示,金浦投资是上海金融发展投资基金的管理人,在算力基础设施、大模型和智能体应用领域深度布局;财鑫资本聚焦人工智能、具身智能等硬科技投资;复聚投资则关注智能制造、新能源、AI等战略新兴产业。
三大智能体加速商业化落地
在技术突破的同时,智象未来已形成“模型+智能体”双轮驱动战略,构建起“1+1+3”业务架构:底层为HiDream系列大模型,中间为HiHarness企业服务平台,上层覆盖商业营销、影视创作和社媒创作三大场景的智能体应用。
据介绍,商业营销智能体HiBurst已覆盖跨境电商、内容营销等场景;影视创作智能体“帧赞”已累计制作短漫剧超5000分钟,入驻专业团队超千家;社媒创作智能体vivago近日登上Product Hunt日榜第一,覆盖100多个国家及地区超4000万用户。
开放日现场,智象未来还与上海电影集团上影新视野基金、蓝色光标、北京捷成世纪、倍尔健康等达成战略合作,推动大模型在影视、营销、医疗等行业的产业化落地。
从HiDream-O1-Image-Pro的发布到三大智能体的规模化应用,智象未来正沿着“从视觉生成走向世界模型”的路径稳步推进。梅涛表示,公司将继续围绕原生全模态架构,推动模型、智能体和产业场景协同演进,向更完整的“世界模型”迈进。