炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:网易科技)
出品|网易科技《态度》栏目
作者|栎行
编辑|丁广胜
手机行业正迎来一场前所未有的“底层革命”。
轰动一时的豆包AI手机,落地“登陆”并不顺利。几天之内,腾讯系微信、《王者荣耀》,淘宝闲鱼大麦等阿里系应用,乃至建行农行等主流平台几乎同步筑起高墙——登录异常、强制下线、操作拦截与安全警告接连发生,使这款旨在“用AI串联一切”的手机在短时间内处处碰壁。
然而战火未熄,新变数已至:正当豆包陷入重围之际,智谱突然宣布开源具备“Phone Use”能力的AutoGLM模型,支持微信、淘宝等超过50个高频应用场景,为任何厂商提供了打造“类豆包”能力的开源路径。
这一前一后,形成了鲜明对比:一边是字节跳动的深度集成、底层嵌入的“豆包模式”;另一边则是智谱开创的开源路径。这标志着战局从“单点突围”转向“生态对垒”。
在腾讯、阿里等平台以“安全”为名实施技术限制的背后,实则是新旧入口话语权的激烈博弈——这不仅是技术的迭代升级,更是一场关乎生态主导权、用户体验定义权以及未来商业模式的核心竞赛。行业格局或将因此重塑。
AI手机的两种未来路径
AI手机的发展正呈现两条鲜明技术路径。
一方是以豆包手机为代表的“系统级整合”路线。
豆包手机助手通过获得系统级权限,直接嵌入操作系统底层,获得了监控系统运行状态、读取应用界面信息、模拟用户点击操作的权限 ,从而能跨应用执行复杂任务。这需要手机厂商深度合作,将AI能力深度植入操作系统底层。
(图为用户测评豆包手机,语音要求手机买一瓶酱油。图源:iFANr)这种闭源路径优势在于执行效率高、体验流畅,但深度集成需要手机厂商的全力配合,且不可避免地引发了关于权限过高的争议。
另一方是智谱开创的“开源视觉路线”。
该方案不寻求系统级权限,而是通过计算机视觉技术,模拟人类与手机交互的基本方式:先通过屏幕截图“看”懂界面,再通过大模型分析“思考”该做什么,最后模拟手指操作完成指令。
AutoGLM的创新之处在于将Agent行为分为“规划者”和“执行者”两层结构,分别负责决策和执行,这有效解决了“大模型看得懂但点不准”的行业难题。这种技术路径的优势在于兼容性强,不依赖应用厂商授权,但技术复杂度更高,体验的流畅度和稳定性面临更大挑战。
(图为智谱AutoGLM接入手机界面)本质上,豆包是试图改造手机本身,让AI成为操作系统的核心组成部分;而智谱则是为用户提供了一个在云端运作的AI助手,通过远程控制方式操作应用 。这两种技术都旨在让AI像人一样操作手机应用,完成跨应用复杂任务,但它们的实现路径和商业模式却截然不同。
从大众最为关心的隐私保护层面,两种方案呈现出根本性的不同取向。
豆包AI手机由于需要系统级权限,理论上能够访问手机上的所有数据。尽管开发团队强调采用了虚拟屏操作、权限隔离和本地处理等安全措施,并承诺敏感数据不会保存且不会进入模型训练,但这一设计仍然难以完全消除用户的隐私担忧。有评论指出,“代码是干净的,但掌握代码的人呢?”
AutoGLM则通过云端“云手机”方案从架构上尝试规避这一风险。所有操作都在云端虚拟手机的沙箱环境中完成,模型无法接触到用户真实手机上的隐私数据。这种设计虽然降低了隐私风险,但也带来了新的问题,如网络依赖性、操作延迟等体验层面的挑战。
豆包和AutoGLM的不同选择,反映了两家公司在大模型时代的战略定位差异。
豆包背后是字节跳动的“硬件梦”和超级入口野心。虽然字节明确表示无自研手机计划,而是与多家手机厂商洽谈合作 ,但其通过软件定义硬件的方式改造现有入口系统,目标是在AI时代守住超级入口 。这种差异化定位也反映在市场表现上。豆包手机凭借其创新性引发了高度关注,首批3万台备货被一抢而空,闲鱼价格被炒至万元上下。
智谱则定位为AI能力提供者,不与手机厂商直接竞争。除了开源AutoGLM,智谱已与荣耀、三星等头部手机厂商合作,将Agent体验带入其旗舰手机 。而智谱通过开源策略,希望成为AI手机生态的“关键拼图”,而非主导者 。
AI手机到智驾时刻了吗?
随着AI手机概念的持续升温,业界开始出现一个引人深思的比喻:AI Agent正推动手机产业迎来“智驾时刻”,如同自动驾驶技术对汽车行业的改造。
从技术成熟度来看,当前的AI手机确实处于类似“辅助驾驶”的早期阶段。无论是豆包还是AutoGLM,都已能够完成点外卖、订机票等长达数十步的复杂操作,这证明了大模型在理解图形界面和执行复杂任务方面的基本可行性。
然而,就像早期的自动驾驶系统一样,现阶段的AI手机助手仍然需要面对各种边界情况,其可靠性、泛化能力与真正成熟可用的产品还有明显差距。此前,财联社在实测中发现,遇到设计特殊的APP界面时,可能出现操作适配不顺畅的情况。
更为复杂的挑战来自于生态层面的博弈。应用厂商与AI助手之间的冲突,本质上是关于“流量控制权”的重新分配。
周鸿祎此前坦言,这种能绕过App直接完成任务、让服务直达用户的AI助手,会直接冲垮互联网大厂的护城河。很快,用户反馈微信、淘宝等应用出现登录异常或风控提示。迫于压力,豆包团队在12月5日发布公告,对金融支付、刷分激励等敏感场景的AI操作能力进行了规范化限制。
互联网平台面临一个艰难的战略抉择:是继续“修筑高墙”保护自己的领地,还是主动开放API,与AI Agent共建一个新生态?这种博弈不仅发生在技术层面,更涉及到深层的商业利益分配。
从产业发展角度观察,AI手机的兴起正在推动整个产业链的转型升级。芯片、传感器等上游产业链迎来新的发展机遇,AI芯片、算力等各个环节的企业都在寻找与AI结合的新机会。同时,行业竞争焦点正从硬件参数转向生态整合能力。随着高通、联发科等芯片厂商主导端侧大模型适配,终端品牌的差异化空间将更多体现在AI能力的整合与创新上。这种转变预示着手机行业可能迎来新一轮的洗牌。
市场数据也印证了AI手机的发展潜力。据IDC预测,2024年全球生成式AI手机出货量将同比增长363.6%,达到2.342亿部。到2028年,这一数字预计将达到9.12亿部。高增长预期背后是巨大的市场潜力,但也提示着行业尚未形成稳定格局,各种技术路线都有其发展空间。
从用户需求层面分析,智能手机创新疲软已久,中信证券的研报显示,目前全球换机周期延长至51个月。AI Agent被视为下一波换机潮的关键驱动力。然而,用户对AI助手的接受度不仅取决于技术能力,还关乎信任建立。隐私安全、操作可靠性、使用成本等因素都将影响用户的采纳决策。
AI手机的形态很可能不会由单一路径垄断。系统级整合与视觉Agent路线各具优势,或许会在竞争中相互借鉴、融合。正如业界观察所指出的,决定最终格局的,将是哪些技术能够真正落地、跑稳、跑广,赢得用户信任。