本文来自微信公众号:极客公园 (ID:geekpark),作者:张勇毅,编辑:郑玄,原文标题:《时空壶发布 W4:用「硬核」技术,打赢一场 AI 翻译的「标准」之战》
科幻小说中的「巴别鱼」一直是人类对跨语言沟通的终极想象,一个能塞入耳中、即时消弭语言鸿沟的生命体。而在现实世界,将这一梦想变为现实的漫长征途,早在2017年便由一家名为时空壶的公司开启。
那一年,当整个行业还未将目光聚焦于此时,时空壶就发布了全球第一款翻译耳机,率先向这个看似遥不可及的目标发起了冲击。他们的核心理念从始至终都无比清晰:要让机器翻译普及,关键在于打破专业同传的交互壁垒,让技术服务于人类最自然、最无感的交流方式。
这种开创性的思路,不仅定义了时空壶此后多年的产品路径,也让这家公司在全球市场悄然占据了「隐形冠军」的位置。自2019年第一代产品在海外发售至今,时空壶已在这条专用赛道上深耕了超过六年。从最初的拓荒者变成如今定义产品功能与形态的独角兽。
在2025年9月,德国柏林的IFA展会期间,时空壶携其最新旗舰W4 AI同传翻译耳机登场亮相,再次用一种极致的务实主义,回应了那个最初的梦想——「AI翻译,首先得让对方听清你说什么」。同时也借此直指行业最核心,也最容易被忽视的痛点:在真实世界的嘈杂与混乱中,如何保证输入信号的纯净无暇。
01、硬件优先
时空壶的创始人兼CEO田力在介绍W4的过程中,并未将重点放在描绘遥远的AI未来,而是选择直面那个最基础却也最致命的行业难题:噪音干扰下的语音识别。面对展会现场鼎沸的人声与背景音乐,大多数音频设备束手无策,而W4却能实现惊人的清晰度。
其秘密武器,并非复杂的软件算法,而是一项看似「返璞归真」的硬件创新——一套被命名为「骨声纹传感器捕捉技术」的多麦克风融合系统。
这套系统的核心,是一颗定制的骨传导传感器,它不依赖空气作为介质,而是通过捕捉用户说话时头骨的振动来拾取声音。这意味着,无论周围环境多么嘈杂,无论是地铁的轰鸣、餐厅的喧嚣,还是展会的吵嚷,这些通过空气传播的噪声都无法干扰到信号的采集。
与此同时,W4的每只耳机还配备了两颗传统的气导麦克风,用于收集声音中的环境信息和部分细节。最终,通过时空壶自研的融合算法,将来自骨骼振动和空气传导的两种信号进行整合,精准地提取出佩戴者最纯粹的人声,从物理源头就「保护」了一个干净的音频信号。
这种理念与主流的软件降噪有着本质区别。传统的降噪技术是一种「减法」,它首先录制一个混杂了人声和噪音的音频,再试图通过算法将噪音「减去」,这个过程不可避免地会损伤人声的细节,甚至产生失真。
而时空壶的方案则更像是一种「加法」或「保护」,它从一开始就获得了一个几乎不受污染的人声音源,保证了后续翻译环节的输入质量。田力对此解释道:「我们很多的东西其实是在硬件和一些算法上,而它不是一个大家意义上的这种AI的纯粹的云端的翻译。真正决定用户那个交互体验的东西,不光是翻译引擎那一刻,而是前面的很多环节。」
这款W4耳机在外观设计上也贯彻了这种务实的哲学。它看上去与普通的TWS耳机差别不大,没有夸张的科技元素。其设计语言低调而优雅,充电盒手感温润,耳机本体则通过人体工学设计,确保了长时间佩戴的舒适性。将所有核心的智能模块、电池都收纳于小巧的机身之中,体现了对用户日常使用体验的深刻理解。
02、「隐形冠军」的专注与耐心
推出这款产品的时空壶,早已不是一家初出茅庐的创业公司。但他们的成长路径,在中国硬件公司中显得颇为「非典型」。
早在众多企业将「出海」作为战略口号之前,时空壶就已经在海外市场默默耕耘。他们选择先在美国市场发力,初期海外与国内的销量占比一度达到悬殊的9:1。这种策略让他们得以在最成熟、竞争最激烈的市场中打磨产品,并直接服务于那些对跨语言沟通有着最迫切需求的用户——游客、商务人士以及跨国生活的家庭。
时空壶将自己的核心用户定义为「专业型消费者Prosumer」,田力认为这与大疆无人机的早期用户画像颇为相似。他们购买产品并非为了尝鲜,而是为了解决一个专业且刚性的需求。如今,随着全球用户累计突破100万,国内市场的认知度也逐渐打开,时空壶的销售比例也调整至更为均衡的「七三开」。
这种稳健风格的背后,是田力对公司经营原则的坚持。他本人并非典型的硅谷式创业者,公司不依赖一轮又一轮的融资维持生命线,团队规模也保持着克制,从2023年的几十人稳步增长至如今的一百多人。
「我们早已实现净利润为正」田力在专访中坦言,「我们不是那种等着救命钱来干活的公司」因此他们更愿意将资源和精力投入到产品本身的迭代与打磨中,保持着一种在当下创投环境中略显「缓慢」的节奏。
03、BabelOS:打造全栈AI引擎
随着用户量突破百万,在真实嘈杂环境中进行清晰、流畅跨语言对话的需求已清晰可见,W4项目应运而生。除了在收音清晰度上的硬件突破,时空壶更是在系统和算法层面构筑了坚实的核心壁垒。这套自研的系统被命名为「巴别系统」(Babel OS),它集成了时空壶多年来在翻译领域的经验与技术沉淀。
Babel OS的第一个支柱,是解决同传中「速度」与「准确」矛盾的关键技术——「AI语义切分」。田力解释道,同传领域有一个经典难题:传统的机器翻译同样需要等待一个完整的句子或语义单元,延迟因此产生。而时空壶的技术,能通过大模型实时分析语义,判断一个意群是否完整,从而做出预判性的翻译,先把主干意思传递出去,后续再快速修正。这正是用技术去无限逼近一个优秀同传译员的判断力。
田力补充道,「行业标准里,真人同传译员的准确率也并非100%,大约是80%多,因为他们追求的是快和流畅。我们做的,就是用技术实现这种平衡。」
Babel OS的第二个支柱,则是利用大语言模型(LLM)实现「语境感知翻译」。这是解决翻译准确性,尤其是处理多义词和近音词的关键。例如,在英语中,「to,too,two」或「there,their,they're」等词语,如果脱离上下文,机器很难准确判断。时空壶通过其自研的「TurboFast AI翻译引擎」和LLM的强大能力,让系统能够理解对话的整体语境,从而在这些细微之处做出精准的判断,极大地提升了翻译的自然度和准确性。
「我们最开始也用谷歌、微软的引擎,但很快发现,要达到理想的用户体验,必须亲自动手去改造模型,」田力说。如今,无论是谷歌还是三星,都选择将翻译作为其旗舰耳机的一项附加功能。而时空壶的全栈自研模式,则展现了截然不同的决心。田力指出,大厂的翻译引擎在很多小语种上表现不佳,例如阿拉伯语、越南语等,存在大量未被解决的「角落案例」。
对此,时空壶的结论是:只有自研才能实现端云一体的深度优化,例如通过前端对声音进行特殊编解码,再喂给云端专门训练过的模型,从而极大提升速度和鲁棒性。这种覆盖硬件、固件、系统到AI模型的全栈能力,让时空壶更像一家专注的通信设备公司,而非纯粹的AI软件公司。
04、定义同传翻译标准
在时空壶内部,他们用一个L1到L5的框架来定义「好的跨语言交流」,本次随着W4发布,这一类似自动驾驶行业标准的「同传翻译行业标准」也一并向外界揭晓。
L1,是电子词典级别的「词对词」翻译。
L2,是谷歌翻译App式的「句对句」翻译,交互是断续的。
田力认为,市面上大部分产品,包括巨头们推出的功能,其交互方式——例如两人轮流对着手机讲话——决定了体验只做到了L2.5,这并非人类自然的交流方式。
而时空壶努力做到的,是L3——自由对话。为了实现这一目标,W4提供了多种精心设计的翻译模式。核心的「双语对话」模式,允许两个人各佩戴一只耳机,进行近乎实时的、面对面的自然交流,翻译结果会直接在各自的耳机中播放。此外,还有适用于听讲座的「听译模式」,以及为问路等快速场景设计的「问答模式」。这些模式覆盖了用户在旅途和商务中最常见的使用场景,真正让「边走边聊」的跨语言沟通成为可能。
但L3也并非他们设想中、AI同传耳机的终点。「我们的目标是L4,达到高级同传译员的水平,」田力这样介绍时空壶对同传翻译耳机场景的规划。
在采访中,田力还与作者分享了一个现实中土耳其高级译员的故事:在一次同传中,官员即兴讲了个本土笑话,译员知道直译国外听众无法理解,便在电光火石间对着麦克风说:「现在,领导讲了一个笑话,请大家笑一下。」全场爆笑,效果绝佳。「你看,这已经超越了语言本身,是对意图、情绪和氛围的理解。这是AI目前最难做到的,需要多模态的感知,也是我们努力的方向。」
05、做同传耳机赛道里的「大疆」
正是基于这种对专业体验的极致追求,时空壶选择了耳机这一产品形态,并为其设定了349美元的专业级定价。面对外界关于「凭什么卖这么贵」的质疑,田力显得很自信,在对话中,田力将时空壶的产品逻辑比作大疆的无人机,而非智能音箱。
「你买大疆的无人机,不是因为它也能当风扇,而是因为它在航拍这个专业领域做到了极致。我们的用户选择W4,是因为它在跨语言沟通这个特定场景下,提供了远超通用设备的卓越体验。」
这或许也是时空壶为何并未急于像其他AI硬件一样,采用订阅制收费的原因。田力认为,在行业整体成熟度仅在「及格线」徘徊时,首要任务是把基础体验从70分做到100分,而不是过早推出一个100分产品才需要的高级商业模式。
在谈及与科技巨头的竞争时,田力认为小公司永远有机会。「谷歌做硬件,恕我直言,一直有种『玩票性质』,」他回忆,「我2019年在湾区见过他们项目的人,他们觉得这个功能很酷,就做出来了,但用户用得好不好,不是最在意的。所以谷歌硬件总是『起个大早,赶个晚集』。」对巨头来说,翻译只是其庞大生态中的一项附加功能;而对于时空壶,「这是我们的『命根子』。小公司跟大公司比,本质上比的还是认真和专注。」
为了更加直观地展示机器翻译的真实水平,时空壶此前曾使用自家产品,参与过一场「人机大战」,让其产品与真人同传译员同台竞技。这不仅是一次营销,更是向顶级译员学习的方式。「通过这种极限对比,我们能更清楚地看到自己的差距和努力的方向,」田力说。
关于AI硬件乃至时空壶本身的未来,田力聊到驱动着他和团队前行的朴素愿景。他相信,人类作为社会性动物,天生渴望交流与连接,而语言的壁垒所带来的,是真实存在的不安与孤立。
而在他看来,时空壶的使命,是要打造一把钥匙,去开启那扇因语言而紧锁的沟通之门,赋予人们跨越鸿沟的勇气——那种可以跟任何人交流,去连接的从容。这才是他们最大的成就感来源。
「人类是社会性动物,天生渴望交流和连接,」在采访的最后,田力回归到了创业的初心,「当你去到一个陌生的国家,语言不通时,那种不安全感是真实存在的。我们希望通过产品,赋予人们勇气,让他们可以很爽地去跟任何人交流,去连接,去成为朋友」
因此从某种程度上,W4不仅仅是一款追逐AI浪潮的硬件。更是时空壶对这种愿景的载体,是这家公司用近十年的专注与积累,为消除人类的隔阂所献上的最新答案。
「消除语言障碍,可能不是一百年内能完成的事,」田力坦言,「但我们正走在这条路上。」