AI or 耳机,只能是一道单选题么?
创始人
2025-03-12 20:41:05
0

在如今的科技时代,AI 和耳机似乎成为了两个独立的存在,人们往往认为它们是不同领域的产物,只能在各自的范畴内发挥作用。然而,真的只能将它们视为单选题吗?其实不然,AI 可以为耳机带来更多的智能化体验,比如通过语音控制实现便捷操作,根据用户的喜好和习惯调整音效等。而耳机则为 AI 提供了更直接的交互入口,让用户在使用 AI 服务时更加便捷和沉浸式。它们并非相互排斥,而是可以相互融合、相互促进,共同为人们的生活带来更多的便利和乐趣。所以,AI 或耳机,不应只是一道单选题,而可以是携手共进的伙伴。


本文来自微信公众号:果壳 (ID:Guokr42),作者:糕级冻雾,编辑:沈知涵


前些天,在公司跟同事一起看小米发布会,他们一个个都盯着超跑跃跃欲试,而我(因为经济实力)只能点头微笑,仿佛镇定地表达对新耳机更感兴趣(扶额苦笑.jpg)……


是的,又一款冠以AI头衔的耳机。


官方自夸小米Buds 5 Pro为“4000元以内音质最好TWS耳机”,拥有无损音质、深度降噪,以及一些AI功能。


小米Buds5 Pro Wi-Fi版能达到2.1甚至4.2 Mbps的传输速率;


55dB的降噪深度,AirPods Pro 2官方未公布具体数值,发烧友测试在40-44dB左右,Bose“王牌产品”QC Ultra Earbuds最深度也是46dB左右;


频响范围在15-50kHz,然而正常人耳能听见的频响范围是20-20kHz。


Buds5 Pro Wi-Fi版本搭载了骁龙S7+音频平台,是目前唯一支持Wi-Fi功能的蓝牙耳机芯片,但主要还是服务音频传输速率。


耳机支持高通aptX Lossless编码,该协议支持传输16bit/44.1kHz音频,这也是CD唱片和主流音乐平台里无损音乐(绝大多数)的规格。


aptX Lossless官方最大码率为1200 kbps,而Wi-Fi版最高达到4200 kbps,理论上也为后续更新的编码,提供了更大的码率空间。


这似乎跨过了“AI耳机得先是一个好耳机”的门槛?


暂时,还没有一个能打的


其实,TWS耳机自开始就少不了AI算法——处理音质、优化拾音、环境分析、智能降噪等等。


但今天我们讨论的AI,意味着让耳机去做一些更时髦的任务:给打工人翻译、整理速记、唤醒智能助手。反而TWS原本的“三要素”——佩戴、音质、降噪成为了AI耳机的短板。大众默认和市场成熟的产品形态和标准,却成为了让产品AI化的桎梏。


比如字节Ola Friend、Cleer ARC3、小度G108等选择了耳挂或者耳夹式。虽然相比入耳式更能成为一个“随身AI”,少了很多压迫和异物感,能长时间佩戴,但是被动降噪几乎没有,音质也会因为开放式设计,低频泄漏严重。


也有AI耳机选择了入耳式的外观形态。比如iKKO ActiveBuds AI、科大讯飞Nano+、飞利浦8号。降噪上用了主被动降噪结合,有几款官方标注的极限降噪深度能达到45db,效果还不错——但音质又拿不出手了。


iKKO ActiveBuds AI售价1899,不便宜了,蓝牙解码协议只支持到AAC、SBC,不支持音质更好的LDAC、aptX。在定位上,显然不是以音质为导向的耳机。对比市面上很多三四百元左右价位的“普通”TWS耳机,比如红米Buds6Pro、飞傲FW3、Oppo EncoAir4、1MORE S20等都没有在协议上做妥协。


很多AI耳机的宣传噱头,也更多在智能、生产力、陪伴等AI上,而可以淡化了关于音质、降噪、佩戴、续航、多协议等TWS耳机的基本品质——在前瞻性和实用性之间,还没有达到一种良好平衡。


不能只做手机的附庸啊!


那么耳机究竟把AI做得怎么样?


纵观大多数产品介绍,AI耳机如今也就“三大宝”:翻译、速记、唤醒智能助手


你不免会问,这些功能哪个智能手机做不到?为什么还要额外买个AI耳机呢?这是个对于AI硬件来说一个老生常谈,又从未被很好解答的问题。


耳机在处理语音需求优势巨大,似乎又天然为“语言大模型”而生——佩戴贴近耳朵和嘴巴,语音采集的信号更清晰,说话起止更易判别,麦克风收声时最大避免了环境噪音和语音衰减。


利用这些优势,是可以打磨出在某些垂直场景中比手机更加细致的用户体验的


比如很多耳机配合连接手机做到,一人戴耳机,一人持手机,同步互译。


比如耳机像一款独立的录音笔一样,独立录制两小时会议。然后同步到手机里,转文字,翻译,会议纪要一下都出来了。


比如有的耳机号称支持翻译62种语言,还有能识别方言,维吾尔语、藏语之类的。


再比如,唤醒AI助手,随时聊天、练口语,景区讲解。更“赛博”一点的话,带着耳机和AI聊骚恋爱,可比举着个手机自然多了。


那么,第二个问题来了。Ola Friend叫出来基于豆包大模型的豆包,小米Buds 5 Pro叫出来接入DeepSeek的超级小爱,跟我通过AirPods唤醒Siri有啥差别?


AirPods是在2017年推向市场,大多iPhone用户早就无比熟悉问Siri天气如何、设置闹铃、甚至让它搜索一堆“锅包肉菜谱”的网页给你......


所以目前的AI耳机本质上还是一个“唤醒器”,是一个接收app音频输出的载体,与AI助手对话不是独立在耳机内完成,而是经过“耳机-手机App-云端-手机App-耳机”的路径。


其智能体现完全依赖模型能力,某款AI耳机就曾在直播活动中因为识别不出主播一句“I like百年孤独”中英文夹杂而卡住。


真·AI耳机,可不是要把手机塞进耳朵


耳机目前还无法成为具备独立联网、独立运算能力的设备,因为人耳体积是限制耳机内置AI算力和性能的天花板,其内置的计算能力承载不了哪怕是最小的端测模型。


体积上,目前最边缘的AI芯片,比如有13 TOPS算力的树莓派AI模块,物理尺寸都有22*42 mm,比单只AirPods Pro还宽还长,最少1-2W功耗。


目前TWS耳机功耗都控制在5-150mW(全功能开启后)范围内,1W功耗别说续航和技术上实现不了,塞进耳朵内无法有效散热,人耳也受不了,这下真“发烧”了(小伙儿~听啥见不得人的呢?咋耳根台子都红了)


所以现阶段,AI耳机必须需要依靠外部算力,抛开手机的可能性也许是“复古”:比如颈挂式,比如配一个越来越大的耳机盒,用来扩容算力。


比如WISHEE Ai,iKKO Active Buds,把耳机盒做成一个带sim卡槽,能打电话,能上网,带屏幕,能下app的智能终端。


可想而知,将传感器,存储和计算单元,数据传输和网络连接等硬件模组放到一个如此“极致”的体积下,实际上算力应该非常有限,AI助手估计经常卡顿,聊着聊着,AI就消失了。


那么更加丝滑的语音只能交互应该什么样?


你们还记不记得,之前有一个引起了很多讨论的硬件,叫Friend AI——大体上是一个项链的形态,内置了麦克风,长续航电池,收集用户周围的声音信息,并通过连接手机与用户对话。


Friend AI的宣传片里,一名女生边吃饭边在手机上看剧,Emily(女生给其Friend AI起的名字)听到电视里的声音,给女生手机发消息说,“这部剧被低估了,太精彩了。”女生不小心把食物掉到其上面,又收到了一句,“味道还不错。”


这是很多AI硬件找到的成立理由,手机积累了大量数据但仍有限,能收集到比手机更多数据、更多维度数据,才能打造随身的“Personal AI”。


耳机如何实现这种个性化和智能化?


就像智能手表/手环,耳机也可以依靠捕捉到的佩戴者体征信息和环境声音后,提供“听力健康”类似的功能。


比如AI分析我的语气,检测我的情绪,然后自动推荐适合的音乐,白噪音来缓解压力,提升注意力,改善我当下的情绪。


耳机是语音交互最为直接的入口。对人来说,用语音交互非常自然,但对机器处理任务来说,并不高效


区别于我们早已习惯的屏幕交互,语音对话是线性的(想想你做ppt汇报,和只有语音的电话会汇报,这两个场景的区别)。耳机应该成为更多环节复杂,但步骤明确,容错率高的语音场景的入口,一个随叫随到,交互摩擦尽可能少的AI助理。


《Her》


比如当你再问耳机里的智能助手“锅包肉咋做”,它会考虑到你刚健完身,推荐一个低卡版给你,甚至从电商平台上比好了价,整理好了购物清单给你;


如果能与其他随身设备配合,比如根据手表在记录的运动类型,自动在跑步时放快歌,在游泳时播播客;


也会在你设置闹铃时,提醒你当天有哪些安排。


这也是大家仍执着于要AI耳机(或其他AI硬件)的原因——随身的AI不应该被困在某个app当中,而即将到来的通用agent,也许并不再会是软件应用,而恰恰是一款硬件,比如耳机。

相关内容

热门资讯

美国“鸡肉税”的启示 经济学家认为,“鸡肉税”实则让美国汽车产业陷入困境,因为它们同全球市场隔绝了数十年。 据《华尔街日报...
三连降!油价今晚将迎年内最大降... 今天(3月19日)24时,新一轮油价要调整啦,油价将迎来“三连跌”! 3月19日,国家发展改革委发布...
【研报掘金】机构:低空经济涉及... 机构指出,低空经济涉及产业链较长,产业综合带动能力较强,低空经济是具有较强发展潜力的新兴产业。 核心...
拳击纳入2028洛杉矶奥运会正... 当地时间3月20日,正在希腊举行的国际奥委会第144次全会决定,将拳击纳入2028洛杉矶奥运会正式比...
1分钟搞懂说美国滞胀是咋回事 美国滞胀指的是经济停滞与通货膨胀同时存在的现象。在滞胀时期,美国经济增长缓慢甚至停滞不前,企业生产积...
黄仁勋,拐点出现 黄仁勋,这位在科技领域极具影响力的人物,仿佛是科技发展中的一道耀眼光芒。他凭借着卓越的创新能力和敏锐...
15人团队90天狂揽1.2亿,... 15 人团队在 90 天内狂揽 1.2 亿,这家欧洲 AI 公司究竟凭何能碾压 ChatGPT 呢?...
香港航空起火备降,之后 香港航空一架航班突然起火并被迫备降,这一突发状况瞬间引发了广泛关注。随后,机场应急救援团队迅速行动,...
【助企】左旗市场监管局组织举办... (赤峰工商质监) 为进一步促进知识产权与金融资源相结合,助力企业解决融资难题,3月18日,左旗市场监...
重庆大足工业园区2.62亿元短... 公司简讯 3月20日,重庆大足工业园区建设发展有限公司发布2024年度第一期短期融资券2025年兑...
广东VS江苏,谁才是未来的“经... 广东和江苏都是中国经济的重要支柱,在未来谁能成为“经济第一省”颇具争议。广东凭借庞大的经济规模和活跃...
5位高校毕业生谈求职:新兴领域... 五位高校毕业生在求职道路上各有见解。他们普遍认为新兴领域虽前景广阔,但门槛较高,难以轻易涉足。于是,...
喜报!新兴铸管股份有限公司通过... 根据省工信厅关于开展数字化供应链贯标试点工作的要求,新兴铸管作为河北省15家首批工业企业贯标试点单位...
国债期货市场全线反弹,30年期... 财联社3月20日讯(编辑 杨斌)经过一个多月的连续下跌,今日国债期货市场全线反弹,30年国债主力合约...
“医美茅”爱美客业绩失速,营收... 图片来源:图虫创意 “医美茅”失速。3月19日,爱美客(300896.SZ)发布2024年度报告。财...
叶国富动刀,永辉大变天 “叶国富动刀,永辉大变天”,这简洁的话语背后蕴含着深刻的变革。叶国富以其敏锐的商业眼光和果敢的行动,...
豆瓣9.4,又一部韩剧火了 豆瓣 9.4,又一部韩剧火了!这部韩剧宛如一颗璀璨星辰,在韩剧的浩瀚星空中熠熠生辉。它以细腻的情感描...
聊聊Gemini 2.0最近3... Gemini 2.0 最近展现出的 3 个超级酷新功能令人惊叹。其一,其语言理解能力大幅提升,能更精...
佛朗斯股份(2499.HK)年... 今年3月,政府工作报告中的内容成为市场关注的焦点。其中,报告提到要“加快建设统一开放的交通运输市场,...
特朗普最新发声!美国基金经理大... 在美联储宣布维持利率不变后,美国总统特朗普发声敦促美联储降息。 但是,面对4月2日即将到来的美国对等...