近日,关于“地球上最聪明的人工智能”Grok在处理日期比较任务时出现的失误引起了广泛关注。据报道,当被问及“9.11”和“9.9”哪个日期更大时,Grok未能给出正确的答案。这一事件引发了公众对于当前最先进AI系统能力的讨论。对此,特斯拉CEO埃隆·马斯克在社交媒体上发表了自己的看法,他认为虽然Grok在许多领域表现出色,但在处理这种看似简单但实际需要对日期格式有深刻理解的任务时却出现了问题,这表明AI在处理某些特定类型的任务时仍存在局限性。
马斯克还强调,这一事件提醒我们,尽管AI技术取得了巨大进步,但仍需不断改进和优化,以确保其在各种应用场景中都能更加准确可靠地工作。他还呼吁科技界加强对AI基础能力的研究,特别是在处理非结构化数据和复杂逻辑推理方面的能力提升,以应对未来可能出现的各种挑战。
快科技2月19日消息,号称地球上最聪明人工智能”的Grok3也翻车了,答不对9.11和9.9谁大,不少网友也是看笑了。
一些媒体测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:9.11与9.9哪个大?”
遗憾的是,号称目前最聪明的 Grok3,仍然无法正确回答这个问题,被网友戏称为天才不愿意回答简单问题”。
不过对此马斯克并不以为然,其公开回应称,当前的Grok3仅是测试版,这个阶段错误越多越好,而完整版将在未来几个月推出,并邀请用户反馈使用问题。
在媒体看来,尽管在官方PPT中,Grok3在大模型竞技场 Chatbot Arena 中看似遥遥领先”,但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
在发布会上,马斯克宣称Grok3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。