聊聊Gemini 2.0最近3个超级酷的新功能,谷歌有点被低估了
创始人
2025-03-20 20:43:24
0

Gemini 2.0 最近展现出的 3 个超级酷新功能令人惊叹。其一,其语言理解能力大幅提升,能更精准地理解复杂语义和语境,回答问题更加全面和深入。其二,在多模态处理方面表现卓越,不仅能处理文字,还能对图像等多种信息进行高效分析和交互,为用户带来全新体验。其三,生成内容的质量和多样性得到极大提高,无论是创意写作还是知识总结,都能生成高质量且富有个性的内容。谷歌的这些进步往往被低估,其实它在人工智能领域正不断创造惊喜,推动着技术的向前发展。


Google最近的动作真的多。


感觉就是趁着OpenAI存粮打完了,疯狂的撒豆子一样往外面撒更新。


本周,他们又发布了一个关于Gemini的更新。



就是这个东西。



这玩意,他会根据你的过往的所有Google搜索记录,来让模型更懂你,给你更加个性化的搜索的回答。


然后就是上周五,Google又发了Deep Research的更新,现在,底座换成了Gemini 2.0 Flash Thinking,基座比之前的1.5Pro能力还是强太多了。而且,是100w token的上下文。



再就是上周四,几乎全网火爆的Gemini 2.0原生多模态,被玩出了各种花来。



更别提同样在上周开源的Gemma 3,以27B超小尺寸击败了DeepSeek v3、o3-mini等等。



Google这一周的动作,密集的有点离谱了。


但是每一个更新,都是实打实的,都是值得OpenAI开个20分钟直播发布会的玩意。


在体验了几天以后,我想说,Gemini 2.0,感觉还是被低估了,这波更新之后,已经成为我现在用的仅次于ChatGPT第二多的AI Chatbot产品。


因为,体验和生态。


这3个新功能,我们一个一个来说。


第一个就是上周四更新的那个Gemini2.0的用嘴改图。我也写过一篇文章了:《Gemini 2.0的“用嘴改图”终于上线了,这是AI绘图的新范式》,就不过多赘述了,只能说特别强。


网址在此:https://aistudio.google.com/,记得开魔法。


给大家看两个好玩的case吧。


比如用嘴一键去水印。



或者一键换衣服。



甚至X上有一个贼好玩的,直接给自己换了个背景。



“你已经上班迟到了,你甚至还没离开家……你没有借口,于是你拍了一张今天健身的照片,然后打开 Gemini 2.0 flash expremental输入如下指令:展示这位女士在 N 线 14 街站台的一张自拍照,她竖起大拇指点赞,背景中有一群沮丧的 MTA 工作人员正在维修轨道。头顶上方,一个小型 LED 屏幕显示日期:2025 年 3 月 13 日。”


就,看着非常有用。


然后就是更新的第二个功能,Deep Research


我也会用整篇文章,最大的篇幅,来聊这个功能。


我先表明态度,OpenAI的Deep Research和o1 pro这两个功能,是我至今还愿意为它付费200刀/月如此高昂价格的原因。


当你用过Deep Research后,我相信,你一定会被其震撼。


我自己是金融行业出来的,也跟N多金融领域的行业研究员还有科研的朋友交流过,大家基本的反馈都是作为老手,自己也起码要干10个小时以上才能到达Deep Research生产的研究报告的质量。


但是很多人可能不知道,Deep Research这个功能,其实是Google去年12月份,第一个发的。



但是吧,当时的底座,用的是Gemini 1.5 pro,那个模型,真的太烂了,效果完全不够看。


随后才是2月份,OpenAI基于o3微调了一个模型,抄了一个他们的Deep Research,把效果打到了新的高度,也让Deep Research这玩意第一次出了圈。


后面就是Preplyxity和Grok3,这两个虽然也推出了类似的功能,但是名字其实都叫Deep Search,纯粹的AI搜索,跟Deep Research几乎没啥关系。


Deep Research其实本质上是一个Agent产品,用户提出问题后,会跟Agent一样,先拆解目标进行规划,最后进行搜索、合成,产出一篇报告。


所以你能看到,最核心的一步其实是第一步,先拆解目标进行规划,这个东西非常的考验模型的规划能力。


而规划能力,就是逻辑能力的反应,所以你也可以说,这就是在深度考验,模型的智能水平。


人OpenAI,用的是最牛逼最先进的o3微调,你Google,居然在2024年12月份,用的还是跟Sora同期的Gemini 1.5 pro,我都不知道用啥理由去理解Google,只能说都过去8个月了,他们还是忘不了当年被OpenAI狙击的痛,所以至今还对Gmini 1.5 pro耿耿于怀念念不忘……


但是这一次,Google终于反应过来了,把基座模型换成了Gemini 2.0 Flash Thinking Experimental,他们目前最新的推理模型。


虽然我觉得他们应该用2.0 Pro Thinking甚至是2.5才对……


你现在可以在Gemini的官网用到:


https://gemini.google.com/


左上角切换到Deep Research模型或者下面对话框那打开Deep Research按钮,都行。



现在有个比较牛逼的点是,它免费。


OpenAI的Deep Research贵到离谱,Plus会员(20刀/月)每个月只能用10次,产出10份报告,即使是Pro会员(200刀/月),每个月也只有150次。没氪金的用户,更是连体验资格都没有。


而这次,Google至少做了一个非常良心的事,即使你是免费用户,也可以体验到真正的Deep Research了,而不是那种垃圾Deep Search。


每个免费用户,每个月可以用X次,具体次数我把他们网站翻了个遍,也没看到哪里写清楚了。


只有这么一句。



反正可以白嫖,不行就换号大法启动嘛,多大点事。


也给大家看一下效果。


比如我最近一直在研究电影工业,也有部分工作是做这一块,那么有一家公司是我一直想研究的,就是漫威。


所以我就把这段Prompt扔了进去。


“全面、系统地分析漫威(Marvel)在电影工业化进程中的布局与经验,涵盖历史背景、核心战略、制片体系、商业模式、营销策略、技术应用,以及它如何与迪士尼等合作方共同塑造全球化、跨媒体的超级英雄宇宙。通过多角度调研与论证,提炼漫威在现代电影工业发展的成功要素,并思考未来趋势与经验教训。”



跟OpenAI的Deep Research的不同是,他会给你把框架和节奏拆完,让你清晰地看到后面它会执行哪些步骤,你点击开始研究之后,他才会去整个互联网上去搜索。而OpenAI的Deep Research,是会在搜索的过程中,动态调整目标的。


当然你也可以修改方案,点击以后用嘴改就行了。


而OpenAI的Deep Research是会给你补全范围,提问题,来激发你没考虑到的部分。



在起手式上,OpenAI还是要强于Google的。


随后就是搜索阶段。



Gemini会默认展示思维过程,而且会用巨大的UI画幅去重点展示,搜了超级多的网站,甚至还有youtube。


在思考了10分钟之后,一份报告,就会放在你的面前。



非常坦诚地讲,这份电影工业化报告的质量,是没有OpenAI生产的详细和深度的。


搜索的很准,它搜了将近220个网站,我点进去看了一半,确实都很相关。但是最后的报告整合上,拉了胯了。


能解答我的一些疑惑,但是并没有到那种直出即可用的地步。


而OpenAI的Deep Research,是可以达到这个程度的。


可能还是受限于底层模型的原因,但凡我觉得Google换成Gemini 2.0 Pro Thinking,效果都可能会大幅提升,不过那样的话,可能又没法免费了……


不过我一位做科研的朋友告诉我,他觉得,在科研领域上,Google比OpenAI好用,得益于Google 30年的搜索积累,和在google学术上的布局,搜索的精准度上会比OpenAI强非常多,最后得到的报告,也比OpenAI要好。


但是科研这块我不懂,可能需要大家再去多测试一下,可以在评论区反馈。


总结就是,Gemini Deep Research模型能力拉了点,但是搜索能力很强,报告整合能力拉跨;OpenAI Deep Research搜索的精准度中规中矩,但是基座模型太强,整合能力无敌。


我这里也非常客观地讲一句我的理解。


Deep Research这种东西,会极高极快速地拉高你获取高信息密度知识的上限,会大幅改变教育、研究的工作体系。


过往,无论是因为囊中羞涩,还是因为别的,没有用过Deep Research,那我非常的真诚地建议你,Gemini的这个Deep Research,趁着目前还免费。


薅秃它。真的。


无论是做行业报告、还是做书籍总结、还是科学研究等等等等。


先用起来。真的。你会感受到另一片天地。


最后,用简短的篇幅,聊聊更新的第三个功能,Personalization



当你第一次点进去的时候,会提示你,是否要跟你自己的Google账号相关联。



关联了以后,Gemini就可以根据你过往的搜索记录,来给你针对性的、个性化的回答了。


用Google搜索的越多,他就会越懂你,所以,你懂我什么意思吧……



但是我发现了一个BUG,就是当我问题中有字母的时候,它的回答就会变成英文,这个还让人挺懊恼的。


但是,从这点依然能看出,Google在做产品上,终于开始把自己过往30年的积累,逐渐地往Gemini中融入了。


这种巨头的生态积累,还是不容小觑的。


这一周密集的更新,个顶个都是很棒的功能,更别提Google手上还有个AI视频的王炸,Veo2。


Google,感觉还是有点被低估了。


AI还远未触及顶点。


人类也远未见识到它的极限。


本文来自微信公众号:数字生命卡兹克,作者:数字生命卡兹克

相关内容

热门资讯

掌上白银APP上炒白银贵金属亏...   掌上白银交易软件上做白银订购现货靠谱吗?掌上白银APP背后的上海华通白银国际交易中心有限公司有这...
青岛港转口贸易保税区报关操作全... 青岛港转口贸易 转口贸易报关公司 转口保税区报关操作 转口贸易又称中转贸易(intermediary...
5月9日,阿里巴巴集团(099... 5月9日,阿里巴巴集团(09988.HK)CEO吴泳铭在内网论坛发帖,呼吁阿里人回归初心,重新创业。...
首款鸿蒙电脑亮相,相关概念股集... 红星资本局5月8日消息,今日,市场早盘低开高走,创业板指领涨。截至上午收盘,沪指涨0.38%,深成指...
康平科技:5月8日融资买入73... 证券之星消息,5月8日,康平科技(300907)融资买入732.94万元,融资偿还915.89万元,...
原创 让... 在如今分析机构需要迎合各个企业要求的时代,分析机构也纷纷拿出有利于各个企业的数据,日前海外分析机构就...
港股通50ETF:5月8日融资... 证券之星消息,5月8日,港股通50ETF(513550)融资买入373.5万元,融资偿还552.46...
知名连锁超市将退市!董事长提前... 营收过百亿元的近30年知名老牌连锁超市巨头即将告别A股。 5月7日晚,*ST人乐(以下简称人人乐)发...
歼-10C,初试啼声 歼 -10C,宛如空中的钢铁雄鹰,初试啼声便展现出非凡的实力。它那流线型的机身,在阳光下闪烁着锐利的...
A500指数:5月8日融资买入... 证券之星消息,5月8日,A500指数(159362)融资买入173.56万元,融资偿还178.44万...
存量公积金贷款利率,怎么调?何... 据券商中国记者不完全统计,目前已经有北京、上海、深圳、广州、长沙、西安、宁波、南京、昆明、哈尔滨、银...
中国首家“A+H”上市的光伏电... 钧达股份原是跨界光伏企业,去年位居全球光伏电池出货量第三。 图片来源:视觉中国 三次递表后,光伏电...
阿里吴泳铭再提创业,将采用“饱... 阿里吴泳铭再度开启创业之旅,其战略举措引人瞩目。他明确提出将采用“饱和式投入”打法,这彰显出他在创业...
外资LP正视“东升西落” 在当今时代,外资 LP 正逐渐正视“东升西落”的趋势。随着新兴市场的崛起和中国等国家的快速发展,外资...
真兰仪表:5月8日融资买入16... 证券之星消息,5月8日,真兰仪表(301303)融资买入168.68万元,融资偿还90.3万元,融资...
巨人史玉柱被兄弟们“玩坏了” 出品 | 凤凰网风财讯fengcaixun 作者 | 王婷婷W=T=T 是兄弟就砍我一刀。 五一假期...
银行ETF优选(517900)... 5月9日,银行再度活跃。截至9时52分,银行ETF优选(517900)放量涨1.05%,盘中冲击四连...
比5G快10倍!你的手机有5G... 最近,不少人发现自己的手机上出现5G-A信号。和5G相比,5G-A是什么,会给我们的生活带来什么样的...
多地加码住房公积金政策支持力度... 根据中国人民银行的公告,从今天起,个人住房公积金贷款利率正式下调0.25个百分点,此外,公开市场7天...