AI文生图最大问题不存在了,最新Gemini2.0指哪改哪
创始人
2025-03-14 15:21:36
0

AI 文生图曾存在一些问题,但如今这一状况已得到改善。最新的 Gemini2.0 展现出了强大的能力,它能够精准地识别用户的需求,实现指哪改哪的高效操作。无论是对图像的细节调整,还是整体风格的变换,Gemini2.0 都能迅速而准确地做出响应。用户只需明确指出需要修改的部位或想要达到的效果,Gemini2.0 便会以其卓越的技术和智能,将图像完美地修改至符合要求的状态,为用户带来前所未有的体验。


本文来自微信公众号:APPSO (ID:appsolution),作者:appso,原文标题:《AI文生图最大问题不存在了,最新Gemini 2.0指哪改哪,网友已经玩坏了 | 附指南》,题图来自:AI生成


最近的热点实在太多了,当Gemini的文生图模型更新出来时,原以为只是平平无奇的小更新——万万没想到,属实是个大招。



在此之前,要么用Stable Diffusion,要么走回Photoshop老路,反正还没有哪个模型,可以用如此简单的对话,就完成如此精细的修改。


Gemini率先突破可控性这件事并不令人意外,二月时,Google就推出了最新一代的图像生成模型Imagen 3,当时就强化了提示词的跟随功能。



当时还只面对付费用户,现在在AI Studio中已经可以看到更完整丰富的呈现。可以说,在目前文生图的可控性程度,以及相对应的用户体验上,Gemini的确做到了无人能出其右。


下面我们会具体解释为什么这样下结论。同时在测试过程中,我们也发现了一些使用技巧,一并奉上。


可控性不好?不存在了


诚实地说,单纯讲生成还是有一点不稳定,但是Gemini 2.0 Flash Experimental展示出了堪称逆天的修改可控性。


下面这组花田图里,使用了Imagen 3的官方实例:Impressionistic landscape painting of a sunset over a field of sunflowers,vibrant colors,thick brushstrokes,inspired by Monet。



中间的修改提示词,是为了把天空换成蓝绿色:turn the clouds at the back of the picture in to blue-greenish color



注意看中间圈出来的地方,花田和天空过渡处的油彩,基本没有变化——模型充分理解这个修改提示词里“局部改色”的意图,只对天空局部改动,其它任何地方都保持了不变。


接下来这组城市街景的例子更明显,生成提示词:generate a Tokyo street crossroad,cars passing the traffic light and people walking around



细部有些地方还是不太能看的,生成这一步的不稳定性还是没有被完全驯服。真正有惊人改变的,是细部的指令跟随。



“我想要变成夜景”“街上应该有灯光”,提示词可以非常直接就完成修改。来感受一下四轮对话之后,形成的整体变化对比。



四张图渐次展示了城市从白天、黄昏、傍晚、再到夜晚的样子。而在四轮对话中,说改车就改车,不说改动行人就保持原样——不可控性不存在了!


Tip:生成+修改最稳定


局部修改的功能,如果是在现有图片上改动,效果没那么好,比较粗暴。下面是两张现图改夜景的例子。




最稳定的组合是从生成到修改,一条龙完成,在后续的修改里可控性就更高。


整体变化,一句话完成


除了局部改动,还可以改动视角,这也是非常实用的功能。对于短片的故事板、产品多视角展示,都相当有帮助。


产品图的修改真正做到了随心所欲。



要描述的是图片最终的样子,而不是修改图片的过程


Gemini理解模糊指令是没问题的,只是需要注意一下模糊的“方式”。


比如想变换镜头视角,要描述的应该是最后形成的结果,如“从左边拍摄的样子”,而不是“镜头移动到左边”。这毕竟还是一个静态文生图,并不能呈现镜头移动。


换句话说,指令越简单直给反而越好。


一进入Stduio还有一个官方示例是做一张生日卡片,可以直接尝试。不过,想要更高的可控性,最好复制粘贴了之后,自己新建一个对话。



接下来我修改了里面的元素,花朵被替换成星球,再简单做个3D效果。



然后,我对Gemini给出了那个最震撼的指令:我要五彩斑斓的黑


等待时间来到了一百多秒在等待的过程中,还有两个必须提醒的地方:


一些基础设置必不可少


进入Studio之后,需要在右侧Model一栏,选择最新的Gemini 2.0 Flash Experimental。



成功进入后,记得左侧的Library一栏,设置一下账号关联生成Library,否则有可能无法保存会话。



最后来看下,Gemini想明白了怎么改黑色了吗?



500s过去了,毫无动静——AI还是理解不了五彩斑斓的黑啊!


本文来自微信公众号:APPSO (ID:appsolution),作者:appso

相关内容

热门资讯

鲍威尔未排除7月降息可能,称若... 鲍威尔未排除 7 月降息可能,这一表态引发市场广泛关注。他明确指出,若非关税等因素的影响,降息或许已...
对美关税谈判,印度画出两大“红... 【环球时报综合报道】据印度《金融快报》6月30日报道,印度财政部长西塔拉曼在接受专访时表示,农业和乳...
微信承诺“没回款我来垫” 男子... 微信曾承诺“没回款我来垫”,这一举措彰显了其对用户的责任与担当。有一男子,因这一承诺而深受触动,他在...
福州“织”造开发低碳面料 每生... 福州在纺织领域展现出卓越的创新与环保担当。“织”造开发出低碳面料,这一成果意义非凡。每生产 1 吨这...
国产GPU,还有多少硬骨头要啃... 国产 GPU 之路虽已起步,但仍有诸多硬骨头待啃。从技术层面看,核心架构的自主研发是关键,目前与国际...
福州市第二社会福利院举办乒乓球... 福州市第二社会福利院近期举办了一场别开生面的乒乓球融合联赛。在福利院的活动室内,来自不同背景的老人和...
爱心企业捐赠空调 为白塔中学送... 在炎炎夏日,爱心企业的善举如同一股清泉,为白塔中学送去了清凉与关怀。这批捐赠的空调,不仅是冰冷的电器...
T2航站楼站前高架投用 福州机... 近日,T2 航站楼站前高架正式投入使用,这标志着福州机场迈入了双航站楼高架时代。高架的投用极大地提升...
新区杯·海峡两岸好文章采风交流... 今日,备受瞩目的“新区杯·海峡两岸好文章采风交流活动”正式启幕。此次活动犹如一颗璀璨的文化明珠,在海...
废旧充电宝该如何正确处理?业内... 废旧充电宝的正确处理方式至关重要。业内人士建议,首先应将废旧充电宝从充电器等设备上取下,避免引发安全...
避暑经济带火闽侯梧溪村 闽侯梧溪村因避暑经济而迅速火起来。这里群山环绕,绿树成荫,清新的空气仿佛是大自然的馈赠。夏日里,络绎...
福州低效用地再开发入选自然资源... 福州低效用地再开发成功入选自然资源部典型案例,这一成就彰显了福州在土地资源利用上的卓越举措。福州以创...
河南西峡强降雨遇难人数上升至5... 记者从河南省南阳市消防部门了解到,截至目前,已搜寻到5名人员,均无生命体征,现场搜救工作仍在进行中。
拆解充电宝安全困局:百元成本是... “百元以下的充电宝?我不会考虑,经济账根本算不过来。”充电宝爆雷后,一位从业者向第一财经直言。她强调...
中国留学生,卷进中亚“斯坦国” 在中亚的“斯坦国”,中国留学生们正经历着独特的经历。他们远离家乡,踏入这片陌生的土地,怀揣着对知识的...
信息不全的银行卡影响使用吗 近期,福建宁德农商银行、南平农商银行等多家中小银行密集发布公告,要求客户核实完善个人信息,包括用户姓...
专访红酒达人高远:探秘进口葡萄... 随着消费升级和健康饮酒理念的普及,进口葡萄酒正逐渐成为国人餐桌新宠。面对琳琅满目的葡萄酒品牌和参差不...
上半年港股结构性行情凸显 三大指数累计涨幅均在20%左右;以1067.13亿港元的IPO募资额位居全球首位,宁德时代成为全球募...
《哪吒2》卖了154亿,影院、... 《哪吒 2》卖了 154 亿的惊人票房,然而影院和片方却仍在哭穷。一方面,影院虽迎来巨大流量,但运营...
他信家族的“生死之战”:佩通坦... “他信家族的‘生死之战’引发广泛关注。佩通坦被暂停总理职务,这一事件如同一颗巨石投入平静湖面,激起层...