AI文生图最大问题不存在了,最新Gemini2.0指哪改哪
创始人
2025-03-14 15:21:36
0

AI 文生图曾存在一些问题,但如今这一状况已得到改善。最新的 Gemini2.0 展现出了强大的能力,它能够精准地识别用户的需求,实现指哪改哪的高效操作。无论是对图像的细节调整,还是整体风格的变换,Gemini2.0 都能迅速而准确地做出响应。用户只需明确指出需要修改的部位或想要达到的效果,Gemini2.0 便会以其卓越的技术和智能,将图像完美地修改至符合要求的状态,为用户带来前所未有的体验。


本文来自微信公众号:APPSO (ID:appsolution),作者:appso,原文标题:《AI文生图最大问题不存在了,最新Gemini 2.0指哪改哪,网友已经玩坏了 | 附指南》,题图来自:AI生成


最近的热点实在太多了,当Gemini的文生图模型更新出来时,原以为只是平平无奇的小更新——万万没想到,属实是个大招。



在此之前,要么用Stable Diffusion,要么走回Photoshop老路,反正还没有哪个模型,可以用如此简单的对话,就完成如此精细的修改。


Gemini率先突破可控性这件事并不令人意外,二月时,Google就推出了最新一代的图像生成模型Imagen 3,当时就强化了提示词的跟随功能。



当时还只面对付费用户,现在在AI Studio中已经可以看到更完整丰富的呈现。可以说,在目前文生图的可控性程度,以及相对应的用户体验上,Gemini的确做到了无人能出其右。


下面我们会具体解释为什么这样下结论。同时在测试过程中,我们也发现了一些使用技巧,一并奉上。


可控性不好?不存在了


诚实地说,单纯讲生成还是有一点不稳定,但是Gemini 2.0 Flash Experimental展示出了堪称逆天的修改可控性。


下面这组花田图里,使用了Imagen 3的官方实例:Impressionistic landscape painting of a sunset over a field of sunflowers,vibrant colors,thick brushstrokes,inspired by Monet。



中间的修改提示词,是为了把天空换成蓝绿色:turn the clouds at the back of the picture in to blue-greenish color



注意看中间圈出来的地方,花田和天空过渡处的油彩,基本没有变化——模型充分理解这个修改提示词里“局部改色”的意图,只对天空局部改动,其它任何地方都保持了不变。


接下来这组城市街景的例子更明显,生成提示词:generate a Tokyo street crossroad,cars passing the traffic light and people walking around



细部有些地方还是不太能看的,生成这一步的不稳定性还是没有被完全驯服。真正有惊人改变的,是细部的指令跟随。



“我想要变成夜景”“街上应该有灯光”,提示词可以非常直接就完成修改。来感受一下四轮对话之后,形成的整体变化对比。



四张图渐次展示了城市从白天、黄昏、傍晚、再到夜晚的样子。而在四轮对话中,说改车就改车,不说改动行人就保持原样——不可控性不存在了!


Tip:生成+修改最稳定


局部修改的功能,如果是在现有图片上改动,效果没那么好,比较粗暴。下面是两张现图改夜景的例子。




最稳定的组合是从生成到修改,一条龙完成,在后续的修改里可控性就更高。


整体变化,一句话完成


除了局部改动,还可以改动视角,这也是非常实用的功能。对于短片的故事板、产品多视角展示,都相当有帮助。


产品图的修改真正做到了随心所欲。



要描述的是图片最终的样子,而不是修改图片的过程


Gemini理解模糊指令是没问题的,只是需要注意一下模糊的“方式”。


比如想变换镜头视角,要描述的应该是最后形成的结果,如“从左边拍摄的样子”,而不是“镜头移动到左边”。这毕竟还是一个静态文生图,并不能呈现镜头移动。


换句话说,指令越简单直给反而越好。


一进入Stduio还有一个官方示例是做一张生日卡片,可以直接尝试。不过,想要更高的可控性,最好复制粘贴了之后,自己新建一个对话。



接下来我修改了里面的元素,花朵被替换成星球,再简单做个3D效果。



然后,我对Gemini给出了那个最震撼的指令:我要五彩斑斓的黑


等待时间来到了一百多秒在等待的过程中,还有两个必须提醒的地方:


一些基础设置必不可少


进入Studio之后,需要在右侧Model一栏,选择最新的Gemini 2.0 Flash Experimental。



成功进入后,记得左侧的Library一栏,设置一下账号关联生成Library,否则有可能无法保存会话。



最后来看下,Gemini想明白了怎么改黑色了吗?



500s过去了,毫无动静——AI还是理解不了五彩斑斓的黑啊!


本文来自微信公众号:APPSO (ID:appsolution),作者:appso

相关内容

热门资讯

银行理财稳健前行结构优化 银行业理财登记托管中心近日发布《中国银行业理财市场季度报告(2025年一季度)》(以下简称“报告”)...
一季度我国软件业务收入同比增长... 央视网消息(新闻联播):工业和信息化部数据显示,今年一季度,我国软件和信息技术服务业稳健增长,完成业...
“青春夜校”解锁青年新“夜”态 “青春夜校”宛如一盏明灯,悄然解锁了青年新“夜”态。在夜晚的时光里,这里汇聚了怀揣梦想的青年们。课堂...
直击业绩说明会 | 第一次把业... 每经记者|熊嘉楠 每经编辑|叶峰 2024年,对于重庆啤酒而言,恐怕是特殊的一年。受极端天气和外部...
女网红欠款百万 长乐法院铁腕治... 在长乐法院,一起引人瞩目的事件正在上演。一位女网红竟然欠款高达百万,这一消息引发了广泛关注。长乐法院...
长乐落地“住房公积金贷款购房一... 长乐落地“住房公积金贷款购房一件事”服务,这一举措极大地便利了购房者。以往繁琐的公积金贷款购房流程得...
32岁,“逃避上班”的第八年:... 32 岁,已在“逃避上班”的道路上行走了八年。如今身处深圳,月赚 3000 元,却有着独特的活法。虽...
长乐“乐小i”上线 打造福州县... 长乐“乐小 i”正式上线啦!它成为福州县域内首个“AI 政务服务”智能助手,这是一项极具创新意义的举...
未履行法律义务 ​长乐40人被... 长乐 40 人被限制消费,这一现象引人关注。这些人未履行相应的法律义务,可能涉及诸多方面,如债务未清...
长乐国家安全宣传活动进地铁 近日,长乐市的国家安全宣传活动如火如荼地走进了地铁。在地铁车厢内,一幅幅生动的国家安全宣传海报格外醒...
高质效开展公益诉讼履职 长乐检... 长乐检察院高质效开展公益诉讼履职,全力护航孩子成长。他们深入校园、社区,积极排查侵害未成年人的线索,...
长乐:粮田“新”变 长乐,见证了粮田的“新”变。曾经的一片片传统粮田,如今焕发出全新的活力。随着农业科技的不断进步,新型...
长乐:东海潮涌处 数智破茧时 在东海之滨的广袤土地上,长乐如一颗璀璨明珠闪耀。东海潮涌,那磅礴的力量象征着无尽的活力与生机,长乐便...
长乐屿南村:新风拂过屿头湖 长乐屿南村,那是一处宛如仙境的所在。当新风缓缓拂过屿头湖,仿佛给这片宁静的天地注入了新的活力。湖面上...
215快线周六开通 完善主城区... 215 快线在周六正式开通啦!这一举措极大地完善了主城区至马尾、长乐的公交网络。它犹如一条便捷的交通...
福州琅岐半程马拉松鸣枪 在福州琅岐,一场激动人心的半程马拉松赛事鸣枪开赛。清晨的阳光洒在这片美丽的土地上,参赛选手们身着各色...
福州茉莉花茶“三茶统筹”产业园... 《福州茉莉花茶“三茶统筹”产业园 LOGO/IP 设计大赛作品征稿通告》为推动福州茉莉花茶产业发展,...
3月工资暴跌,日本加息悬了? 3 月,日本工资出现暴跌态势,这一现象引发广泛关注。众多企业面临经济压力,纷纷削减员工薪酬,导致劳动...
印巴冲突愈演愈烈!印度77架印... 印度与巴基斯坦冲突愈演愈烈,嗅觉敏锐的资金疯狂抛售印度、巴基斯坦资产。 据彭博报道,印度与巴基斯坦持...
健信超导科创板IPO申请获受理 上证报中国证券网讯(记者 何昕怡)5月9日,上交所官网显示,宁波健信超导科技股份有限公司(简称“健信...