全网都在玩的生图模型,我用它把iPhone 17提前发布了
创始人
2025-09-09 18:06:09
0

最近,朋友圈和抖音小红书几乎被 Nano Banana 刷屏了。这个香蕉模型似乎要让 P 图这个词消失,直接给 Gemini 带来了一千万的新用户,火得一塌糊涂。



各路大神的邪修玩法铺天盖地,什么 3D 手办、大佬合影都是基操了。虽然 Nano Banana 强得不行,但我们在留言区依然收到不少用户的疑问和需求。


首先使用门槛就拦住了不少人,甚至比在国内用 ChatGPT 还麻烦一些。在图片编辑过程中,最多人反馈的是 Nano Banana 图片分辨率不够高,以及比例高度不可控。


说实在,我也感觉自己有点吹毛求疵,但没想到,这些需求真的有人听了进去,并且做了出来,而且还是咱们国产厂商。


刚刚,火山引擎正式上线豆包・图像创作模型 Seedream 4.0。除了具备“超强主体一致性、多图灵活创作、连续生图”等核心能力,Seedream 4.0 还有一个 Nano Banana 也没有的功能——支持最高 4K 高清图片输出。


这也是首个最高支持 4K 多模态生图的模型,Seedream 4.0 同时也在豆包、即梦全量上线,最高支持 2K 输出。


实际表现如何需要拉出来溜溜。APPSO 提前拿到内测体验了几天,给它上点比 Nano Banana 更大的强度。


实测完后我发现,虽然也不能算完美,但国产生图确实来到了一个新的阶段。


我替苹果把 iPhone 17 Air 提前发布了


今晚就是苹果秋季发布会了,不用熬夜看直播,APPSO 先帮苹果把 iPhone 17 给上线了


我们用 Seedream4.0 生成了两款今年大火的 iPhone 17 Air 产品页面,这可是今年最受关注的超薄旗舰。


参考 iPhone 16Pro 的官网页面,替换手机和相关文案,保证果味十足



这个构图似乎有些古板,调整一下小字 ,再加上 Just 5.5mm thin 这个最大的亮点。


可以看到 Seedream4.0 生成的这版 iPhone 17 Air 将手握机身的倾角,刚好和字母 A 右边平行,有点资深设计师的审美了。



这次,我们不让库克来发布产品,有请特斯拉人形机器人来客串一把。还是熟悉的场景,熟悉的 Good Morning(doge)。



这组图用到了三张参考图,人形机器人、iPhone 17 Air ,以及库克的现场图,Seedream4.0 一致性确实有点东西。



其实这里还有个逆天的细节容易被忽略,注意看观察生成图机器人头盔上的反射细节,原图是漆黑一片的。


也就是说, Seedream 4.0 根据图 3 的蓝天白云和建筑物背景,推理出机器人应该有的反射,真的太细了。



不妨再脑洞大开一点,据称 iPhone 17 Air 就是为了明年折叠屏手机做准备。APPSO 用 Seedream4.0 也提前让大家看看 iPhone 首款折叠手机的“实拍图”。



眼尖的读者可能已经发觉,是不是跟华为新款的三折叠有点像,没错我用了它作为参考图,替换上了苹果的摄像头和logo,无论是构图、背景和水印的细节都完整保留了。



那干脆整一部苹果的三折叠,没有人知道那一夜,苹果和华为究竟发生了什么。



如果是“乔布斯”,他会怎么发布这款产品,我们请 AI 老乔限时返场。


熟悉的身影,穿透屏幕的气场,让我们再次高呼“Amazing”。



好玩之外,还真能用


Nano Banana 能走红,除了社交媒体的爆款玩法,更在于它的技术能“看得见未来”。


无论是一致性、局部修改、换色还是多图结合,都是能够直接用在电商、营销、社交媒体等等场景里。


技术如果不能应用到生产力场景,也只是玩具。下面我们看看 Seeddream 4.0 在一些实用场景能不能打。


我们先拿这两天刷屏的红月亮,融合到球鞋设计中。



我还想看看这款球鞋不同角度的展示,只需输入类似“生成一只白色运动鞋,展示正面、侧面和俯视视角”的提示词,不管是用于打样还是用于设计草图,都直接一步到位。



如果我还想找一个模特用不同姿势展示商品呢?找不到合适的参考照片也没关系,直接画个火柴人简笔画就行。


Seeddream 4.0 基于手绘图能有效控制模特姿势的一致性,同时实现角度的合理变化,在多角度呈现上表现精准。



像下面这个案例,我在提示词里面没有指定两个人的站位,所以在它生成的 4 张照片里面,两种站位都有,而且效果都很好。


它像一个周到的乙方,如果你需求没有很明确,那就把可能的情况都考虑到并把成品给你挑选。 


提示词:将图1男子和图2女子合进一张画面,参考图3姿势


如果说拥抱这种动作太简单了,我们直接来一个举高高的动作,这次再指定多一张背景图片。 


提示词:将图3和图1合进一张画面,参考图2姿势,图1是被举起来的那个小孩;同时背景使用图4。图四的背景是来自浪浪山,两个角色是罗小黑和他的师傅。


四个人的参考图,Seedream 4.0 同样可以很好的处理,保持和简笔画的姿势一致。 


提示词:把图一的四个角色(西游记里面的师徒四人,沙僧、唐僧、猪八戒、孙悟空)按照图二的姿势(叠罗汉)排布,沙僧、孙悟空和猪八戒在下面,唐僧在上面。


如果还想给模特更换妆造,我们发现 Seeddream 4.0 也能准确把握不同发型的特质:长直发的柔顺、盘发的干练以及卷发的弧度,全部都清晰呈现。


同时,背景与人体保持高度一致,未出现边缘模糊或形变问题,成功实现了在保留主体特征的基础上对妆发风格的精准转换——省了多少模特妆造费用。



最让我惊喜的要数线稿生成,线稿通常为简洁的线条勾勒,仅包含物体基本轮廓与结构,缺乏细节、色彩及质感。在草图转渲染功能上,Seeddream 4.0 能将简单线稿转化为高质量成品图。



不仅精准填充丰富色彩,使物体视觉层次分明,还有细腻的光影处理与材质模拟,比如包包的皮质纹理、金属配件光泽等。


它对于“高质量渲染图”的理解,可谓是逆天,除了静物,还搭配了人像、场景,你没想到的,它都替你想到了。



讲真,Seeddream 4.0 这次更新后,对真实质感的处理完全超出我的预期。


像皮具、金属的纹理表现已经很稳了,但当我看到它生成人的皮肤纹路时,还是被秀到了。



这个皮肤纹理、隐约可见的青筋,甚至是手腕上自然的汗毛感,还有光线打在皮肤上的通透效果……所有细节都拿捏得非常到位,组合在一起就一个字:真。



而这组图的原始参考图是什么呢——



仅此而已。


细节还原仿佛真实拍摄,完美实现了真实世界照片拟合的需求。这都意味着模型能够适度的“创作”,在参考图和提示词给定的范围内,给出合理的发挥。


这种创作能力可以用在更有趣的玩法上,比如只需要一个矢量图,就可以给 APPSO 生成一整套完整的周边设计。


提示词:参考这个LOGO,做一套品牌视觉设计,品牌名称为 APPSO,包括包装袋、帽子、纸盒、卡片、手环、挂绳等。红色视觉主色调,趣味、简约现代风格


Seeddream 4.0 的“创作”能力和直接生成样品的玩法,极大地降低了制作成本。而且效果相当不错,模型捕捉到了“有趣味、简约现代”的核心风格,将品牌 LOGO 巧妙地应用在手机壳、卡套、挂绳和帽子上。



还有一点好评的是,Seeddream 4.0 支持最高 4K 分辨率的输出,而 2K 分辨率直出只需要几秒,能在电商等一些场景做到专业级输出,有更大的后期空间。


更多邪修玩法


除此之外,APPSO 还发现了一些有趣的邪修玩法,也跟大家分享。


最基本的桌面手办,当然是不在话下,我们试试让人物自己,拿着本人的手办。 


图片来源:https://x.com/oden_ai_ai/status/1957414144417910924/photo/1



提示词:将这张照片制作成一个角色模型。其后放置一个印有该角色图像的盒子,以及一台屏幕显示 Blender 建模过程的电脑。在盒子前方添加一个圆形塑料底座,角色模型手办站立在上面。并尽可能设置为室内场景。


提示词:照片级真实感。 然后照片中的人拿着一个手办模型,这个模型是根据这张照片的主体人物,制作而成的一个角色模型,在自己的房间里,很满意的微笑。房间里的电脑桌上,有一台屏幕显示 blender 建模该模型过程的电脑,同时有一个印有该角色图像的包装盒子,以及盒子前方有一个圆形塑料底座。


不仅拿在手里,还能挂在包上,照片的真实感和一致性保持都非常厉害。


提示词:照片级真实感。 先将这张照片变成一个可爱挂件/亚克力材质的扁平钥匙扣/橡胶材质的扁平钥匙扣,挂在 lv 包包/图二照片的包包上,然后她自己再背着这个有自己同一个角色挂件的包。


除了做手办,我们还拿它来生成了一些摄影风格极强,但是又保持真实的照片。


你的人生照片摄影师,可能会是Seedream 4.0 。 



除了强大的一致性和多图编辑能力,Seedream 4.0 还带来了丰富的世界知识能力,生图模型也能推理预测,深度理解我们的提示词和图片,其背后的意图。


例如我们上传了一张杯子即将要掉在地上的图片,然后输入提示词“下一秒这个画面应该是怎么样的?”



杯子掉在了地上,同时能看到倒在地上的水,反射了部分杯子,和窗户的光。


Seedream 4.0 除了知道一秒后会发生的事情,我们还能利用它的推理能力,整理自己的房间。 


提示词:把沙发上的被子和衣服都叠好


除了能把衣服整整齐齐地叠好,弄得满是颜料的地板,Seedream 也能在打扫干净的同时,保持图片内现有元素的一致性。


提示词:把这些颜料都收起来,地板擦干净(虽然这好像是个桌面)


借助它的推理能力,还有一个更骚的玩法。


下面这个案例里,上传的参考是模特图,让Seedream 4.0 把模特衣服的细节展示出来,模型接到的指令是细节图——这当中的距离,就要靠模型自己去“想明白”。


从结果来看相当不错,不仅版型准确,对于局部细节展示这一指令跟随也没有问题。几乎可以直接上架了。 



生成表情包梗图,Seedream 4.0 也是一把好手


参考网友 @op7418 的提示词,我们也跑出了好几版关于 AI 模型的表情包,一次可能不成功,那就多抽几次卡就好,好在生成速度也够快。


提示词:帮我将角色变成类似图 1 的白色轮廓贴纸,并添加一个俏皮白色轮廓短语“XXXX”。 


图1(左)来自 @fenxxxx,图 2(右)


你或许看过《千里江山图》这幅传世名作,但你或许还遗漏了亿点点细节。



同理可得,谁说《步辇图》里没有呆萌的 Labubu,以及在《韩熙载夜宴图》的宴席中,突然出现一只从现代穿越过来的网红柴犬 Kabosu,我也觉得毫无违和感,



不只是生图神器,还是创意生产力平台


体验下来,如果用一个词来形容 Seedream 4.0,那必须是“六边形战士”。它像一个全能的创意总监 + 高效的制作团队,让你能快速得到想要的结果,同时对创作流程有更强的掌控感。


快,是第一体感。


基于 DiT-MoE 架构,Seedream 4.0 的计算效率比上一代猛增了 10 倍以上,最快 1.8 秒就能生成一张 2K 高清大图。这种“秒级”响应,意味着极低的试错成本。


稳,则是生产力基石。


Seedream 4.0 的超强主体一致性能力,让你无论是想给角色换个场景、换个画风,还是调整姿势视角,都能高度保持原有特征,避免了“画风突变”的尴尬 。



对于很多电商和品牌设计师来说,AI 不再是给一张海报换个颜色,而是能参考一个 Logo,一键生成全套品牌视觉设计,从包装袋到手环,风格高度统一 。


品牌规范开始从一本厚重的 VI 手册,变成一行行可执行的 prompt。


作为我们这样的内容创作者,它能让你参考一个角色设定,批量生成漫画分镜或故事绘本,极大地提升内容连载的效率和一致性。


提示词灵感来自@阿真Irene


而且在 Nano Banana 出来之后,已经不少人基于它开发出了轻量级的小游戏或实用工具,这类工具给了更多中小开发者把创意快速变成产品,而且获得用户认可的可能性。


这几天 Seedream 4.0 的内测已经开始刷屏社交媒体。热闹之外,我们也看到,Seedream 4.0 已经不满足于当一个新奇的玩具,而是要成为一个可规模化、可商用的创意生产力平台。


本文来自微信公众号:APPSO,作者:发现明日产品的

相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...