![]()
XIN Zhiyuan报告编辑:Dinghui [Xin Zhiyuan简介] Gemini 2.5 Flash Image是最新的最高一代图像和Google编辑,并且网民非常感谢“功能强大的图像模型”。他的化身纳米 - 巴纳纳(Nano-Banana)在LMARENA盲验测试中获得了最大的优势赢得了冠军。凭借角色一致性,即时编辑,对世界的本地知识和多图像融合的四个功能,它引起了广泛的关注。刚才,Google已正式发布了最先进的图像模型,Gemini 2.5 Flash Image。如果您说它的其他名称是纳米 - 巴纳纳(Nano-Banana),那么您应该知道它!可以说,“最强大的图像模型”的标题是由世界各地的网民个人认可的。过去,纳米 - 巴纳纳(Nano-Banana)在Lmarena发射后很快就闻名。在最后的盲试验中,达到的NG Gemini 2.5 Flash图像是最好的结果。他蒙蔽了超过500万场比赛,赢得了超过250万张选票,领导了第二场比赛E Flux-1-knote-max的171分,据说更早。并取得了带领Lmarena竞技场历史的最大Elo Mark!总之,每个人都说如果他们使用它是可以的!这确实是低调和强大的。尽管它很有可能是最强的模型,但在世界各地的网民使用印章来得出结论之后,它并没有正式发布! Google首席执行官Pichai和DeapMind的老板Demis亲自带来了商品。我们“简单地”使用Google首席执行官Pichai和DeepMind的老板进行了一些试验,结果真的很棒。我觉得未来的照片专业将完全消失!可以和星期一换衣服,享受阳光,并穿着专业人士。 Demis还发布了一张为他创建的纳米香蕉的照片。 “让我们更改它”。纳米 - 巴纳纳(Nano-Banana)的能力几乎达到了“说话和跟随佛法”的地步。改变调味料,更改手表,更改动作,甚至戴上帽子,让工作出现在后面她。同时,模型的价格非常低。该模型可通过Gemini API和Google AI工作室提供开发人员,以及Vertex AI的企业。 Gemini的图像2.5闪存价格为每图像的每百万产出代币和1290个输出令牌。也就是说,每张图片的价格仅为$ 0.039。根据目前的价格,图片的价格不到30美分!比Openai便宜!网民说,Google正在将Ultraman治疗Kumbananas。我觉得大量的照相馆即将失业! Gemini 2.5 Flash图像实用应用Gemini 2.5闪存图像此时更新了四个超级功能:根据多图像融合世界中知识的迹象,继续编辑角色一致性图像可以融合很多Gemini的全球知识来制作和编辑图像。例如,走廊,图片和手机可以与一个角色在走廊上打电话的图片完美融合。特别是,弥漫反射形成d灯管释放的灯。一代图像中的主要挑战之一是维护与许多信号和编辑相似的角色或事物的外观。如今,可以将相同的角色放置在不同的环境中,从许多角度使用新的设置展示单个产品,或者在保持主题的相似性的同时开发相似的权益权益。除了有效的角色一致性外,该模型还符合视觉模板。 Google为开发人员提供了模板,例如房地产清单卡,员工徽章或整个产品目录的产品效果图。双子座的图像2.5 Flash支持针对性的转换和自然语言准确的本地编辑。例如,该模型可以模糊图像背景,从T恤上删除麦塔,从图片中删除整个人,更改姿势主题,为黑色和WH上色ITE图片,或遵循简单的技巧,以实现您可以想象的其他效果。更令人惊讶的是,更新后的纳米 - 巴纳纳(Nano-Banana)也具有伟大的“世界知识”。从历史上看,图像生成模型在开发美丽的图像方面表现出色,但缺乏现实世界中的语义理解。 Gemini 2.5从双子座的全球知识中,Flash图像的好处,从而解开了新的使用案例。建立了Google AI Studio模板应用程序的应用程序,该应用程序将简单的画布更改为互动教育教育。它显示了该模型可以阅读和理解手上绘制的图纸,帮助回答现实世界中的问题的能力,并在一步中遵循复杂的标签构成编辑。 Gemini 2.5 Flash图像理解并融合了许多沉浸式图像。您可以将某些东西放在场景中,再次使用颜色或纹理方案为房间定型,然后用单个提示将图像融合在一起。 DeepMind提供了一个对新模型的性能的详细介绍。首先,引入了模型的功能:“从现实的杰作到令人惊叹的幻想世界,现在可以形成,编辑图像,并将其优化为天然,达到全新的推理,控制和创造力。”在字符一致性方面,为模型提供了参考图像,该模型可以生成新的视觉内容,保持角色,主题或对象的相似性,以与各种姿势,照明,环境或样式相似,以帮助创建更具吸引力的吸引力和叙述。我觉得是时候一个人自己拍电影的能力来了!新型号可以应用某种风格的艺术,设计或纹理,并在保持原始主题的形状和细节的同时,轻松地将它们从一个图像转移到另一个图像。这几乎是对广告设计行业的打击的降低。就创意构图而言,需要一个及时的词。将许多图像的创意元素融合在一起。使用2.5 Flash,您可以开始拍摄不同的元素,从最多三个输入创建独特而团结的组成。例如,一条从山峰前的水中跳下的鲸鱼。在双子座的基本逻辑中,AOF 2.5闪光灯可能比图像前或之后发生的情况少。这是一个真正的推理推理,需要世界上知识的完全希望。例如,在开发了漂浮在仙人掌的气球的初始图片之后,让可能的场景接下来。如果不存在PS,将发布新的Google模型,最不开心的是Photoshop。 AI图像编辑功能直接降低了维度并击中Adobe的腹地。将来,诸如Adobe Photoshop之类的传统工具将面临主要挑战。但是,到目前为止,纳米 - 巴纳那并不完美。例如,在结合两张不同的图片时,有时很难准确复制脸。但是它在对现有LarCloud的微妙调整方面表现良好。而且成本很低。您认为AI会完全取代传统行业吗?参考文献:https://devervepers.googlog.com/en/introducing-gemini-2-5-5-5-mage/https://deepmind.google/models/models/geminin/mimage/image/nano-banan is gemini是双子