谷歌Gemini的图像生成,这是又开挂了?
要说最近AI圈啥最火?那必须得是谷歌Gemini的原生图像生成功能!这玩意儿升级速度简直像坐了火箭,嗖嗖的!
这次升级可不是小打小闹,图像质量更高了,以前让人头疼的文本渲染也更准了,而且生成速度也快了不少,再也不用干等着了!
最让人惊艳的是,现在只要一句话,就能把两张毫不相关的图片元素融合得天衣无缝,这技术,简直了!
想给图片里的人物加个眼镜?没问题!实时编辑,说改就改,立马生成!
温馨提示: 想体验这些炫酷功能,记得去Google AI Studio的Starter Apps板块溜达一圈哦!
更厉害的是,还能指定修改图片中的某个部分,其他地方保持不变,简直不要太贴心!
如果你是进阶玩家,还可以试试搭配Gemini 2.0 Flash,让模型自己构思、自己生成图片,解放你的双手!
现在,这些功能都能在Google AI Studio免费体验,记得认准“gemini-2.0-flash-preview-image-generation”这个模型。
开发者们可以通过Google AI Studio和Vertex AI中的Gemini API集成这些功能,一张图片的价格是0.039美元(约合人民币0.28元),简直是白菜价!
距离上次谷歌推出Gemini原生图像生成功能,才过去一个多月,这升级速度,简直让人怀疑谷歌是不是偷偷开了加速器!
网友们也纷纷表示:
谷歌最近真是火力全开啊!
赶紧上手试试看!
据谷歌AI Studio开发者平台的产品负责人透露,这次升级主要集中在以下几个方面:
- 视觉质量提升
- 文本渲染更准确
- 卡顿现象明显减少
- 生成速度更快
那么,实际效果到底怎么样呢?我们也第一时间进行了体验!
首先,在谷歌提供的demo中,我们看到它可以将完全不同的元素完美融合在一起,毫无违和感。
为了测试它的实力,我们提供了下面两张原图,让它帮忙生成量子位周边产品。
实测用时5.4秒,几乎是秒出图!
虽然logo颜色还有一点点偏差,但整体构图已经很不错了,抠图和融合效果也很干净利落。
这个例子也顺便测试了它的文字渲染能力,除了中文,我们再试试其他语言。
英文渲染不在话下,还自带艺术字效果,简直不要太赞!
换成希腊文(意思是“我爱你”)也同样优秀,仔细对比了一下,没有发现任何渲染错误。
好啦,文字渲染就先到这里,接下来我们测试一下它的换图和扩图能力。
开启“找茬”模式后,我们不得不承认,它真的只更换了吊床的颜色,其他元素都和原图一模一样。
而且,在秒速生成图片的同时,它还会根据用户的指令给出自己的理解,相当智能!
如果只给人物上半身,让它生成完整的人物形象呢?
第一次扩图,它只前进了一小步,完成了更多的人物上半身复原工作。
新生成的部分看起来也很合理,从一根蓝色肩带扩展到了背带裤穿搭,细节好评!
不过,这还不是我们一开始想要的“全身肖像”,所以继续……
最终结果如下,人物的比例和姿态都很完美,生成效果着实让人惊艳!
最后,我们也体验了一波实时绘图功能,结论是:Gemini原生图像生成的速度真的很快!
我们先随意画了一个太阳的草图,让它给太阳加上笑脸,结果立马就搞定了!
而且还支持上色,效果也很不错!
总的来说,从我们的实测来看,升级后的Gemini原生图像生成功能确实表现惊艳,尤其是在遵循用户指令、文本渲染等方面。
除了我们的测试,不少网友也第一时间分享了各自的玩法。
比较经典的就是用来搞装修设计,可以一键测试自己想要的装修风格,省时省力!
当然,也有偶尔翻车的,用它来扩图时,最后生成的人物比例有点奇怪,不过瑕不掩瑜啦!
与此同时,也有人将它和最近很火的GPT-4o生图进行了对比,初步结论是整体仍然稍逊一筹,不过Gemini的进步也是有目共睹的!
彩蛋!
悄悄告诉你,谷歌最新的生图功能还能搭配Gemini 2.5 Pro(最近因为强大的代码能力火出圈)一起使用哦!
只需在提示栏中选择“Canvas”,上传一张图片后输入以下提示词:
Transform this image into a code-based representation of its natural behavior.(将此图像转换为基于代码的自然行为表示)
最终你就能得到一段炫酷的视频演示!
除了预览效果,还能一键切换查看代码,简直是程序员的福音!
最后,欢迎大家多多体验,并在评论区分享你的作品哦!
温馨提示: Google AI Studio