AI绘图平民化?OpenAI的GPT-4o图像生成,免费也能玩!
重磅消息!OpenAI这次是真给力,把GPT-4o的图像生成能力一股脑儿全开放了!啥意思?就是说,现在开始,哪怕你是免费用户,也能第一时间体验到AI绘图的乐趣啦!
不管是ChatGPT还是Sora,Plus、Pro、Team,甚至咱免费用户,统统雨露均沾,都能用起来。
这消息一出,朋友圈、微博瞬间被刷屏!大家都在疯狂测试,其中最让人惊艳的就是它对文本的理解和处理能力,简直绝了!
比如说,你让它把文字完美还原到图片里,它就能做到,而且还能按照你指定的位置摆放文字!
男人右手举着“a few”,左手举着“words”
更厉害的是,它还能像拍连续剧一样,一边准确地生成文字,一边让人物做不同的动作!这也太智能了吧!
仔细看看下面这两张图,你会发现,第一张图里白板上的男人倒影,跟第二张图里的动作完美对应,细节控啊!
昨天晚上,OpenAI突然宣布要搞个直播发布会,这次奥特曼(OpenAI的CEO)终于出现了!上次GPT-4.5发布的时候,他因为要带娃没来,这次可不能错过了。
直播里,他们展示了各种好玩的玩法,比如制作表情包、文本渲染、多轮互动生成,还有听指挥的能力,简直不要太强!
直接现场来张自拍,立马就能变成动漫风格,这速度,杠杠的!
官方还玩起了梗,制作meme图,要求在图片里加上“feel the agi”。厉害的是,它还知道把小写换成大写,更符合梗图的风格!
现在,你就可以打开ChatGPT,亲手体验这些强大的功能了!
实测生成速度还是很快的(大概十几秒一张图),不过免费用户每天只有3次体验机会,且用且珍惜啊!
API预计会在未来几周内逐步推出,到时候就能在更多地方用上这个神技能了!
这波啊,主打一个好看又实用!
我们终于迈向了这种真正集成的多模态模型。
按照官方的说法,作为多模态模型的4o,现在终于把图片生成这块重要的拼图给补齐了!
而且,它追求的是美观和实用并重,既要好看,又要能解决实际问题!
废话不多说,直接来看看它到底有哪些升级的地方吧!
各项能力大升级
首先,OpenAI说,4o现在能把文字和图片完美融合在一起了。
比如,你直接给它一段文字,它就能给你生成一张设计精美的菜单,以后开餐厅做宣传册,就靠它了!
而且,它还支持多轮对话,你可以一步一步地调整图片的内容和风格,简直就是你的私人设计师!
就像下面这样,你先给它一张猫猫的照片,然后一步步地把它变成一个游戏角色:
而且,它还特别注重细节!官方说,4o可以处理多达10-20个不同的物体,一般的模型处理5-8个物体就Hold不住了。
除了上面说的,4o在生成真实图像方面也表现得非常棒,简直可以以假乱真了!
现实版的“照猫画虎”也安排上了!
网友实测ing
看完官方的宣传,网友们也坐不住了,赶紧来了一波实测!
经典的表情包第一时间安排上,这画面,毫无违和感啊!
甚至,复刻同款书写图也是小菜一碟!
One More Thing
话说最近这几天也太热闹了,DeepSeek、OpenAI和谷歌几乎是同一时间开战,AI圈真是热闹非凡!
值得一提的是,昨天晚上11点(北京时间),OpenAI突然宣布要搞个小发布会,而DeepSeek刚刚发布了DeepSeek-v3-0324的官方技术报告。
这波操作,是不是被DS给逼出来的呢?