• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

Midjourney遇劲敌,谷歌AI绘画4大牛创业,拿下1.2亿天使融资

Midjourney遇劲敌,谷歌AI绘画4大牛创业,拿下1.2亿天使融资
AI TOP100
2023-08-29 15:56:22


量子位 | 公众号 QbitAI

AI绘画王座上的MidJourney,终于迎来强劲对手。

最新挑战者Ideogram横空出世,开局就靠免费注册吸引众多目光。

最瞩目的特性:在图中精准生成文字,英伟达科学家范麟熙直接毫不客气地用它画了一个“It’s over, Midjourney”。

背后公司Ideogram AI,谷歌AI绘画4大牛集体离职的创业项目,坐标多伦多,带着1650万美元 (约1.2亿人民币)种子轮融资席卷而来。

创始团队中前4人都是谷歌文生图研究Imagen论文作者,组成一个扩散模型顶级研究团队。

谷歌藏着掖着这么久都不给大家玩的先进研究成果,终于被他们给开放出来。

Ideogram AI种子轮融资由a16z和Index Ventures领投。

个人投资者中也不乏知名人物,如OpenAI创始成员Andrej Karpathy,强化学习大牛Pieter Abbeel,Node.js创始人Ryan Dahl、GitHub联合创始人Tom Preston-Werner等。

甚至团队的老上司,前谷歌大脑掌门人Jeff Dean也有参与。

别看创始团队都是技术出身,Ideogram AI在宣传造势方面也一点不含糊,直接在��上号召大家刷二创tag,开启了一波病毒营销。

AI学会精准画出文字

让AI精准画出文字,一直是个难题。虽然SDXL和Midjourney新出的局部重绘功能有所改善,但网友反馈成功率一直不太高,需要反复尝试。

Ideogram一搞定这个痛点,直接被网友们玩出花了。

让文字出现在指示牌上、同时适应环境光影,没问题。

做一个咖啡拉花也没问题。

抽象风格的海报,也可以搞出风格合适的字体。

一句话直出品牌logo更是生产力属性拉满。

从网友们分享的提示词中也可以看出,增加画文字成功概率的“咒语”也很简单,就一个单词:

typography(印刷排版)

不过很可惜的是,它还不太能掌握中文。

抛开文字,Ideogram的图像生成能力,出图质量可以比肩MidJourney和Stable Diffusion。

如果与Imagen使用完全相同的技术,那么使用谷歌T5而不是OpenAI CLIP作为语言编码模型,意味着Ideogram对提示词里空间关系描述的理解还要更强。

有人成功用它生成一组风格一致的图像。

再结合视频生成工具Pika Labs直接搞出电影预告片风格的短片。

扩散模型顶级研究团队

Ideogram AI创始团队共7人,其中4人都是的合著者。

其中共同一作Mohammad Norouzi任CEO,他在多伦多大学计算机科学博士就读期间拿到了谷歌ML博士奖学金。

毕业后他加入谷歌大脑工作了7年,除了生成模型之外也是也是谷歌神经机器翻译团队的原始成员,Hinton团队自监督对比学习框架SimCLR的合著者。

共同一作William Chan (陳俊樂)任新公司CTO,他先后就读于加拿大滑铁卢大学、卡内基梅隆大学。

他2012年加入谷歌时先做的机器学习广告工程,后转到谷歌大脑作NLP研究。

第三位共同一作Chitwan Saharia本科毕业于孟买理工学院,2019年加入谷歌,现在是Ideogram的联合创始人。

第四位联创Jonathan Ho博士毕业于UC伯克利,曾在OpenAI工作一年,后加入谷歌。

他除了是Imagen论文的核心贡献者,还是去噪扩散模型奠基之作《Denoising Diffusion Probabilistic Models》的一作,这篇论文合著者中的Pieter Abbeel也是Ideogram AI的投资人。

创始团队中的另外三人,Shayaan Abdullah曾是Twitter的机器学习工程师,于今年4月离职,后加入Ideogram AI。

Jacob Lu为软件工程师,加入Ideogram之前曾在亚马逊等公司任职;Jenny Lei是软件工程实习生,加入Ideogram AI之前曾在谷歌实习。

还要做视频生成

Ideogram AI的四位联创在谷歌期间,还完成了。

在一年前就已经实现了生成1280*768分辨率、每秒24帧的高清视频片段。

实际上在今年3月,量子位就曾从投资市场:

不仅做图像生成,将来还要做视频生成。

无论Imagen还是Imagen Video,谷歌出于安全、伦理等方面考虑都未曾放出试玩、API或开源代码。

研究成果无法转化为应用,是近年来不少从谷歌离职创业者遇到的共同问题。

如大模型那边的Transformer八位作者中,Cohere创始人Aidan Gomez就曾表示离开的原因是“我在谷歌没有看到大模型发挥它真正的力量”。

Ashish Vaswani与Niki Parmar离开谷歌创办Adept AI与Essential AI的原因也是“谷歌希望用Transformer优化现有产品,而我们希望创造新产品”。

后来这些研究者所担心的事也确确实实发生了:

尽管2021年5月(比ChatGPT训练数据截止日期还早)谷歌就已经开发出了LaMDA对话大模型与聊天机器人,但在推出产品方面有太多顾虑,最终18个月后被隔壁ChatGPT一手直接面对公众开放抢尽了风头。

……

吸取了这些教训,新成立的Ideogram AI也拿出一副尽量开放、先把用户吸引进来玩的架势。

最初宣布了1000人测试名额,但没一会就满了。

今天似乎又开放了一些名额,量子位上午注册时并没有遇到排队。

总之名额应该还是有限的,感兴趣的朋友抓紧了。

试玩地址:

https://ideogram.ai

参考链接:

[1]https://ideogram.ai/launch

[2]https://x.com/ideogram_ai/status/1694024927853129757

[3]https://x.com/DrJimFan/status/1694358069638275463

[4]https://x.com/WilliamLamkin/status/1694535089575637048

— 完 —

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 夸克重磅推出千问助手,阿里千问App公测上线,AI生活加速到来!

  • AI Agent聚合平台MuleRun 2.0:上线30天用户破50万,美国成“主力军”

  • 谷歌Gemini Pro/Ultra用户迎来Veo 3.1视频模型正式上线,三图融合玩转视频创作!

  • 谷歌NotebookLM正式上线图像识别功能,图像导入,让知识检索变得超简单!

  • AI霸主地位岌岌可危?Databricks创始人警告:美国或拱手相让中国!

热点资讯

告别PPT熬夜!开源神器Presentation-AI免费来袭,本地运行碾压Gamma.app

7天前
告别PPT熬夜!开源神器Presentation-AI免费来袭,本地运行碾压Gamma.app

火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

5天前
火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

Google DeepMind上线SIMA 2预览版,性能飞跃迈向通用机器人

2天前
Google DeepMind上线SIMA 2预览版,性能飞跃迈向通用机器人

百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

3天前
百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

国产AI再突破!月之暗面Kimi K2Thinking开源,460万美元成本力压GPT-5?

7天前
国产AI再突破!月之暗面Kimi K2Thinking开源,460万美元成本力压GPT-5?
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有