斯坦福大学与Apparate Labs联合发布革命性AI视频模型Proteus
加利福尼亚州斯坦福市,2024年6月15日 —— 斯坦福大学的研究团队与Apparate Labs今日宣布,共同开发出一款名为Proteus的创新AI视频生成模型,为视频制作和人物形象生成领域带来了突破性进展。
Proteus模型亮点:
- 高度逼真:利用先进的AI技术,Proteus能够从单张图片生成具有高度逼真表情和流畅动作的虚拟人物形象。
- 低延迟生成:Proteus模型具备低延迟特性,能够实时响应语音输入,生成每秒超过100帧的视频流。
- 多模态交互:模型支持语音、文本和图像等多种输入形式,实现与用户的自然直观交互。
应用领域:
Proteus模型在个性化虚拟助理、虚拟宠物、情感支持、客户服务、教育和培训、游戏定制、影视娱乐、市场营销和社交媒体等领域具有广泛的应用潜力。
专家评价:
AI领域的专家对Proteus模型给予了高度评价。AI科学家贾扬清称赞其实时人工智能头像质量出奇得好,英伟达科学家Jim Fan表示,这一项目令人印象深刻。
技术架构:
Proteus模型采用了潜在扩散模型和Transformer架构,这些技术在潜在空间中高效处理数据,增强了模型性能和生成效果。
安全与定制:
斯坦福大学和Apparate Labs致力于安全地提供这项技术,并向选定的开发者提供API的早期访问权限,以推动Proteus模型的定制化和个性化应用。
关于斯坦福大学:
斯坦福大学是世界领先的研究型大学之一,以其卓越的学术成就和创新精神闻名于世,在人工智能和神经科学等领域持续推动科技的边界。
申请体验地址: https://apparate.ai/early-access.html
智源研究院引领AI新浪潮,发布多项前沿研究成果
在人工智能领域,智源研究院以其创新精神和卓越成就,再次成为全球关注的焦点。2024年北京智源大会上,该院发布了包括大语言模型、多模态技术、具身智能以及生物计算在内的近20项重大研究进展,标志着AI技术发展进入了全新的阶段。
首先,该院推出的全球首个低碳单体稠密万亿语言模型Tele-FLM-1T,以其仅消耗业界普通训练方案9%的算力资源,展现了AI技术在能效方面的突破。该模型的问世,不仅大幅降低了大规模语言模型的训练成本,也为AI的可持续发展铺平了道路。
紧接着,智源研究院展示了Emu3多模态大模型,这一模型通过自回归技术路线,成功实现了文字、图像和视频的统一处理。Emu3的推出,为多模态AI应用提供了更高效、更精准的技术支持,进一步拓宽了AI在各个领域的应用前景。
在具身智能领域,智源研究院的ASGrasp技术以超过95%的真机实验成功率,引领了机器人动作执行技术的潮流。这一技术的突破,预示着机器人在复杂环境中的自主性和适应性将得到显著提升。
生物计算领域同样传来喜讯,智源研究院的全原子生物分子模型OpenComplex 2,在国际权威的CAMEO蛋白质结构预测竞赛中连续26个月稳居第一,为药物研发和生物医学研究提供了强有力的工具。
此外,智源研究院还推出了FlagOpen 2.0和FlagOS,这两个开源技术基座为大模型的研发和应用提供了全面的支持。FlagOpen 2.0的全栈开源技术框架和FlagOS的大模型“操作系统”,不仅支持异构芯片和多种框架,而且其全球总下载量已超过4755万次,为AI技术的普及和应用提供了坚实的基础。
智源研究院的这一系列成果,不仅展示了该院在AI技术研发上的深厚实力,也为全球AI产业的发展注入了新的活力。随着这些前沿技术的逐步应用和推广,我们有理由相信,人工智能将更加深入地融入我们的生活,开启一个全新的智能化时代。
苹果公司在 WWDC 2024 上推出革新性 AI 图像技术
加利福尼亚州,2024年6月 —— 在刚刚落幕的苹果全球开发者大会(WWDC 2024)上,苹果公司软件工程副总裁 Craig Federighi 披露了一项重要的 AI 图像技术更新。苹果宣布将在其操作系统中引入一项新功能,即在图片元数据中标注“AI 生成”的标签,以明确区分 AI 生成内容与现实拍摄图片。
这一革新性措施得到了科技媒体 9to5Mac 的关注,他们发现在 iOS 18 Beta 1 的更新代码中,苹果引入了 VisualGeneration 框架,其中包含了用于识别和标记人工智能生成图像的“取证”功能。这一技术的应用,不仅提升了 AI 图像的透明度,也为内容真实性的鉴别提供了新的途径。
同时,苹果公司还推出了 Image Playground 应用,这是一个全新的图像生成工具,它能够根据用户的描述生成卡通化的图像。与市场上其他图像生成工具不同,Image Playground 专注于卡通图像的创作,避免了逼真照片可能带来的误导和滥用问题。
作为苹果智能(Apple Intelligence)战略的一部分,Image Playground 允许用户输入文本描述,并选择动画、插图或草图风格,应用将即时生成满足用户个性化需求的图像。这些图像可以即时在设备上创建,并可在信息、备忘录、无边记以及专用的 Image Playground 应用中轻松访问和使用。
苹果公司的这一举措,不仅展现了其在 AI 领域的技术实力,也体现了其对用户隐私和内容真实性的重视。随着 AI 技术的不断发展,如何在创新与责任之间找到平衡点,已成为行业的重要课题。苹果公司通过这些新技术的推出,为整个行业树立了新的标杆。