每日AI资讯--3月19日

Kimi智能助手宣布支持 200 万字无损上下文

来源：36氪

36氪获悉，通用人工智能创业公司“月之暗面”（Moonshot AI）宣布在大模型长上下文窗口技术上取得新的突破，Kimi智能助手已支持200万字超长无损上下文，并于即日起开启产品“内测”。

Kimi智能助手宣布支持 200 万字无损上下文

捷成股份：已发布AIGC产品智能创作引擎ChatPV

来源：36氪

36氪获悉，捷成股份在互动平台表示，公司已于3月15日发布了AIGC产品智能创作引擎ChatPV。ChatPV将盘古大模型的通用能力与捷成股份自主研发的视频领域垂直模型相结合，能够自动化处理大量图片和视频素材，通过对视频片段、图片、音频、字幕等内容的深度理解，将文案生成、素材摘取、视频剪辑等多个环节融为一体，实现从文字到视频的快速创作，还可根据用户输入的关键词，自动生成视频脚本、广告词、标题、分镜脚本等，并从素材库自动摘取相关视频素材，生成完整的视频。ChatPV的创新性功能，不仅极大地提高了视频创作的效率，也极大地降低了创作的门槛。

捷成股份：已发布AIGC产品智能创作引擎ChatPV

英伟达推出有2080亿晶体管的新AI处理器，称运行速度可提高数倍

来源：36氪

当地时间3月18日，英伟达在加州圣何塞举行的GTC大会上展示了名为Blackwell的新处理器。据介绍，Blackwell处理器由2080亿个晶体管构成，在处理支持人工智能的模型方面可将速度提高数倍。这包括被称为训练阶段的技术开发过程和称为推理阶段的技术运行过程。英伟达表示，Blackwell实际上是两个芯片通过连接而结合在一起，以确保它们可以作为一个整体无缝运行。英伟达的制造合作伙伴台积电将使用其4NP工艺来生产该产品。英伟达称，Blackwell将帮助推动人工智能工作超越诸如识别语音或创建图像等相对简单的工作。（界面）

英伟达推出有2080亿晶体管的新AI处理器，称运行速度可提高数倍

国内首个AI导演上岗

来源：上海证券时报

智东西3月18日消息，据上海证券报报道，3月15日，湖南广电集团首个AI导演爱芒（英文名AIM）正式以助理导演的身份和观众、网友们见面。这也是国内首个正式上岗的AI导演。3月17日午间，该综艺超前企划播出，爱芒正式亮相。《声生不息》系列制片人洪啸说：“AI导演会倒逼着我们不断地去创新。”

国内首个AI导演上岗

苹果谷歌和OpenAI商谈iPhone大模型使用

来源：彭博社

智东西3月18日消息，据彭博社报道，知情人士称，苹果公司正在与谷歌进行谈判，希望将谷歌的Gemini大模型能力应用在iPhone中，以支持今年iPhone即将增加的各类生成式AI功能。彭博社记者马克·古尔曼认为，这将是一项重大的协议，可能会撼动整个AI行业。该报道还提到，苹果最近与OpenAI进行了讨论，考虑使用其大模型。

苹果谷歌和OpenAI商谈iPhone大模型使用

Open-Sora视频生成模型开源

来源：智东西

智东西3月18日消息，3月18日凌晨，潞晨科技创始人尤洋教授在X平台发文，潞晨科技旗下Colossal-AI团队开源了其Open-Sora 1.0视频生成模型，包括模型权重、训练源代码和详细的架构。该模型采用了Diffusion Transformer（DiT）架构。据了解，团队以使用了DiT架构的开源文生图模型PixArt-α为基础，引入了时间注意力层，并将其扩展到了视频数据上。

GitHub地址：

https://github.com/hpcaitech/Open-Sora

Open-Sora视频生成模型开源

马斯克Grok大模型开源参数量3410亿

来源：智东西

智东西3月18日消息，刚刚马斯克的AI创企xAI正式发布了大模型Grok-1，其参数量达到了3140亿，超过OpenAI GPT-3.5的1750亿。这是迄今参数量最大的开源大语言模型，遵照Apache 2.0协议开放模型权重和架构。Grok-1是一个混合专家（Mixture-of-Experts，MOE）大模型。xAI称这是他们自己从头训练的大模型，Grok-1没有针对特定应用进行微调。

马斯克Grok大模型开源参数量3410亿

斯坦福新研究提升大模型长视频理解能力

来源：智东西

智东西3月18日消息，3月15日，斯坦福研究人员发布论文，推出了一种基于代理（Agent）的系统——VideoAgent，其将大型语言模型作为中央代理，迭代地识别和编译关键信息以回答问题，同时利用视觉语言基础模型作为翻译和检索视觉信息的工具。在EgoSchema和NExT-QA基准测试中，VideoAgent在零样本准确率上分别达到了54.1%和71.3%，平均仅使用了8.4和8.2帧。研究人员称，该测试结果表明该方法在效果和效率上优于当前最先进的方法，在提升长篇视频理解方面有应用潜力。

论文地址：

https://arxiv.org/pdf/2403.10517.pdf

GitHub地址：

https://wxh1996.github.io/VideoAgent-Website/

斯坦福新研究提升大模型长视频理解能力

AI程序员代码能力超Claude 2

来源：智东西

智东西3月18日消息，3月15日，AI创企Cognition对其团队发布的首个AI软件工程师Devin进行了技术解读，发布了关于Devin的SWE-bench基准测试技术报告。SWE-bench可以评估系统解决现实中代码库问题的能力。测试结果显示，Devin不需要人类辅助就可以解决570个问题中的79个问题，成功率为13.86%，高于SOTA 大模型（Claude 2）的4.80%。

GitHub地址：

https://github.com/CognitionAI/devin-swebench-results

AI程序员代码能力超Claude 2