每日AI资讯-01月15日-AITOP100,AI资讯

Vidu 2.0升级上线：10秒快速出片，视频风格一致性显著提升

国产视频制作神器Vidu迎来重磅更新，2.0版本正式与用户见面。新版Vidu将视频生成时间缩短至10秒，效率提升三倍，用户仅需5分钟即可制作60秒的视频内容，大幅提升创作效率。

Vidu 2.0在速度提升的同时，视频质量也得到全面升级，风格和主体一致性更加出色，帧间过渡更加平滑自然。超值套餐同步推出，创作成本极低，每秒仅需4分钱，进一步降低创作门槛。此外，Vidu 2.0提供错峰使用模式，低峰时段免费不限量，以及批量生成功能，一次性可制作四条视频，效率翻倍。

同步上线的Vidu 2.0中国站点，针对国内用户进行多项优化，注册流程简化，界面更贴合中文用户习惯，支持本地支付，操作更加便捷。

自2024年7月底全球发布，Vidu以其卓越性能和易用性，迅速吸引用户，20天破百万，100天破千万。Vidu已覆盖200多个国家和地区，累计生成视频超亿条，其中“参考生视频”功能上线三个月，视频量达千万。Vidu 2.0的推出，预示着视频创作的新时代即将到来。

Vidu 2.0升级上线：10秒快速出片，视频风格一致性显著提升

周鸿祎主演AI短剧开机，创新运用AI特效与智能硬件

360集团创始人周鸿祎近日宣布，他亲自参演的首部AI短剧在西安正式开拍，预计春节期间与观众见面，备受期待。

周鸿祎透露，这部短剧共计60集，以穿越为主题，旨在提供前所未有的观影体验。他期望通过短剧传递正能量，避免俗套剧情，为观众带来精彩纷呈的故事。

周鸿祎强调，短剧的制作将大胆采用AI技术，不仅用于特效制作，还将整合多种AI智能硬件，如无人狗、机器狗等作为道具。他欢迎企业提供道具，并承诺免费植入宣传。

该剧汇集了国内顶尖AI制作团队和知名硬件厂商，特效将由纳米AI搜索的图生视频功能完成，旨在以低成本打造高质量视觉效果。

周鸿祎表示，拍摄此短剧的目的在于推广360新推出的纳米AI搜索，旨在打造一款普及智能技术的产品，并希望通过短剧普及AI知识，缩小数字鸿沟，推动AI技术在日常生活中的应用。

周鸿祎主演AI短剧开机，创新运用AI特效与智能硬件

北京月之暗面科技推出Kimi多模态图片理解模型API

2025年1月15日，北京月之暗面科技有限公司发布了全新的多模态图片理解模型——moonshot-v1-vision-preview，进一步完善了Kimi的视觉理解能力，使其在全球多模态技术领域迈出重要一步。

这款Vision模型展现了卓越的图像识别技术，能够精确捕捉图像中的细微差异，有效区分食物、动物等相似物体。例如，它能在16张相似度高的蓝莓松饼和吉娃娃图片中，准确地进行识别和分类。

此外，Vision模型在高级图像识别方面处于国内领先地位，特别是在OCR文字识别和图像理解方面，其准确性远超传统扫描和OCR软件，能够清晰识别手写的收据和快递单。

尽管Vision模型提供了多轮对话、流式输出等多样化功能，但目前不支持联网搜索和创建含图片的Context Cache。模型接受base64编码的图片内容，但不支持URL格式图片。已创建的Cache可用来调用Vision模型，进一步拓展其应用场景。

北京月之暗面科技推出Kimi多模态图片理解模型API

科大讯飞推出星火同传大模型，翻译精度媲美人类专家

科大讯飞今日宣布，其研发的星火同传语音大模型正式亮相，这是国内首个具备端到端语音同传能力的大模型。该模型在翻译效果和响应速度上均有显著提升，开启了AI翻译技术的新篇章。

星火同传语音大模型提供了无缝、精准的同传体验。在英译中测试中，讯飞翻译机搭载该模型实现了近乎零延迟的翻译，非常适合跨国交流场景。该模型不仅提高了字幕显示速度，还确保了中英互译的精确性。

新模型支持译文长度调控，能够在翻译过程中实时进行意群切分和信息重组。结合流式语音合成技术，它还能实现韵律衔接和语速自适应，提升了翻译的自然流畅性。

在多种国际交流场合，星火同传语音大模型展现了卓越性能，其翻译的完整性、准确性和语言质量领先行业，超越了国际竞品。该模型能在5秒内完成同传，达到了专业译员的标准。

科大讯飞的这一创新，不仅标志着国内AI翻译技术的飞跃，也预示着国际交流将因技术进步而变得更加顺畅和高效。

科大讯飞推出星火同传大模型，翻译精度媲美人类专家

讯飞星火4.0 Turbo升级：数学与编程能力领先GPT-4o

科大讯飞今日宣布讯飞星火4.0 Turbo全面升级，强化了包括文本生成、语言理解等在内的七大核心能力，尤其在数学和代码能力上实现了对GPT-4o的超越。

讯飞星火4.0 Turbo在数学领域取得重大进展，通过高级算法如超长思维链、树搜索和自我反思评价，有效解决了复杂数学问题。同时，推出的星火深度推理模型X1，拥有1750亿参数，擅长处理复杂信息，提供深层次数据分析与理解，其在自然语言处理和视觉理解等领域的表现尤为出色。

科大讯飞对研发的持续投入，自2020年以来累计达125亿元，年均投入29亿元，主要聚焦于开放平台、AI虚拟人交互等前沿技术，为星火4.0 Turbo的升级提供了强大动力。

这次升级不仅体现了科大讯飞在AI领域的深厚实力，也预示着其将持续推动AI技术的发展。

讯飞星火4.0 Turbo升级：数学与编程能力领先GPT-4o

科大讯飞推出国产深度推理模型——星火X1，引领AI新突破

科大讯飞今日宣布，全新打造的讯飞星火深度推理模型X1正式亮相，这是基于国内算力平台训练的首个深度推理大模型，标志着公司在AI领域的又一里程碑。

星火X1模型以其类人的“慢思考”解题方式和高效的算力表现，在国内多项指标上位居前列，尤其在中文数学能力上表现卓越。该模型已成功应用于教育行业，与中国教育科学研究院联手打造高中数学智能教师助手，并在多地试点应用。

在教育产品线中，星火X1提升了讯飞AI学习机的学习诊断和个性化推荐功能，未来将持续优化升级。同时，医疗领域也即将迎来星火X1的深度融入，科大讯飞计划上半年推出医疗大模型升级版，以提升医疗服务效率和质量。

科大讯飞推出国产深度推理模型——星火X1，引领AI新突破

Kokoro-TTS：小型文本转语音模型荣登TTS排行榜首位

随着AI技术的飞速进步，语音合成领域迎来新秀——Kokoro-TTS。这款拥有8200万参数的模型在Hugging Face平台正式亮相，成为行业的一个重要标志。Kokoro v0.19在发布前已悄然登上TTS排行榜首位，其卓越性能超越了参数更多的竞争对手。

Kokoro模型在仅用不到100小时音频数据的情况下，实现了与大型模型相仿的语音合成效果，挑战了传统模型性能与参数规模的正比关系。用户通过简单的几行代码在Google Colab中即可体验Kokoro的高质量音频输出，支持美式和英式英语，并提供多种语音包选择。

Kokoro的训练得益于Vast.ai的A100 80GB vRAM实例，以相对低廉的成本完成了高效训练。模型训练使用了不到20个周期和不到100小时的音频数据，且所有数据均来自公有领域或开放许可证，保证了合规性。

尽管Kokoro在语音合成方面表现优异，但受限于训练数据和架构，目前尚不支持声音克隆，且主要训练数据为长篇朗读和叙述，非对话场景。

想了解更多或体验Kokoro-TTS，请访问：

模型:https://huggingface.co/hexgrad/Kokoro-82M

体验:https://huggingface.co/spaces/hexgrad/Kokoro-TTS

更多AI行业最新资讯新闻信息请关注AI 人工智能网站--AITOP100平台--AI资讯专区：https://www.aitop100.cn/infomation/index.html