Vidu 2.0升级上线:10秒快速出片,视频风格一致性显著提升
国产视频制作神器Vidu迎来重磅更新,2.0版本正式与用户见面。新版Vidu将视频生成时间缩短至10秒,效率提升三倍,用户仅需5分钟即可制作60秒的视频内容,大幅提升创作效率。
Vidu 2.0在速度提升的同时,视频质量也得到全面升级,风格和主体一致性更加出色,帧间过渡更加平滑自然。超值套餐同步推出,创作成本极低,每秒仅需4分钱,进一步降低创作门槛。此外,Vidu 2.0提供错峰使用模式,低峰时段免费不限量,以及批量生成功能,一次性可制作四条视频,效率翻倍。
同步上线的Vidu 2.0中国站点,针对国内用户进行多项优化,注册流程简化,界面更贴合中文用户习惯,支持本地支付,操作更加便捷。
自2024年7月底全球发布,Vidu以其卓越性能和易用性,迅速吸引用户,20天破百万,100天破千万。Vidu已覆盖200多个国家和地区,累计生成视频超亿条,其中“参考生视频”功能上线三个月,视频量达千万。Vidu 2.0的推出,预示着视频创作的新时代即将到来。
周鸿祎主演AI短剧开机,创新运用AI特效与智能硬件
360集团创始人周鸿祎近日宣布,他亲自参演的首部AI短剧在西安正式开拍,预计春节期间与观众见面,备受期待。
周鸿祎透露,这部短剧共计60集,以穿越为主题,旨在提供前所未有的观影体验。他期望通过短剧传递正能量,避免俗套剧情,为观众带来精彩纷呈的故事。
周鸿祎强调,短剧的制作将大胆采用AI技术,不仅用于特效制作,还将整合多种AI智能硬件,如无人狗、机器狗等作为道具。他欢迎企业提供道具,并承诺免费植入宣传。
该剧汇集了国内顶尖AI制作团队和知名硬件厂商,特效将由纳米AI搜索的图生视频功能完成,旨在以低成本打造高质量视觉效果。
周鸿祎表示,拍摄此短剧的目的在于推广360新推出的纳米AI搜索,旨在打造一款普及智能技术的产品,并希望通过短剧普及AI知识,缩小数字鸿沟,推动AI技术在日常生活中的应用。
北京月之暗面科技推出Kimi多模态图片理解模型API
2025年1月15日,北京月之暗面科技有限公司发布了全新的多模态图片理解模型——moonshot-v1-vision-preview,进一步完善了Kimi的视觉理解能力,使其在全球多模态技术领域迈出重要一步。
这款Vision模型展现了卓越的图像识别技术,能够精确捕捉图像中的细微差异,有效区分食物、动物等相似物体。例如,它能在16张相似度高的蓝莓松饼和吉娃娃图片中,准确地进行识别和分类。
此外,Vision模型在高级图像识别方面处于国内领先地位,特别是在OCR文字识别和图像理解方面,其准确性远超传统扫描和OCR软件,能够清晰识别手写的收据和快递单。
尽管Vision模型提供了多轮对话、流式输出等多样化功能,但目前不支持联网搜索和创建含图片的Context Cache。模型接受base64编码的图片内容,但不支持URL格式图片。已创建的Cache可用来调用Vision模型,进一步拓展其应用场景。
科大讯飞推出星火同传大模型,翻译精度媲美人类专家
科大讯飞今日宣布,其研发的星火同传语音大模型正式亮相,这是国内首个具备端到端语音同传能力的大模型。该模型在翻译效果和响应速度上均有显著提升,开启了AI翻译技术的新篇章。
星火同传语音大模型提供了无缝、精准的同传体验。在英译中测试中,讯飞翻译机搭载该模型实现了近乎零延迟的翻译,非常适合跨国交流场景。该模型不仅提高了字幕显示速度,还确保了中英互译的精确性。
新模型支持译文长度调控,能够在翻译过程中实时进行意群切分和信息重组。结合流式语音合成技术,它还能实现韵律衔接和语速自适应,提升了翻译的自然流畅性。
在多种国际交流场合,星火同传语音大模型展现了卓越性能,其翻译的完整性、准确性和语言质量领先行业,超越了国际竞品。该模型能在5秒内完成同传,达到了专业译员的标准。
科大讯飞的这一创新,不仅标志着国内AI翻译技术的飞跃,也预示着国际交流将因技术进步而变得更加顺畅和高效。
讯飞星火4.0 Turbo升级:数学与编程能力领先GPT-4o
科大讯飞今日宣布讯飞星火4.0 Turbo全面升级,强化了包括文本生成、语言理解等在内的七大核心能力,尤其在数学和代码能力上实现了对GPT-4o的超越。
讯飞星火4.0 Turbo在数学领域取得重大进展,通过高级算法如超长思维链、树搜索和自我反思评价,有效解决了复杂数学问题。同时,推出的星火深度推理模型X1,拥有1750亿参数,擅长处理复杂信息,提供深层次数据分析与理解,其在自然语言处理和视觉理解等领域的表现尤为出色。
科大讯飞对研发的持续投入,自2020年以来累计达125亿元,年均投入29亿元,主要聚焦于开放平台、AI虚拟人交互等前沿技术,为星火4.0 Turbo的升级提供了强大动力。
这次升级不仅体现了科大讯飞在AI领域的深厚实力,也预示着其将持续推动AI技术的发展。
科大讯飞推出国产深度推理模型——星火X1,引领AI新突破
科大讯飞今日宣布,全新打造的讯飞星火深度推理模型X1正式亮相,这是基于国内算力平台训练的首个深度推理大模型,标志着公司在AI领域的又一里程碑。
星火X1模型以其类人的“慢思考”解题方式和高效的算力表现,在国内多项指标上位居前列,尤其在中文数学能力上表现卓越。该模型已成功应用于教育行业,与中国教育科学研究院联手打造高中数学智能教师助手,并在多地试点应用。
在教育产品线中,星火X1提升了讯飞AI学习机的学习诊断和个性化推荐功能,未来将持续优化升级。同时,医疗领域也即将迎来星火X1的深度融入,科大讯飞计划上半年推出医疗大模型升级版,以提升医疗服务效率和质量。
Kokoro-TTS:小型文本转语音模型荣登TTS排行榜首位
随着AI技术的飞速进步,语音合成领域迎来新秀——Kokoro-TTS。这款拥有8200万参数的模型在Hugging Face平台正式亮相,成为行业的一个重要标志。Kokoro v0.19在发布前已悄然登上TTS排行榜首位,其卓越性能超越了参数更多的竞争对手。
Kokoro模型在仅用不到100小时音频数据的情况下,实现了与大型模型相仿的语音合成效果,挑战了传统模型性能与参数规模的正比关系。用户通过简单的几行代码在Google Colab中即可体验Kokoro的高质量音频输出,支持美式和英式英语,并提供多种语音包选择。
Kokoro的训练得益于Vast.ai的A100 80GB vRAM实例,以相对低廉的成本完成了高效训练。模型训练使用了不到20个周期和不到100小时的音频数据,且所有数据均来自公有领域或开放许可证,保证了合规性。
尽管Kokoro在语音合成方面表现优异,但受限于训练数据和架构,目前尚不支持声音克隆,且主要训练数据为长篇朗读和叙述,非对话场景。
想了解更多或体验Kokoro-TTS,请访问:
模型:https://huggingface.co/hexgrad/Kokoro-82M
体验:https://huggingface.co/spaces/hexgrad/Kokoro-TTS
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html