AI大战超级玛丽,Claude 3.7封神
在AI界的一场别开生面的“马力欧”大乱斗中,Anthropic旗下的Claude 3.7模型脱颖而出,力压群雄,成为“最强AI马力欧”。这场争霸赛在一个高科技模拟器中展开,AI通过GamingAgent框架与游戏世界相连,化身“马力欧”进行挑战。
令人惊讶的是,以推理能力著称的AI模型如GPT-4o在此次比赛中表现不佳,原因在于它们反应太慢,无法适应《超级马力欧兄弟》这种分秒必争的实时游戏。相反,Claude 3.7凭借其迅速的反应和精准的操作,成功登顶。
这场AI与经典游戏的较量,不仅展示了AI技术的日新月异,也引发了人们对AI在游戏领域应用潜力的思考。未来,AI或许真的能“统治”游戏界,成为超越人类玩家的“真·王者”。
Claude 3.7模型地址》》》详情查看
飞猪推出AI行程助手,旅游规划新里程碑
飞猪宣布将于3月5日正式推出在线旅游行业首个融合多个大模型的AI产品——“AI行程助手”。该产品集成了DeepSeek-R1和阿里云通义千问的主力模型,能够秒级响应用户需求,生成高度个性化的旅行方案。
AI行程助手不仅能处理简单的行程查询,还能应对复杂需求,如“五天深度游西安”等。其多模型融合和快速响应的特点,被视为AI技术在旅游行业落地的新里程碑。用户对此充满期待,认为这将彻底颠覆旅游规划方式。
飞猪表示,AI行程助手将在4月前迎来密集更新,优化多语言支持、实时数据整合等功能,为在线旅游服务树立新标杆。
Stability AI与Arm合作,推出离线生成音频技术
Stability AI与Arm展开合作,将生成音频AI能力引入移动设备。通过优化Stable Audio Open模型,用户可以在Arm CPU上快速生成音效、音频样本等,且无需互联网连接。
这一技术提升了创作效率,使生成性AI在企业和专业创作者中的应用更加便捷。未来,Stability AI还计划将其在图像、视频等领域的模型都带到边缘设备,彻底改变移动设备上的视觉媒体创作方式。
Stability A工具地址》》》详情查看
可灵AI正式登陆Android平台
备受期待的KLING AI Android移动应用程序终于全面上线。这款应用集成了Frames、Elements等核心功能,为用户提供便捷的AI创意体验。
KLING AI以其高效和创新赢得了全球创作者的青睐。现在,这些功能通过移动端触手可及,进一步提升了用户的使用便利性。KLING AI团队的这一举措标志着他们迈向“让创意无处不在”的新里程碑。
KLING AI(可灵AI国际版)地址》》》详情查看
Spotify推出AI音乐创作工具
Spotify正在开发一款名为“Music Pro”的新服务,其中包含一系列AI音乐创作工具。这一创新将让用户从被动的听众转变为主动的音乐创作者。
Spotify一直致力于利用AI技术提升用户体验,从早期的“新音乐”播放列表到近年的“混合”播放列表,再到AI DJ功能,不断推陈出新。未来,用户将能对喜欢的歌曲进行个性化重混,改变节奏、重构风格或更换演唱者声音。
Spotify正与艺术家、唱片公司等进行广泛谈判,旨在启动“Streaming2.0”的新时代,为用户提供更丰富的音乐体验。
GPT-4.5崛起仅六小时便失宠
OpenAI的GPT-4.5模型发布后仅六小时便成功登顶人工智能竞技场,但随后被马斯克的xAI Grok-3模型反超。尽管两者票数相近,但Grok-3在特定任务上略有优势。
这场“六小时逆转”引发了用户质疑,但业内人士解释称,竞争榜单设有投票门槛,两款模型能够同步达到标准实属巧合。GPT-4.5在发布初期虽面临负面评价,但其高情商表现逐渐获得用户认可。
此外,GPT-4.5还在一场“大模型狼人杀”游戏中展现出超越人类的优秀表现,预示着人工智能竞争的愈加激烈。
智谱发布首个能生成汉字的开源文生图模型
智谱华章科技有限公司宣布推出首个支持生成汉字的开源文生图模型——CogView4。该模型在DPG-Bench基准测试中排名第一,成为开源文生图模型中的SOTA。
CogView4具备强大的复杂语义对齐和指令跟随能力,支持中英双语输入,并能生成任意分辨率的图像。技术上,它采用了具备双语能力的GLM-4encoder和二维旋转位置编码等先进技术。
此外,CogView4还突破了传统固定token长度的限制,显著减少了训练过程中的文本token冗余。该模型遵循Apache2.0协议,后续将陆续增加生态支持和微调工具包。
智谱AI大模型地址》》》详情查看
超强视频生成模型Wan2.1GP发布
DeepBeepMeep团队在GitHub上发布了针对低端GPU用户优化的视频生成模型——Wan2.1GP。该模型基于阿里巴巴的Wan2.1,旨在为缺乏高性能GPU资源的用户提供强大的视频生成能力。
Wan2.1GP在多个基准测试中持续超越现有开源模型和商业解决方案,展现出强大竞争力。其T2V-1.3B模型仅需8.19GB显存,几乎所有消费级GPU都能运行。
该模型不仅支持文本到视频、图像到视频等多种任务,还是首个能同时生成中英文文本的视频模型。此外,它还搭载了强大的视频变分自编码器(VAE),为视频和图像生成打下了坚实基础。随着版本更新,Wan2.1GP也逐步加入了更多实用功能,提高生成速度和使用便利性。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html