• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

每日AI资讯-2025年07月14日

每日AI资讯-2025年07月14日
AI TOP100
1天前

硅基流动上线Kimi K2:万亿参数编码模型太能打,开发者速来领14元试用金

最近,硅基流动平台悄悄上架了一款让开发者们眼前一亮的工具——月之暗面开源的Kimi K2模型。这款模型可不得了,总参数直接干到1万亿,激活参数320亿,在各种性能测试里表现得相当生猛,完全能和那些顶尖的商业模型掰掰手腕。

咱先说说它最实用的点:支持128K的最大上下文长度。这意味着啥?就是不管你扔过去多长的代码、多复杂的文档,它都能一口气“吃透”,不用像有些模型那样读一半就“断片”。价格方面也挺实在,输入每百万个Tokens只要4元,输出是16元,新用户注册完直接送14元试用金,不管是国内用户点国内站链接,还是国际用户去国际站链接,都能立马上手试试。

为啥Kimi K2这么厉害?背后有三个硬实力撑着。首先是训练数据够多,在15.5T Tokens的海量数据里“泡”过,基础打得特别牢;其次是用了MuonClip优化器,就算模型规模再大,运行起来也稳得一批,不会动不动就“掉链子”;最后是它天生就为工具调用、逻辑推理和自主解决问题设计的,干起编码和智能体任务来,简直是如鱼得水。

用户们用下来反馈也特别好,有人说它能一次性搞定网页版Minecraft的开发,能力远超其他模型;连Perplexity的创始人Aravind Srinivas都在内部评估后夸个不停,说很快会基于它做后续训练。如果你是开发者,这款模型绝对值得放进工具箱里。

体验地址:硅基流动网页端官网入口

硅基流动,Kimi K2

Liquid AI开源LFM2:边缘设备跑AI速度翻倍,手机笔记本都能轻松hold住

Liquid AI最近放出了个大招——正式开源新一代Liquid Foundation Models(LFM2),这玩意儿一出来,直接把边缘AI的速度和效率抬到了新高度,手机、笔记本、汽车这些边缘设备用AI再也不用卡半天了。

LFM2一共有350M、700M和1.2B三个参数版本,别看参数不算特别大,但本事可不小。它跟传统的Transformer模型不一样,用了个叫“结构化自适应算子”的创新架构,这就让它在训练效率和推理速度上有了质的飞跃。具体有多快?官方说推理速度比Qwen3快2倍,训练速度比自家之前的模型快3倍,就算是在资源有限的边缘设备上,处理长文本、复杂任务也照样流畅。

而且LFM2不光快,活儿还干得好。在指令跟随、函数调用这些关键任务上,性能比同规模的模型高出一大截,特别适合本地化的AI应用。更重要的是,它能在设备本地处理数据,不用上传到云端,对于那些注重隐私的场景来说,简直是量身定做的。

现在Liquid AI把LFM2的模型权重全公开了,开发者去Hugging Face就能下载,还能在Liquid Playground上测试。这事儿还有个小亮点——这是美国企业第一次在高效小型语言模型领域,公开超越了阿里巴巴、字节跳动这些中国公司的开源模型,可见技术实力确实硬。接下来,他们还计划把LFM2装进边缘AI平台和即将推出的iOS原生应用里,以后咱们用手机玩AI,体验肯定会更上一层楼。

huggingface地址:https://huggingface.co/collections/LiquidAI/lfm2-686d721927015b2ad73eaa38

Liquid AI

智源开源RoboBrain 2.0和RoboOS 2.0:机器人变聪明还能组队,10项评测破纪录

智源研究院最近搞了个大动作,正式发布了具身智能系统的新成果——RoboBrain 2.0(32B版本)和跨本体大小脑协同框架RoboOS 2.0单机版,而且全都开源了,模型权重、训练代码、评测基准啥的,开发者都能拿到手。

先说说RoboBrain 2.0,这玩意儿堪称机器人的“通用具身大脑”,把感知、推理、规划能力全揉到一块儿去了。跟之前的7B版本比,它的时空认知能力强了不是一星半点,在真实的物理环境里,不管是复杂的空间布局,还是需要长期规划的任务,它都能轻松应对。比如说,机器人要在堆满杂物的房间里找到并移动某个物品,它能精准理解空间结构,一步步规划出最优路径,这背后全靠它那强大的空间理解、长期规划和长链推理能力。

再看RoboOS 2.0,这可是全球首个具身智能SaaS开源框架,用了无服务器架构,部署起来特别轻巧。它最牛的地方是能让智能大脑和不同类型的机器人高效协作,让机器人从“单打独斗”变成“群体智能”。就像咱们用手机APP商店下载软件一样,开发者和用户能在RoboSkill技能商店里,轻松获取各种机器人技能模块,直接适配自己的机器人,上手特别快。

性能方面更不用多说,RoboBrain 2.0靠着多模态数据集和分阶段训练策略,在好几个权威评测基准里都刷新了纪录,空间和时间推理能力那是实打实的强。有了这俩新工具,机器人以后在复杂环境里自主决策、高效干活肯定越来越厉害,具身智能的应用也会越来越广。

详情查看地址:智源开源RoboBrain 2.0与RoboOS 2.0:具身智能迎来“双核驱动”新时代

RoboOS 2.0

PixVerse“拍我AI”上新多关键帧生成:7张图变连贯视频,短剧、产品演示轻松搞定

全球用户量突破6000万的AI视频创作平台“拍我AI”(PixVerse),7月11日搞了个大升级——在首尾帧模块里加了个“多关键帧生成”功能,这一下,AI视频创作算是从只能生成单一“片段”,正式迈入能搞“故事性表达”的新阶段了。

这个新功能具体咋用?简单来说,用户现在可以通过网页端的首尾帧功能,最多上传7张图片当关键帧,然后AI就会自己琢磨这几张图之间的语义关系,智能补全中间的动作和场景转换,让整个视频流畅得就像专业团队剪出来的一样。

举几个例子你就明白了:要是你想展示一款新产品,把产品不同角度的图片传上去,AI能直接生成360度旋转的动画,全方位展示产品细节;要是你想拍个小短剧,画几张分镜头草图放进去,它能快速变成有起承转合的完整短片。更厉害的是,它还会模仿导演的镜头语言,该给角色特写的时候给特写,该拉全景展示场景的时候拉全景,完全不用你操心。

爱诗科技的创始人兼CEO王长虎博士说,这个功能通过精准定义起始、转折和结束帧,不光让角色动作、场景转换衔接得自然,还大大提升了电影预告、小说动漫改编、广告剧情短片这些高叙事需求领域的创作效率。现在“拍我AI”国内版已经支持中、英、日、韩、法等9国语言,不少用户用它把家人的成长照片、合影做成了人生回忆录、明星成长史之类的内容。这次功能升级后,普通人想当“生活导演”,真的是分分钟的事儿了。

体验地址:拍我AI网页端官网入口

拍我AI

通义千问Qwen Chat出桌面客户端:一键唤起MCP,写文案、做网页都方便

通义千问的Qwen Chat最近迎来了一次大更新,不光界面和功能大升级,还推出了桌面客户端,用起来比以前顺手多了,说是想成为每个人身边最得力的AI搭档,这话听着还真不是吹牛。

先说说交互设计,以前用着可能还得点几下才能开始聊天,现在打开首页就能直接对话,操作简单得很,哪怕是不太会用科技产品的人,也能轻松上手。功能方面更是加量不加价,日常提问、查个资料啥的肯定不在话下,帮着写文章、生成文案这些创作类的活儿,它也能给你不少灵感和素材,简直是个移动的“创意库”。

这次更新还加了几个特别实用的功能:“深入研究”能帮你把一个话题挖得更透;“图像生成”可以根据你的描述画出图片;“网页开发”能辅助你搭建网页;“深度思考”模式适合分析复杂问题;“搜索”功能则能实时获取最新信息,不管你是学生、上班族还是创作者,估计都能用到。

最让人惊喜的是桌面客户端的推出,下载安装后,能一键唤起MCP,直接调用Qwen Chat的各种功能,不管你是在写Word文档,还是在做PPT,随时都能让AI来搭把手,无缝衔接,效率高得很。对了,现在去qwen.ai,还能轻松拿到相关的论文、技术博客和模型API,想深入研究AI的朋友,这下资料不用愁了。

体验地址:通义千问大模型官网入口

Qwen Chat

Perplexity CEO夸Kimi K2模型:表现太亮眼,可能拿去接着训练

美国人工智能初创公司Perplexity的首席执行官阿拉温德·斯里尼瓦斯(Aravind Srinivas),最近在社交媒体上发了条消息,说他们公司对“月之暗面-kimi ai”刚推出的Kimi K2模型特别看好,以后说不定会基于这个模型做进一步的训练,这话一出,不少人都开始关注Kimi K2了。

那Kimi K2到底是啥来头?它是“月之暗面”发布的首个万亿参数开源模型,主要专攻代码生成和通用智能代理(Agent)任务。光说不练假把式,看测试数据就知道它有多能打:在SWE Bench Verified(代码任务评测)、Tau2(推理能力评测)、AceBench(智能代理评测)这些权威基准测试里,成绩都特别拔尖,不管是写代码、做智能代理,还是搞数学推理,能力都处在第一梯队。

再看看它的架构,用了混合专家(MoE)设计,总参数量达到1万亿,激活参数320亿,这种规模让它在处理复杂任务时,能调动更多“资源”,自然表现更出色。其实Perplexity之前就用过DeepSeek R1模型做训练,这次阿拉温德公开称赞Kimi K2,也从侧面说明这个模型确实有过人之处。

随着AI技术发展越来越快,像Kimi K2这样的开源模型能得到国际大厂的认可,不仅能提升“月之暗面”在开源模型领域的竞争力,也可能给Perplexity的未来发展带来新机会,说不定过阵子,咱们就能看到基于Kimi K2的创新应用了。

详情查看:Perplexity CEO点赞Kimi K2模型,AI领域合作新信号引关注

Kimi K2

影视级TTS神器IndexTTS2来了:克隆声音带情绪,还能卡着时间配音

最近有个叫IndexTTS2的文本转语音大模型火了,据说生成的语音能达到影视级水准,不管是克隆别人的声音,还是控制语音的情绪,甚至是卡着时间配音,它都能轻松搞定,不少业内人都说这是TTS技术的大突破。

先说说它最让人惊艳的“零样本语音克隆”,你只要给一段音频(不管啥语言),它就能把说话人的音色、语气、节奏学得惟妙惟肖,比现在流行的MaskGCT、F5-TTS这些模型还像,哪怕是细微的发音习惯都能模仿出来,用来做虚拟主播、个性化语音助手,效果绝对逼真。

更绝的是它的情绪控制能力,全球首创了“零样本情绪克隆”和“文本情绪控制”。前者是说,你给一段带情绪的音频(比如生气的怒吼、害怕的低语),它就能学着生成同样情绪的语音;后者更方便,不用音频,直接在文本里写“温柔点说”“愤怒地讲”,它就懂了,这对于需要丰富情感表达的场景来说,简直是福音。

还有个特别实用的功能——精准时长控制,也是全球首创。你可以指定生成音频的具体时长,比如10秒、20秒,这对于电影配音、视频旁白这些需要音画严格同步的场景来说,太重要了;要是不想费心,也能选自由长度模式,让模型自己根据文本内容定时长。

现在IndexTTS2支持英语和中文,以后还会加更多语言。它用了先进的自回归架构,结合了文本到语义、语义到梅尔频谱、声码器这些核心模块,还跟大语言模型深度融合,生成的语音自然又稳定。最关键的是,开发团队计划把模型权重和推理代码都公开,到时候不管是个人开发者还是企业,都能轻松用起来,估计配音界要因为它变天了。

详情查看:影视级TTS新星登场!IndexTTS2:零样本克隆+情绪控制,重塑配音新体验



想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

AITOP100平台大赛社群二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
相关AI工具
  • 硅基流动:AI人工智能云服务平台
  • Kimi ai:人工智能助手
  • DeepSeek‌:深度求索AI大模型
相关资讯
  • 每日AI资讯-2025年07月15日

  • 每日AI资讯-2025年07月14日

  • 每日AI资讯-2025年07月11日

  • 每日AI资讯-2025年07月10日

  • 每日AI资讯-2025年07月09日

热点资讯

夸克AI助力高考志愿填报,4000万考生家长的靠谱之选

7天前
夸克AI助力高考志愿填报,4000万考生家长的靠谱之选

豆包AI重磅更新:六大核心功能全面升级,开启智能办公新纪元

8天前
豆包AI重磅更新:六大核心功能全面升级,开启智能办公新纪元

AI助手市场洗牌:DeepSeek流量腰斩,KIMI陷入沉默期,夸克异军突起用户规模突破2亿

6天前
AI助手市场洗牌:DeepSeek流量腰斩,KIMI陷入沉默期,夸克异军突起用户规模突破2亿

Grok 4即将发布:马斯克xAI最新AI模型全面解析

7天前
Grok 4即将发布:马斯克xAI最新AI模型全面解析

AIGC大赛:北京动画周48小时AIGC原创动画挑战赛,邀您共赴创意盛宴!

5天前
AIGC大赛:北京动画周48小时AIGC原创动画挑战赛,邀您共赴创意盛宴!
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有