Radical Numerics发布30B参数开源扩散语言模型RND1
近日,AI研究机构Radical Numerics有大动作啦!
10月10日,他们正式发布了RND1-Base,这可是目前最大规模的开源扩散语言模型呢。它的参数规模达到了30B,其中活跃参数为3B,采用了稀疏专家混合架构。
RND1-Base是基于Qwen3-30BA3B的自回归基础模型,通过简单的连续预训练,实现了向扩散范式的无缝转型。这个过程中,采用了双向掩码机制和特定于层的学习率,保留了原有知识,还使用了高达8M标记的大批量训练来确保稳定性,最终在500B标记上完成预训练。
和传统的自回归语言模型不同,RND1把文本生成看成是类似图像去噪的过程,能从噪声中并行精炼整个序列,支持双向注意力机制。在通用基准测试中,RND1-Base的表现相当出色,超越了Dream-7B和LLaDA-8B等开源扩散语言模型前辈。Radical Numerics还开源了完整权重、训练配方和推理代码,看来是想加速扩散语言模型领域的研究呀。
模型地址: https://huggingface.co/radicalnumerics/RND1-Base-0910
蚂蚁集团开源高性能扩散语言模型推理框架dInfer
10月13日,蚂蚁集团干了一件大事,他们正式开源了业内首个高性能扩散语言模型推理框架dInfer。
扩散语言模型把文本生成当作从随机噪声中逐步恢复完整序列的去噪过程,有高度并行、全局视野和结构灵活等优势。不过,之前它在推理效率方面一直不太理想。
而蚂蚁集团的dInfer可厉害了,在基准测试中,它把扩散语言模型的推理速度相比英伟达扩散模型框架Fast-dLLM提升了10.7倍。在代码生成任务HumanEval上,dInfer在单批次推理中创造了1011Tokens/秒的速度,首次在开源社区中实现了扩散语言模型的单批次推理速度显著超越自回归模型。
dInfer是一款专为扩散语言模型设计的、算法与系统深度协同的高性能推理框架,包含模型接入、KV缓存管理器、扩散迭代管理器和解码策略四大核心模块。蚂蚁集团这次开源dInfer,可是诚邀全球的开发者与研究者共同探索扩散语言模型的巨大潜能呢。
详情查看:蚂蚁集团开源dInfer,突破扩散语言模型推理瓶颈
Claude Code推出全新插件系统,提升开发效率
Anthropic的AI编程助手Claude Code最近有新动作啦,它正式推出了全新的“插件(Plugins)”系统,目前已经进入公开测试阶段。
这个插件系统主要包括四类核心组件,分别是斜杠命令、子代理、模型上下文协议服务器和钩子。
- 斜杠命令能让用户快速执行一些常用操作,简化工作流程。
- 子代理是为特定开发任务量身定制的专用AI助手,可以提供更精准的支持。
- 模型上下文协议服务器能够安全地连接外部工具、数据库或内部系统,保证信息传递的安全和有效。
- 钩子则允许用户在关键步骤中自定义Claude Code的行为,满足不同项目的特定需求。
用户在Claude Code中只要通过/plugin命令,就可以轻松安装、启用或禁用插件。Anthropic还计划推出“插件市场”,让团队和社区可以集中管理和分享插件。目前,已经有多个社区示例插件可供使用,Anthropic自身也发布了一系列官方插件。这次更新被广泛认为是提升开发者工作效率的重要一步哦。
模型地址Cluade Code
2025全球十大工程成就揭晓,DeepSeek入选
近日,由中国工程院院刊《Engineering》主办的“2025全球十大工程成就”评选结果正式公布啦。
这次评选出来的十大工程成就包括毅力号火星探测器、欧几里得空间望远镜、全海深载人潜水器、南水北调中线工程、塔克拉玛干沙漠锁边工程、Blackwell GPU架构、DeepSeek开源大语言模型、高性能碳纤维复合材料、人形机器人以及抗体偶联药物。
其中,Blackwell GPU架构因为在并行计算设计和超高规模集成能力上的创新,大大提升了人工智能的计算效率和能效比,为万亿参数的大模型训练与推理提供了核心支撑。DeepSeek开源大语言模型则通过先进的算法架构和开放的协作生态,推动了人工智能技术的普及与行业的深度融合。这些成就充分体现了当代工程科技的不断创新与进步,为人类的可持续发展提供了强有力的支持。
体验地址:DeepSeek在线体验
Qoder推出“一键增强提示词”功能,助力开发者提升编码效率
对于开发者来说,构思和撰写提示词常常是一件很头疼的事情,耗费时间不说,还不一定能得到理想的代码输出。不过现在好了,Qoder近期推出了全新的“一键增强提示词”功能。
有了这个功能,开发者只需点击“增强”按钮,系统就能自动把模糊的指令转化为具体的任务描述。比如,当用户输入“用requests库爬取某个网页的标题”时,系统会将其增强为“使用Python的requests库编写一个网络爬虫,用于获取指定网页的HTML标题,要求处理可能的网络异常,并在获取标题后将其打印输出。”
Qoder能够识别模糊描述,明确需求,补充关键约束条件,并根据项目上下文提供针对性的优化。这个功能不仅提升了开发效率,节省了开发者反复修改提示词的时间,还降低了编程的使用门槛,无论是新手还是资深开发者,都能借此释放AI的全部潜力,写出更高质量的代码。
详情查看:告别模糊指令:Qoder v0.2.5“一键增强提示词”,提升AI代码生成质量
通义千问和豆包开启记忆功能内测,对标ChatGPT
最近,科技界有个新消息,阿里巴巴的“通义千问”和字节跳动的“豆包”相继启动了记忆功能的内测。
OpenAI早在今年4月就推出了ChatGPT的记忆功能,而“通义千问”和“豆包”这次几乎在同一时间亮相记忆功能,说明国内大模型应用有了很大进步,开始更注重提升用户体验了。
参与灰度测试的用户透露,“通义千问”的记忆功能已经在小范围内上线,其交互逻辑直观且易于操作,用户可以主动触发记忆功能,并由AI进行确认和存储。“豆包”也不甘示弱,其官网在10月10日更新了《隐私政策》,并上线了《记忆功能FAQ》页面,详细阐述了记忆功能的使用范围,用户拥有绝对控制权。看来,国内AI助手正在加速适应市场需求,未来用户和它们的互动将会更加个性化,使用体验也会更贴心。
体验地址1:通义千问大模型官网
体验地址2:豆包AI网页版官网
OpenAI的Sora已正式登陆安卓平台,北美已开启预注册
近日,有消息称OpenAI的流行AI视频生成应用Sora即将正式登陆安卓平台啦。
目前,虽然Sora在谷歌Play商店中已经出现了,但是还处于不可用状态,用户暂时还不能下载使用。和它在苹果iOS App Store上的推出策略类似,Sora在iOS上的初期发布仅限于美国和加拿大,现在谷歌Play上的预注册也只对这两个北美国家开放。
Sora by OpenAI是一款很受关注的视频生成应用,用户可以通过人工智能技术创建和编辑视频。自推出以来,它在iOS平台上的表现非常亮眼,短短几天内就迅速突破了100万次下载。随着应用的流行,越来越多的用户希望它能扩展到更多平台,现在看来,Sora离正式发布在安卓平台上的日子越来越近了,大家是不是很期待呢?
详情查看:OpenAI的Sora正式登陆安卓,预注册已在北美打响
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: