AITOP100平台获悉,7月25日,科技圈迎来一则重磅消息:科大讯飞宣布基于全国产算力训练的深度推理大模型——讯飞星火X1 升级版正式上线。这一消息犹如一颗投入平静湖面的巨石,瞬间激起千层浪,引发了行业内外的广泛关注。
讯飞星火X1模型是什么?
讯飞星火X1模型是科大讯飞研发的深度推理大模型,也是当前业界全国产算力平台上唯一的深度推理模型。它基于Transformer架构,通过大规模多阶段强化学习训练方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性。
其模型参数量为70B,在数学能力上全面对标DeepSeek R1和OpenAI o1,在中文数学各项任务中均实现领先,还能通过长思维链进行分步骤解析,自我探索和反思验证。
此外,星火X1模型已应用于教育、医疗等领域,如赋能星火教师助手、讯飞晓医等,为行业提供了强大的智能支持。
讯飞星火X1升级版模型全面升级
1.综合能力,对标国际一流
此次升级,星火X1堪称“脱胎换骨”。在多个任务上持续进步,综合能力大幅提升,整体效果直接对标OpenAI o3等国内外一流大模型最新版本。特别是在翻译、推理、文本生成、数学等方面,星火 X1 展现出了强大的实力,保持领先地位。
就拿数学能力来说,在今年6月国内大模型挑战全国高考数学一卷的评测中,星火X1 - 0420版本就突破了140 分。而本次升级后,数学能力再次精进,让人不禁对它的未来表现充满期待。
2.幻觉治理大突破,应用可靠性飙升
幻觉问题一直是掣肘大模型落地应用的关键难题。不过,星火X1升级版在这方面取得了显著进步。它在大模型自身生成内容是否符合客观事实的事实性幻觉治理,以及在用户给定额外参考资料时大模型回复是否忠于原文的忠实性幻觉治理两方面,均有了明显提升。
这意味着,升级后的星火X1在行业落地应用时的可靠性大大提高,能够为用户提供更准确、更可信的信息,减少因幻觉问题带来的误导和困扰。
3.多语言能力超强大,覆盖130+语种
在全球化的今天,多语言能力对于大模型来说至关重要。星火X1升级版在这方面表现出色,多语言能力已覆盖 130 + 语种,为世界提供全栈自主可控大模型底座的“第二种选择”。无论是商务交流、文化传播还是学术研究,星火 X1 都能凭借其强大的多语言能力,打破语言障碍,促进全球信息的流通与共享。
4.语音同传大模型,多项指标行业领先
基于星火X1底座的语音同传大模型也有了大幅跃升。它采用了业界首创基于文本自适应调度的流式语音合成技术,让“译”与“说”无缝耦合,在语音听感上的自然度、拟人度和舒适度显著提升。
在翻译效果上,新版本同传大模型更是表现惊艳。基于内容完整度、信息准确度、语言质量等多方面主客观评价计算翻译综合质量得分(分值0-100 分),效果较 2025年1月首发版本提升20%。特别是在多人会议等复杂场景中英双向翻译得分可达80分以上,单人演讲翻译得分超90分,有效消除了传统同传的碎片化割裂感。
此外,新模型还具备智能双语识别功能,能够自动识别中英文混合发言并实时切换翻译方向。在双边会议、国际商务洽谈等中英交替的场景中,参会者可以随时用母语发言,有效避免了因语言切换操作而造成的交流中断。目前,最新语音同传大模型已经在讯飞双屏翻译机2.0、讯飞AI录音笔、讯飞同传等产品中全面上线。
行业应用再拓展,解决关键刚需
得益于星火X1模型的升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体也取得了新的进步。在复杂行业场景任务上,进一步解决了用户的关键刚需。
以面向软件研发提质增效的星火代码大模型为例,它有效提升了项目级代码理解与生成、单元测试智能体、WEB应用对话式编程等核心任务表现。目前,星火代码大模型已深度赋能金融、制造、能源、科技等100余家关键领域客户,在典型应用场景中驱动研发效率提升超过50%,为软件研发行业带来了新的发展机遇。
讯飞星火X1升级版官网
星火X1最新升级的能力可直接在讯飞星火网页版和App进行体验,全新API也已同步上线讯飞开放平台。无论你是科技爱好者、行业从业者还是普通用户,都能轻松体验到星火X1升级版带来的便捷与高效。
如果你对讯飞星火 X1 感兴趣,不妨通过以下官方地址进行深入了解:
体验地址:讯飞星火X1网页版官网
相信随着讯飞星火 X1 升级版的上线,它将在更多领域发挥重要作用,为我们的生活和工作带来更多惊喜与改变。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: