DeepSeek 强势来袭,手机端首秀花落华为
春节假期,AI 领域最受关注的莫过于国产 AI 黑马 DeepSeek。它以低成本实现了媲美 OpenAI 的性能,凭借强大的中文能力和开源精神,迅速走红。国内各大平台纷纷接入 DeepSeek,而华为则抢先一步,将其集成到了手机端,率先体验了 DeepSeek 的强大能力。
在小艺助手更新至 11.2.10.310 版本后,DeepSeek 正式入驻智能体广场。
进入小艺助手 App,在“发现”页面即可看到 DeepSeek 的身影。从封面信息可知,此次集成的是 DeepSeek R1 的 Beta 版本。
与 DeepSeek 官方应用相比,华为小艺的 DeepSeek-R1 Beta 界面简洁,风格统一。上半部分是 DeepSeek 的自我介绍和预设问题,下半部分是对话框,支持语音输入,方便用户操作。
点击 DeepSeek 头像,进入详情页,可以看到更详细的介绍:“我是基于 DeepSeek 开源版本部署的智能体,旨在帮助鸿蒙用户获得深度思考体验。”
小艺版 DeepSeek-R1 Beta 仅支持简单的设置,例如智能体音色、清除上下文和删除对话记录。这意味着无法新建对话框,只能通过清除上下文和删除记录来重新开始。
体验前须知
- 华为小艺接入的 DeepSeek-R1 Beta 仅在纯血鸿蒙版本的小艺助手中提供,鸿蒙 4.3 用户暂无法体验。
- 小艺版 DeepSeek 支持深度思考功能,但不提供详细的思考过程。
- 对话框中没有联网搜索选项,但答案有时会显示参考的在线网页。
- 回答问题后,会提供一些拓展选项,方便用户进一步追问。
上下文长度:日常使用基本满足
上下文长度是衡量 AI 性能的重要指标。它指的是大语言模型在处理文本时,能够同时考虑和记住的文本长度。如果上下文长度不够,AI 可能会忘记之前说过的话。
虽然小艺接入的 DeepSeek-R1 Beta 没有公开上下文长度数据,但可以通过简单测试来了解。
我尝试输入《三国演义》前三回(约一万五千字),要求其输出最后一百字。多次尝试均失败。缩短到第一回(约四千五百字)时,依然失败。最终,我选择了一篇新闻稿,节选约 700 字的内容,才成功输出。
这个长度基本满足日常简单问题的交流,但进行深入对话则比较困难。
输出质量:与完整版R1存在差异
为了测试输出质量,我选择了一系列问题,包括 AI 容易误解的问题和日常需求的可行性问题。
“9.11 和 9.8 哪个大”以及“Strawberry 里有几个 r”是常规测试项目。
令人意外的是,在“Strawberry 里有几个 r”这个问题上,华为小艺接入的 DeepSeek-R1 Beta 竟然给出了错误的答案,即使在给出参考来源的情况下,仍然出现了错误。而 DeepSeek 官方应用则给出了正确答案,并准确指出了 r 的位置。
此外,小艺接入的 DeepSeek 隐藏了 R1 模型的思考过程。虽然这个过程在大多数时候并不影响答案,但能够展示思考过程的 AI 显然更令人信服。
为了进一步测试,我将电车难题交给了两个 DeepSeek。DeepSeek-R1 Beta 没有出现错误,详细介绍了两个选择的后果,并从不同角度进行了分析。
我又提出了一个更有难度的逻辑题:“有三个人站在一座桥的一端…”。小艺接入的 DeepSeek-R1 Beta 得出的结论是 12 分钟,与 ChatGPT 相同,而 DeepSeek 官方 App 则得出了一个用时更短的答案,并给出了充足的论证。
最后,我测试了中文写作能力。我设计了一个视频选题,让小艺接入的 DeepSeek-R1 Beta 输出一个简略的台词,以小品形式呈现华为 Mate X6 折叠屏的外观。结果显示,它能够给出完整的对话台词设计,整体结构完整,台词口语化程度较高,但有趣味性不足。应对日常文字处理工作基本没有问题。
总的来说,可能受制于发布速度和集成妥协等因素,目前小艺接入的 DeepSeek-R1 Beta 的上下文长度性能和回答准确度还处于基础状态,需要等待后续迭代。
但考虑到 DeepSeek 官网及官方应用的连接条件较差,而其他云平台和本地部署对使用环境要求较高,在面对一些不那么复杂的问题时,直接使用华为小艺接入的 DeepSeek 是个不错的选择。
DeepSeek AI工具地址:【点击登录】