AGI投资风向标的转变
昔日对AGI(通用人工智能)投资持保留态度的知名投资人朱啸虎,在深度体验DeepSeek后,态度发生重大转变,惊呼“DeepSeek快让我相信AGI了”。他在接受采访时,多次赞叹DeepSeek在内容生成上的优美和深度。
DeepSeek不仅让朱啸虎折服,其模仿梁文锋口吻回复冯骥“国运论”的“造假文章”也引发了广泛关注。作家李诞评价该文章具有“科技抒情散文诗”的独特DeepSeek味道。
易用性与情感拿捏
更重要的是,DeepSeek让普通用户首次体验到AI对话产品的易用性。用户无需掌握复杂的Prompt技巧,仅需输入简单的自然语言,即可获得准确且拟人化的答复。DeepSeek精准把握人类情感价值,以“阴阳怪气”的中文表达,赢得了“赛博嘴替”的美誉。
用户数据飙升是DeepSeek受欢迎的又一佐证。数据显示,DeepSeek应用上线20天,DAU(日活跃用户)即突破2000万,成为国内领先的AI对话应用指日可待。
文风的秘密
尽管DeepSeek坚持开源路线,但并未公开其R1最新模型的预训练语料,引发了外界对其独特文风训练方式的好奇。
DeepSeek官方给出了风格化数据蒸馏体系、动态风格迁移架构和对抗式强化学习框架等解释。而其他国内领先的大模型则认为,DeepSeek可能使用了更多文学小说素材。
朱啸虎也猜测,这与其团队对优美文字、哲学和量子力学的偏爱有关。幻方量化(DeepSeek母公司)在宣布进军大模型领域时,引用了法国导演特吕弗的名言:“务必要疯狂地怀抱雄心,且还要疯狂地真诚。”
大模型创业者李振认为,DeepSeek在文学语言占比上可能高达40%,远高于其他国内大模型10%-20%的比例。
数据与人才的双重驱动
《生成式人工智能》作者丁磊博士指出,DeepSeek R1模型展现了“aha moment”顿悟时刻,即模型学会了反思,证明了其推理能力和强化学习的潜力。
恒业资本创始合伙人江一认为,DeepSeek生成优美文风的关键在于高人才密度和高自主性。员工的开放性和自主性,避免了研发的靶向性,最终生成效果更具独特性。
DeepSeek构建了一个独特的文学增强型数据生态,将自然语言生成转化为可控的风格系统,并将文学创作领域的专业评价体系转化为函数,构建风格表征的数学建模。为此,DeepSeek在数据标签上投入了更多精力,进行更细致和多样化的标注。
DeepSeek构建了一个跨学科的专家团队,对不同社会背景人群的价值观进行了分类学研究,构建了一个三级标签的价值观分类体系。丁磊博士强调,前期的数据质量对模型训练至关重要,DeepSeek在长思维链数据的收集和标注、推理和非推理数据的质量等方面具有独特优势。
DeepSeek R1模型使用数据蒸馏技术生成高质量数据,提升了训练效率。丁磊博士指出,模型参数量并非决定性因素,数据清洗能力至关重要。OpenAI借助基于人类反馈的强化数据训练,最终超越了谷歌。
李振透露,部分大模型公司存在数据注水的行为,而DeepSeek可能加入了对抗式数据清洗环节,在训练范式上具有代际优势。
DeepSeek内部进行迭代式开发,独立的测试团队对模型在各个维度上的安全性进行充分测试,并给出反馈意见指导数据迭代和模型训练。
不同的训练方式和强化学习迭代轮次,也导致了最终文风的差异。朱啸虎用厨师做饭来比喻,不同大模型在组织语料或参数权重上的差别,导致回复答案的差异性。
准确性与“顿悟”时刻
DeepSeek内容生成的惊艳之处在于,确保了生成内容具备更高的事实准确性。这归功于模型的自我进化和“aha moment”顿悟时刻,模型学会通过更多推理计算来解决复杂任务并进行反思。
DeepSeek R1-Zero模型直接将RL应用于基础模型,无需依赖SFT(监督微调)和已标注数据,旨在通过纯机器学习解决数据获取成本高和标注质量参差不齐的难题。
DeepSeek R1模型在强化学习推理阶段发现了“aha moment”顿悟时刻,模型自身开始具备了自我反思能力,能够主动纠正早期错误步骤,生成更长的推理过程以解决复杂问题。
这种“顿悟”现象离不开特殊的奖励机制。DeepSeek R1模型在PPO算法下采用基于规则的奖励函数,根据生成输出的格式和正确性分配奖励。
DeepSeek官方表示,他们没有直接教模型如何解决问题,只是给予其正确的激励,模型就能自己琢磨出先进的解题办法。
人才的价值
DeepSeek对人才的重视和培养体现在构建风格表征的数学建模和推动“aha moment”顿悟时刻的出现中。恒业资本创始合伙人江一认为,DeepSeek的高人才密度和内部人才的高自主性相结合,产生了多样性的涌现。
DeepSeek的管理遵循自下而上模式,每个人对于卡和人的调动不设上限。其V2模型的技术创新MLA,就来自一个年轻研究员的个人兴趣。
梁文锋认为,自信在年轻人身上更为明显,DeepSeek内部多是Top高校的应届毕业生、没毕业的博士实习生以及毕业才几年的年轻人。他认为,基础能力、创造性和热爱比经验更重要。
相比之下,部分大模型公司对员工的控制力更强,缺少自主性,研发呈现出靶向性特征,最终模型效果中规中矩。
警惕AI内容风险
尽管DeepSeek生成的优美文风受到部分人喜爱,但也引发部分人的警惕,有人指出其内容存在语法错误。更不易察觉的是,借助更逼真、拟人化的文风,DeepSeek的幻觉现象依然存在。
以虚假文章为例,其中“十二年前在浙大实验室第一次跑通神经网络时的颤栗”的描述,与梁文锋的真实履历不符,很可能是DeepSeek自行编造的。
随着大模型在可靠性上表现出来的能力越来越强,其迷惑性也随之增强。作为人类,我们或许应该学习如何提高辨别AI内容时自身的可靠性。
目前由于访问人数较多导致DeepSeek服务器超负荷,大家可以从另外2个渠道去使用,不会卡:
渠道一:硅基流动(SiliconFlow):AI人工智能云服务平台
DeepSeek官网下载: https://www.deepseek.com/