• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

【LangChain技术博客】Chat Loaders:用你自己的风格微调大模型

【LangChain技术博客】Chat Loaders:用你自己的风格微调大模型
AI TOP100
2023-09-04 19:08:23

前言:

(本文翻译自blog.langchain.dev,原始博客链接:https://blog.langchain.dev/chat-loaders-finetune-a-chatmodel-in-your-voice/)

摘要

我们正在新增一个集成类型:ChatLoaders,让您更容易地根据自己独特的写作风格进行微调。这些工具可以帮助将流行的消息平台的数据转换为与微调格式(如OpenAI所支持的格式)兼容的聊天消息。

感谢 Greg Kamradt 和 Misbah Syed 在此方面的思考领导力!

重要链接

  • Chat Loaders Langchain开发文档:https://python.langchain.com/docs/integrations/chat_loaders/?ref=blog.langchain.dev
  • Twitter 微调示例(Elon Musk推特生成器):https://elon-twitter-clone.streamlit.app/?ref=blog.langchain.dev
  • Twitter 微调示例代码(LangChain官方Github示例):https://github.com/langchain-ai/twitter-finetune?ref=blog.langchain.dev
  • 下周关于此主题的网络研讨会:https://www.crowdcast.io/c/lzafugqtyata?ref=blog.langchain.dev

背景

周二,OpenAI 宣布增强了微调支持(OpenAI博客链接:https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates?ref=blog.langchain.dev),将服务扩展到更大的聊天模型,如 GPT-3.5-turbo。这使得任何人都可以为自己的使用场景定制这些更大、更有能力的模型。他们还暗示今年晚些时候会支持对 GPT-4 的微调。

尽管通常不建议微调来为LLM提供大量新的知识或事实回忆(参考文章:https://www.glean.com/blog/lessons-and-learnings-from-building-an-enterprise-ready-ai-assistant?ref=blog.langchain.dev),但它适用于风格转换。

我们有很多社区成员询问如何使 ChatGPT “用你自己的声音” 回应——而微调是实现这一目标的绝佳方法!

像 Greg Kamdrat 这样在 Twitter 上的优秀人士也对这种用例持乐观态度:

微调你的通信可能对各种应用程序都很有用,例如以你品牌的声音回应客户,生成更了解你团队独特行话的内容,或者可靠地用目标语言聊天,或者只是为了好玩!

为什么这比直接指令更好?描述风格和语气可能很难!我们大多数人的写作风格并不像 ChatGPT,要让 LLM 一直以特定的声音回应(特别是在长时间的对话中)有时会令人沮丧。

为什么这比少量的示例更好?仅通过几个简洁的片段捕捉你的声音可能是个挑战!微调允许您提供更多的示例,模型可以从中学习,而不必每次查询模型时都看到它们。

ChatLoaders

在 LangChain,我们希望使您尽可能容易地利用这种增强的微调支持。为了简化将模型适应您的声音,我们正在添加一个新的集成类型:ChatLoaders。

这些工具接受从流行的消息平台导出的数据,并将它们转换为 LangChain 消息对象,然后您可以很容易地转换为与平台无关的消息格式,如 OpenAI, Llama 2 等。这些训练数据可以直接用于微调模型。

目前我们已为以下流行的消息平台添加了加载器:

  • Facebook Messenger
  • Slack
  • Telegram
  • WhatsApp
  • 我们还添加了一个关于如何为 Discord 和 Twitter (使用 Apify) 进行此操作的使用指南,并计划在不久的将来集成更多的聊天加载器。如果你有一个你想支持的喜欢的消息平台,我们很乐意帮助你提交一个 PR!
  • 为了帮助您入门,我们在 LangChain 文档中添加了一个端到端的示例笔记本(Colab链接:https://colab.research.google.com/github/langchain-ai/langchain/blob/master/docs/extras/integrations/chat_loaders/facebook.ipynb?ref=blog.langchain.dev),展示了如何在 Facebook 消息的示例集上微调 gpt-3.5-turbo (ChatGPT 背后的模型)。
  • ❗ 在进行操作之前,请确保您的对话参与者都支持使用聊天数据训练模型的决定。
  • 一旦你有了微调后的模型,你可以在 LangChain 的 ChatOpenAI 类(参考链接:https://api.python.langchain.com/en/latest/chat_models/langchain.chat_models.openai.ChatOpenAI.html?ref=blog.langchain.dev#langchain.chat_models.openai.ChatOpenAI)中直接使用模型名称:
  • 然后你可以将这个模型插入到任何其他的 LangChain 组件中!

端到端示例

我们还创建了一个基于 Elon Musk 推文的模型微调的端到端示例。这使用 Apify 加载数据。请注意,这不到100个示例,所以结果可能不是最好的。

我们在这里的 GitHub 仓库开源了这个示例(链接:https://github.com/langchain-ai/twitter-finetune?ref=blog.langchain.dev)。我们还在 Streamlit 应用上托管了它,所以你可以轻松地在这里使用它(链接:https://elon-twitter-clone.streamlit.app/?ref=blog.langchain.dev)。

网络研讨会

关于这个主题还有很多要讨论的。哪种消息最适合微调?还有哪些数据来源可以用于此?你需要多少点?

下周我们将与 Greg Kamradt 一起在网络研讨会上讨论这些问题和更多内容。欢迎加入!

结论

我们很高兴看到微调解锁的所有创意应用。我们已经实现了一些 ChatLoaders,但我们需要您的帮助,使创建您自己的个性化模型变得更容易。帮助我们创建更多的 ChatLoaders!

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 每日AI资讯-2025年08月18日

  • 重磅消息!即梦创作Agent来袭,内测申请及玩法大揭秘!

  • AIGC大赛:联想AI微电影《双子星》「平行宇宙」AIGC创作大赛正式启动!

  • AIGC大赛:腾讯久久公益节AIGC视频创作小赛火热开启

  • 腾讯AudioGenie震撼登场,AI音频生成领域迎来“搅局者”

热点资讯

字节跳动Seedance Pro上线Higgsfield:无限免费生成,30多种电影级预设

5天前
字节跳动Seedance Pro上线Higgsfield:无限免费生成,30多种电影级预设

一张图秒变3A游戏大片!腾讯混元Hunyuan-GameCraft开源,游戏开发门槛彻底被拉低

4天前
一张图秒变3A游戏大片!腾讯混元Hunyuan-GameCraft开源,游戏开发门槛彻底被拉低

B站测试AI视频工具花生AI:3分钟成片,创作者迎来“傻瓜式”神器

5天前
B站测试AI视频工具花生AI:3分钟成片,创作者迎来“傻瓜式”神器

阿里通义重磅发布Wan2.2-I2V-Flash:图生视频效率飙升12倍,成本低至0.1元/秒!

7天前
阿里通义重磅发布Wan2.2-I2V-Flash:图生视频效率飙升12倍,成本低至0.1元/秒!

快手可灵2.1模型内测:首尾帧功能上线,视频创作“精细度”大升级

3天前
快手可灵2.1模型内测:首尾帧功能上线,视频创作“精细度”大升级
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有