• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

【LangChain技术博客】Chat Loaders:用你自己的风格微调大模型

【LangChain技术博客】Chat Loaders:用你自己的风格微调大模型
AI TOP100
2023-09-04 19:08:23

前言:

(本文翻译自blog.langchain.dev,原始博客链接:https://blog.langchain.dev/chat-loaders-finetune-a-chatmodel-in-your-voice/)

摘要

我们正在新增一个集成类型:ChatLoaders,让您更容易地根据自己独特的写作风格进行微调。这些工具可以帮助将流行的消息平台的数据转换为与微调格式(如OpenAI所支持的格式)兼容的聊天消息。

感谢 Greg Kamradt 和 Misbah Syed 在此方面的思考领导力!

重要链接

  • Chat Loaders Langchain开发文档:https://python.langchain.com/docs/integrations/chat_loaders/?ref=blog.langchain.dev
  • Twitter 微调示例(Elon Musk推特生成器):https://elon-twitter-clone.streamlit.app/?ref=blog.langchain.dev
  • Twitter 微调示例代码(LangChain官方Github示例):https://github.com/langchain-ai/twitter-finetune?ref=blog.langchain.dev
  • 下周关于此主题的网络研讨会:https://www.crowdcast.io/c/lzafugqtyata?ref=blog.langchain.dev

背景

周二,OpenAI 宣布增强了微调支持(OpenAI博客链接:https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates?ref=blog.langchain.dev),将服务扩展到更大的聊天模型,如 GPT-3.5-turbo。这使得任何人都可以为自己的使用场景定制这些更大、更有能力的模型。他们还暗示今年晚些时候会支持对 GPT-4 的微调。

尽管通常不建议微调来为LLM提供大量新的知识或事实回忆(参考文章:https://www.glean.com/blog/lessons-and-learnings-from-building-an-enterprise-ready-ai-assistant?ref=blog.langchain.dev),但它适用于风格转换。

我们有很多社区成员询问如何使 ChatGPT “用你自己的声音” 回应——而微调是实现这一目标的绝佳方法!

像 Greg Kamdrat 这样在 Twitter 上的优秀人士也对这种用例持乐观态度:

微调你的通信可能对各种应用程序都很有用,例如以你品牌的声音回应客户,生成更了解你团队独特行话的内容,或者可靠地用目标语言聊天,或者只是为了好玩!

为什么这比直接指令更好?描述风格和语气可能很难!我们大多数人的写作风格并不像 ChatGPT,要让 LLM 一直以特定的声音回应(特别是在长时间的对话中)有时会令人沮丧。

为什么这比少量的示例更好?仅通过几个简洁的片段捕捉你的声音可能是个挑战!微调允许您提供更多的示例,模型可以从中学习,而不必每次查询模型时都看到它们。

ChatLoaders

在 LangChain,我们希望使您尽可能容易地利用这种增强的微调支持。为了简化将模型适应您的声音,我们正在添加一个新的集成类型:ChatLoaders。

这些工具接受从流行的消息平台导出的数据,并将它们转换为 LangChain 消息对象,然后您可以很容易地转换为与平台无关的消息格式,如 OpenAI, Llama 2 等。这些训练数据可以直接用于微调模型。

目前我们已为以下流行的消息平台添加了加载器:

  • Facebook Messenger
  • Slack
  • Telegram
  • WhatsApp
  • 我们还添加了一个关于如何为 Discord 和 Twitter (使用 Apify) 进行此操作的使用指南,并计划在不久的将来集成更多的聊天加载器。如果你有一个你想支持的喜欢的消息平台,我们很乐意帮助你提交一个 PR!
  • 为了帮助您入门,我们在 LangChain 文档中添加了一个端到端的示例笔记本(Colab链接:https://colab.research.google.com/github/langchain-ai/langchain/blob/master/docs/extras/integrations/chat_loaders/facebook.ipynb?ref=blog.langchain.dev),展示了如何在 Facebook 消息的示例集上微调 gpt-3.5-turbo (ChatGPT 背后的模型)。
  • ❗ 在进行操作之前,请确保您的对话参与者都支持使用聊天数据训练模型的决定。
  • 一旦你有了微调后的模型,你可以在 LangChain 的 ChatOpenAI 类(参考链接:https://api.python.langchain.com/en/latest/chat_models/langchain.chat_models.openai.ChatOpenAI.html?ref=blog.langchain.dev#langchain.chat_models.openai.ChatOpenAI)中直接使用模型名称:
  • 然后你可以将这个模型插入到任何其他的 LangChain 组件中!

端到端示例

我们还创建了一个基于 Elon Musk 推文的模型微调的端到端示例。这使用 Apify 加载数据。请注意,这不到100个示例,所以结果可能不是最好的。

我们在这里的 GitHub 仓库开源了这个示例(链接:https://github.com/langchain-ai/twitter-finetune?ref=blog.langchain.dev)。我们还在 Streamlit 应用上托管了它,所以你可以轻松地在这里使用它(链接:https://elon-twitter-clone.streamlit.app/?ref=blog.langchain.dev)。

网络研讨会

关于这个主题还有很多要讨论的。哪种消息最适合微调?还有哪些数据来源可以用于此?你需要多少点?

下周我们将与 Greg Kamradt 一起在网络研讨会上讨论这些问题和更多内容。欢迎加入!

结论

我们很高兴看到微调解锁的所有创意应用。我们已经实现了一些 ChatLoaders,但我们需要您的帮助,使创建您自己的个性化模型变得更容易。帮助我们创建更多的 ChatLoaders!

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 夸克重磅推出千问助手,阿里千问App公测上线,AI生活加速到来!

  • AI Agent聚合平台MuleRun 2.0:上线30天用户破50万,美国成“主力军”

  • 谷歌Gemini Pro/Ultra用户迎来Veo 3.1视频模型正式上线,三图融合玩转视频创作!

  • 谷歌NotebookLM正式上线图像识别功能,图像导入,让知识检索变得超简单!

  • AI霸主地位岌岌可危?Databricks创始人警告:美国或拱手相让中国!

热点资讯

告别PPT熬夜!开源神器Presentation-AI免费来袭,本地运行碾压Gamma.app

7天前
告别PPT熬夜!开源神器Presentation-AI免费来袭,本地运行碾压Gamma.app

火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

5天前
火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

Google DeepMind上线SIMA 2预览版,性能飞跃迈向通用机器人

2天前
Google DeepMind上线SIMA 2预览版,性能飞跃迈向通用机器人

百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

4天前
百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

国产AI再突破!月之暗面Kimi K2Thinking开源,460万美元成本力压GPT-5?

7天前
国产AI再突破!月之暗面Kimi K2Thinking开源,460万美元成本力压GPT-5?
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有