736
0
0
工具描述
工具介绍
月之暗面将长文本技术称之为大模型“登月计划”的第一步。
- 支持更长的上下文意味着大模型拥有更大的“内存”,使大模型的应用更加深入和广泛。比如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等等。
- 在推理层,Transformer模型中自注意力机制(Self Attention)的计算量会随着上下文长度的增加呈平方级增长,比如上下文增加32倍时,计算量实际会增长1000倍。同时,超长上下文也将带来显存与带宽压力。
对于长文本技术的开发,市场上出现了不同的技术路线。
但在杨植麟看来,这些路线几乎都是在牺牲一部分性能前提下的“捷径”。
杨植麟将其总结为三类:
“金鱼”模型,容易“健忘”。
通过滑动窗口等方式主动抛弃上文,只保留对最新输入的注意力机制。模型无法对全文进行完整理解,无法处理跨文档的比较和长文本的综合理解。例如,无法从一篇10万字的用户访谈录音转写中提取最有价值的10个观点。
“蜜蜂”模型,只关注局部,忽略整体。
通过对上下文的降采样或者RAG(检索增强的生成),只保留对部分输入的注意力机制。模型同样无法对全文进行完整理解。例如,无法从50个简历中对候选人的画像进行归纳和总结。
“蝌蚪”模型,模型能力尚未发育完整。
- 通过减少参数量(例如减少到百亿参数)来提升上下文长度,这种方法会降低模型本身的能力,虽然能支持更长上下文,但是大量任务无法胜任。
- 杨植麟认为,简单的捷径无法达到理想的产品化效果。因此,月之暗面的技术路线,就是不走捷径,踏实地解决算法与工程的双重挑战,在算力、存储、带宽等技术层面做了极致的优化。
可以直接总结网页或者PDF文档的信息:
可以直接根据财报总结关键信息:
月之暗面大模型体验地址: https://www.moonshot.cn/
相关推荐
百川大模型
百川成立于2023年,由搜狗创始人王小川创立。今年6月15日,百川智能推出70亿参数量的中英文语言模型Baichuan-7B,一个月后又接连发布了参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及INT4/INT8两个量化版本。前不久,百川智能刚刚宣布推出新一代大模型Baichuan-53B。
# AI大模型
智谱AI大模型MaaS开放平台
成立于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技术成果转化。 当前,智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。 基于ChatGLM,智谱已于今年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。
# AI大模型
天工开放平台
昆仑万维国内首发:天工AI大模型。
# AI大模型
月之暗面MoonShot AI
杨植麟在今年3月1日成立的通用人工智能(AGI)公司“月之暗面”(英文名MoonShot AI),发布了其千亿参数级大模型moonshot,以及搭载该模型的智能助手Kimi Chat。
# AI大模型
360智脑
360搜索最新推出的AI对话聊天机器人
# AI大模型
序列猴子
语言驱动的深度学习大模型能够快速、准确地处理语言表达,支持多种交互方式,可以快速生成悦耳的语音、高质量的文本,以及与人机进行互动,以满足各种语音、文本和对话需求。
# AI大模型
商汤-日日新大模型
今年4月,商汤推出日日新SenseNova”大模型。据悉,日日新大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,其中还包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品。目前,商汤最新版大模型“商量SenseChat 2.0版本”已发布,其参数达千亿级规模。
# AI大模型
子曰
网易旗下“子曰”教育大模型六大应用成果——虚拟人口语教练Hi Echo、LLM翻译、AI作文指导、语法精讲、AIBox、文档问答。
# AI大模型
热门推荐
神采PromeAI
神采PromeAI拥有强大的人工智能驱动设计助手和广泛可控的AIGC(C-AIGC)模型风格库,使你能够轻松地创造出令人惊叹的图形、视频和动画。目前已上线功能:草图渲染、背景生成、涂抹替换、照片转线稿、变化重绘、AI超模、尺寸外扩、文字效果。神采PromeAI是建筑师、室内设计师、产品设计师和游戏动漫设计师的必备工具。
# AI图形图像
Midjourney中文版 - AI创新工坊
AI创新工坊,为用户提供专业的AI绘图工具,有图生文,文生图,图混图,混合重绘功能等,模型多样,对于新人小白可以通过“灵感广场”和“学习教程”快速上手,支持一键同款,复制关键词。
# AI图形图像
免费ChatGPT中文版
chatgpt4.0免费使用中文版
# 写作文案
笔灵AI写作
笔灵AI写作是面向专业写作领域的AI写作工具,AI智能写作-在线AI写作生成器。 笔灵AI写作助手包括:ai论文,ai开题报告,ai公文写作,ai商业计划书,文献综述ai生成,ai文献推荐,ai工作总结等。
# AI写作工具
AI一键论文-AIPaperPass
AI一键论文,AI PaperPass,AI论文写作,无需注册,千字大纲免费,10分钟三万字极速体验
# 写作文案
免费AI绘画
imageX提供了丰富的图片风格供您选择,包括但不限于:真人漫画、国风华服、二次元、水粉、真人3D、赛博朋克、概念艺术等
# 图像生成
无界AI-支持Midjourney V6
支持最新Midjourney v6模型。无界AI是国内领先的人工智能生成内容(AIGC)企业 , 专注于人工智能大模型在图像视频领域的生成创造。产品上线于2022年5月,为用户提供先进且丰富的AIGC工具,致力于将AI生成艺术做到极致,适配和满足不限于动漫、IP制作、影视、设计、短视频创作等各行各业的内容生产需求。无界AI不仅从底层模型与算法技术上逐步提升国产自主性与核心竞争力,同时在产品化上引领国内市场。无界AI目前已积累300余万B端、C端用户,其中B端已经与上汽集团、海尔、森马服饰、万事利、三维家、菲林格尔等领先企业建立商业合作关系
# 图像生成
比格AI PPT
比格AI PPT是一款使用AI语言模型的PPT生成式办公神器,用户输入主题即可一键生成PPT,内置定制级PPT模板并支持一键更换,会员享有更多功能,支持免费体验
# 自动化