魔搭社区
2648
0
0
ModelScope魔搭社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。它致力于汇集业界领先的模型和丰富的数据集,为科研机构和科技公司提供一个分享和建设的平台。ModelScope的推出旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
工具标签:
直达网站
工具介绍

ModelScope魔搭社区是什么?
ModelScope社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。该社区成立于2022年6月,旨在汇集当前业界各类模态上工业级领先的模型和丰富的数据集,吸引了众多科研机构和科技公司共同分享和建设这一社区。ModelScope的推出,旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
社区的特点包括模型丰富,首批上架模型超过300个,覆盖视觉、语音、自然语言处理、多模态等AI主要领域,覆盖任务超过60个,其中中文模型超过100个,占比超过三分之一。社区鼓励中文模型的开发和使用,实现中文模型的丰富供给,并更好地满足本土需求。社区提供的模型包括150+SOTA(业界领先)模型和十多个大模型,均已开源代码或开放使用。
ModelScope社区提供模型的索引和发现功能,每个模型都配套详细的模型卡片来描述模型背后的机理及相关文献,提供在线体验能力,以及丰富的数据集和模型开发代码。社区与阿里云等云产品结合,提供算力支持,促进社区的快速发展。
ModelScope社区的推出,有望成为国内AI领域的一个重要交流和合作平台,促进AI技术的普及和应用。社区还提供了一系列的工具和框架,如ModelScopeEval、ScopeSwift和ModelScope-Agent,以协助模型开发和AI应用的构建。
ModelScope平台特点:

- 模型丰富:社区首批上架模型超过300个,覆盖视觉、语音、自然语言处理、多模态等AI主要领域,覆盖任务超过60个,其中中文模型超过100个,占比超过三分之一。
- 开源开放:社区鼓励中文模型的开发和使用,实现中文模型的丰富供给,并更好地满足本土需求。
- 技术领先:社区提供的模型包括150+SOTA(业界领先)模型和十多个大模型,均已开源代码或开放使用。
- 易用性:ModelScope提供模型的索引和发现功能,每个模型都配套详细的模型卡片来描述模型背后的机理及相关文献,提供在线体验能力,以及丰富的数据集和模型开发代码。
- 云生态集成:ModelScope与阿里云等云产品结合,提供算力支持,促进社区的快速发展。
ModelScope主要服务和工具:
- ModelScopeEval:一个用于简化大模型评估和性能基准测试的高效、可定制框架。
- ScopeSwift:魔搭大模型训练推理工具箱,支持多种模型及训练方式。
- ModelScope-Agent:连接ModelScope模型能力与万物的桥梁,一个智能体框架。
ModelScope社区推荐了多个高质量的数据集,以下是一些精选的数据集:

- MINT-1T-HTML:这是一个开源多模态INT交叉数据集,包含1万亿个文本标记和34亿张图像,是现有开源数据集的10倍。它旨在促进多模态预训练研究。
- SafeMTData:由上海人工智能实验室推出,专注于大型语言模型在多轮交互中的安全对齐,包含1680个安全的多轮对话。该数据集基于断路器训练数据集策划而成,已经过过滤以避免与Harmbench的数据污染。
- Data-Juicer的T2V-Evolution数据池:Data-Juicer提出了一个专为集成数据模型共同开发而量身定制的新型沙盒套件。该沙盒提供了一个全面的实验平台,可实现数据和模型的快速迭代和洞察力驱动的细化。Data-Juicer提出的“探测-分析-细化”工作流程已通过T2V-Turbo上的应用程序验证,并在VBench排行榜上取得了新的最高水平。
- Infinity-Instruct:智源千万级指令微调数据集,Llama 3.1仅微调即可接近GPT-4的性能。
- Omni-MATH:这是一个专注于数学问题解答的数据集,适用于训练和评估AI模型在数学推理和问题解决方面的能力。
- CCI3-Data:这个数据集可能包含了多种类型的数据,用于支持不同的AI应用和研究。
- chinese-cosmopedia:可能是一个专注于中文宇宙知识的数据集,用于增强AI模型在中文语境下的知识理解和应用。
- Chinese Fineweb Edu Dataset:这是一个中文教育领域的数据集,可能包含了丰富的教育资源和信息,适用于教育技术领域的AI模型训练。
这些数据集覆盖了多模态学习、安全对齐、数学问题解答、多语言处理等多个领域,为AI研究和应用提供了丰富的资源。通过ModelScope社区,研究人员和开发者可以方便地获取和使用这些数据集,以推动AI技术的发展和创新。
ModelScope社区动态:
ModelScope社区不断更新,提供最新的AI模型和应用。例如,社区提供了Llama-3系列最佳实践、七天入门LLM大模型学习课程等教育资源,以及AIGC专题课程,旨在培养学习者的创新能力和专业技能。
ModelScope魔搭社区是一个充满活力的AI模型开源社区,它通过提供丰富的模型资源、易用的工具和平台、以及强大的云生态支持,为AI开发者和研究人员提供了一个优秀的合作和创新平台。随着社区的不断发展和壮大,ModelScope有望成为国内AI领域的一个重要交流和合作平台,促进AI技术的普及和应用。
评论
全部评论

暂无评论
热门推荐
相关推荐

Llama
Meta Llama模型是Meta研发的大型语言模型系列,它基于先进的深度学习架构,旨在处理和理解自然语言。Llama模型以其强大的语言处理能力和广泛的应用场景,成为了AI领域的一款全能选手。无论是文本生成、语言理解,还是多模态交互,Llama模型都能展现出其卓越的性能。
天工开放平台
天工开放平台,作为一家综合性技术平台,致力于提供多样化的服务和产品,以促进技术的创新和应用的发展。该平台涵盖了天工AI搜索、天工3.0大模型、搜索引擎服务,AI写作、AI陪伴以及AI音乐产品等多个领域,充分展示了其在人工智能行业的深远影响。
Sana
Sana是英伟达开源的一款先进图像生成模型,它采用了深度压缩自编码器(DC-AE)和线性扩散变换器(DiT)等创新技术,能够在保持高质量图像生成的同时,实现极快的生成速度。这款模型支持生成高达4096×4096分辨率的图像,并且在16GB显卡上即可流畅运行,满足了广大用户对于高效图像生成的需求
火山方舟
火山方舟是火山引擎旗下的大模型服务平台,定位为面向企业提供全面的模型即服务(MaaS,Model-as-a- Service)解决方案。它汇聚百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家 AI 科技公司及科研院所的大模型,打破模型资源分散的局面。
MMaDA
MMaDA是由普林斯顿大学、字节跳动、清华大学及北京大学联合研发的多模态扩散大语言模型,旨在突破传统多模态模型在架构统一性与后训练方法上的局限性。其核心目标是通过统一的扩散架构,实现文本推理、多模态理解与图像生成的跨领域卓越性能。
CogView4
CogView4是智谱AI推出的开源中文文生图模型。CogView4 的参数规模精准布局至 6 亿,这一参数规模,为模型构建了一个庞大且高效的 “智慧中枢”,赋予其极为强大的运算和学习能力。还全面支持中文输入和中文文本到图像的生成,被称其为“首个能在画面中生成汉字的开源模型”
Gemini 2.0 Flash Thinking
Gemini 2.0 Flash Thinking是谷歌推出的一款具有推理能力的智能助手模型,它基于先进的人工智能技术开发,旨在加速和简化复杂的思考过程。该模型不仅继承了Gemini 2.0系列的强大功能,还通过特别训练,能够在回答问题时展示其“思考过程”,为用户提供更深入、更透明的分析体验。
Sec-Gemini v1
Sec-Gemini v1是谷歌基于其Gemini模型构建的一款全新AI安全模型。它集成了Gemini的先进推理能力,并结合了近乎实时的网络安全知识和工具,旨在帮助网络安全专业人员更有效地应对网络威胁,提升威胁情报分析、漏洞理解和事件响应的效率。
0
0






