魔搭社区
5979
0
0
ModelScope魔搭社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。它致力于汇集业界领先的模型和丰富的数据集,为科研机构和科技公司提供一个分享和建设的平台。ModelScope的推出旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
工具标签:
直达网站
工具介绍

ModelScope魔搭社区是什么?
ModelScope社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。该社区成立于2022年6月,旨在汇集当前业界各类模态上工业级领先的模型和丰富的数据集,吸引了众多科研机构和科技公司共同分享和建设这一社区。ModelScope的推出,旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
社区的特点包括模型丰富,首批上架模型超过300个,覆盖视觉、语音、自然语言处理、多模态等AI主要领域,覆盖任务超过60个,其中中文模型超过100个,占比超过三分之一。社区鼓励中文模型的开发和使用,实现中文模型的丰富供给,并更好地满足本土需求。社区提供的模型包括150+SOTA(业界领先)模型和十多个大模型,均已开源代码或开放使用。
ModelScope社区提供模型的索引和发现功能,每个模型都配套详细的模型卡片来描述模型背后的机理及相关文献,提供在线体验能力,以及丰富的数据集和模型开发代码。社区与阿里云等云产品结合,提供算力支持,促进社区的快速发展。
ModelScope社区的推出,有望成为国内AI领域的一个重要交流和合作平台,促进AI技术的普及和应用。社区还提供了一系列的工具和框架,如ModelScopeEval、ScopeSwift和ModelScope-Agent,以协助模型开发和AI应用的构建。
ModelScope平台特点:

- 模型丰富:社区首批上架模型超过300个,覆盖视觉、语音、自然语言处理、多模态等AI主要领域,覆盖任务超过60个,其中中文模型超过100个,占比超过三分之一。
- 开源开放:社区鼓励中文模型的开发和使用,实现中文模型的丰富供给,并更好地满足本土需求。
- 技术领先:社区提供的模型包括150+SOTA(业界领先)模型和十多个大模型,均已开源代码或开放使用。
- 易用性:ModelScope提供模型的索引和发现功能,每个模型都配套详细的模型卡片来描述模型背后的机理及相关文献,提供在线体验能力,以及丰富的数据集和模型开发代码。
- 云生态集成:ModelScope与阿里云等云产品结合,提供算力支持,促进社区的快速发展。
ModelScope主要服务和工具:
- ModelScopeEval:一个用于简化大模型评估和性能基准测试的高效、可定制框架。
- ScopeSwift:魔搭大模型训练推理工具箱,支持多种模型及训练方式。
- ModelScope-Agent:连接ModelScope模型能力与万物的桥梁,一个智能体框架。
ModelScope社区推荐了多个高质量的数据集,以下是一些精选的数据集:

- MINT-1T-HTML:这是一个开源多模态INT交叉数据集,包含1万亿个文本标记和34亿张图像,是现有开源数据集的10倍。它旨在促进多模态预训练研究。
- SafeMTData:由上海人工智能实验室推出,专注于大型语言模型在多轮交互中的安全对齐,包含1680个安全的多轮对话。该数据集基于断路器训练数据集策划而成,已经过过滤以避免与Harmbench的数据污染。
- Data-Juicer的T2V-Evolution数据池:Data-Juicer提出了一个专为集成数据模型共同开发而量身定制的新型沙盒套件。该沙盒提供了一个全面的实验平台,可实现数据和模型的快速迭代和洞察力驱动的细化。Data-Juicer提出的“探测-分析-细化”工作流程已通过T2V-Turbo上的应用程序验证,并在VBench排行榜上取得了新的最高水平。
- Infinity-Instruct:智源千万级指令微调数据集,Llama 3.1仅微调即可接近GPT-4的性能。
- Omni-MATH:这是一个专注于数学问题解答的数据集,适用于训练和评估AI模型在数学推理和问题解决方面的能力。
- CCI3-Data:这个数据集可能包含了多种类型的数据,用于支持不同的AI应用和研究。
- chinese-cosmopedia:可能是一个专注于中文宇宙知识的数据集,用于增强AI模型在中文语境下的知识理解和应用。
- Chinese Fineweb Edu Dataset:这是一个中文教育领域的数据集,可能包含了丰富的教育资源和信息,适用于教育技术领域的AI模型训练。
这些数据集覆盖了多模态学习、安全对齐、数学问题解答、多语言处理等多个领域,为AI研究和应用提供了丰富的资源。通过ModelScope社区,研究人员和开发者可以方便地获取和使用这些数据集,以推动AI技术的发展和创新。
ModelScope社区动态:
ModelScope社区不断更新,提供最新的AI模型和应用。例如,社区提供了Llama-3系列最佳实践、七天入门LLM大模型学习课程等教育资源,以及AIGC专题课程,旨在培养学习者的创新能力和专业技能。
ModelScope魔搭社区是一个充满活力的AI模型开源社区,它通过提供丰富的模型资源、易用的工具和平台、以及强大的云生态支持,为AI开发者和研究人员提供了一个优秀的合作和创新平台。随着社区的不断发展和壮大,ModelScope有望成为国内AI领域的一个重要交流和合作平台,促进AI技术的普及和应用。
评论
全部评论

暂无评论
热门推荐
相关推荐

Magma AI
Magma是一款由微软精心打造的多模态AI模型,它旨在处理和整合图像、文本和视频等多种数据类型。与传统的AI系统不同,Magma不仅仅专注于视觉-语言理解或机器人操作等单一领域,而是将这两种能力结合成一个统一的模型,使得AI代理能够在数字和物理环境中执行更为复杂的任务。
大模型实验室Lab4AI
大模型实验室Lab4AI是提供高性能GPU场景的实操平台和内容社区,致力于为高校科研人员、AI开发者和学习者提供高性能算力支持与全链条工具服务,打造“从论文到创新,从课程到实践”的闭环生态。平台聚焦科研探索与技能提升两大核心场景,通过集成先进AI能力、云端算力资源和实操环境,助力用户高效完成学术研究
地球AI大脑
谷歌地球AI大脑是谷歌最新推出的一个地理智能分析平台,它整合了图像、地图、天气数据等多种信息,并利用AI模型进行深度学习。这个强大的系统可以自动理解并回答与地理位置相关的复杂问题,为人类提供前所未有的洞察能力。
Xiaomi MiMo
Xiaomi MiMo是小米公司自研的AI大模型系列,定位为“定义智能体时代的旗舰基座大模型”。它不仅是单纯的技术产品,更是小米“人车家”全生态战略的核心智能底座。
MMaDA
MMaDA是由普林斯顿大学、字节跳动、清华大学及北京大学联合研发的多模态扩散大语言模型,旨在突破传统多模态模型在架构统一性与后训练方法上的局限性。其核心目标是通过统一的扩散架构,实现文本推理、多模态理解与图像生成的跨领域卓越性能。
子曰-o1
“子曰-o1”是网易有道基于多年教育数据和AI技术积累,推出的一款轻量级推理模型。它采用14B的小参数设计,能够在普通消费级显卡上高效部署,专为教育场景设计。该模型利用思维链技术,通过自我对话和纠错机制,在解题时输出详细的思考过程,帮助学生理解解题逻辑,提升学习效果。
MiniGPT-4
MiniGPT-4是一个融合了视觉编码器和高级大型语言模型(LLM)Vicuna的创新模型,二者通过一个投影层实现协同工作。该模型展现了与GPT-4相媲美的功能,例如能够生成详尽的图像描述,以及从手绘草图创建网站。
Gemma
Gemma是谷歌最新开源的多模态大模型,主打低成本高性能。该模型共有1B(10亿)、4B(40亿)、12B(120亿)和27B(270亿)四种参数规模,即便最大的27B参数模型,也只需要一张Nvidia H100显卡就能高效推理。相比同类模型,Gemma-3在达到相同效果时,算力需求降低了10倍
0
0






