魔搭社区
2754
0
0
ModelScope魔搭社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。它致力于汇集业界领先的模型和丰富的数据集,为科研机构和科技公司提供一个分享和建设的平台。ModelScope的推出旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
工具标签:
直达网站
工具介绍

ModelScope魔搭社区是什么?
ModelScope社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。该社区成立于2022年6月,旨在汇集当前业界各类模态上工业级领先的模型和丰富的数据集,吸引了众多科研机构和科技公司共同分享和建设这一社区。ModelScope的推出,旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
社区的特点包括模型丰富,首批上架模型超过300个,覆盖视觉、语音、自然语言处理、多模态等AI主要领域,覆盖任务超过60个,其中中文模型超过100个,占比超过三分之一。社区鼓励中文模型的开发和使用,实现中文模型的丰富供给,并更好地满足本土需求。社区提供的模型包括150+SOTA(业界领先)模型和十多个大模型,均已开源代码或开放使用。
ModelScope社区提供模型的索引和发现功能,每个模型都配套详细的模型卡片来描述模型背后的机理及相关文献,提供在线体验能力,以及丰富的数据集和模型开发代码。社区与阿里云等云产品结合,提供算力支持,促进社区的快速发展。
ModelScope社区的推出,有望成为国内AI领域的一个重要交流和合作平台,促进AI技术的普及和应用。社区还提供了一系列的工具和框架,如ModelScopeEval、ScopeSwift和ModelScope-Agent,以协助模型开发和AI应用的构建。
ModelScope平台特点:

- 模型丰富:社区首批上架模型超过300个,覆盖视觉、语音、自然语言处理、多模态等AI主要领域,覆盖任务超过60个,其中中文模型超过100个,占比超过三分之一。
- 开源开放:社区鼓励中文模型的开发和使用,实现中文模型的丰富供给,并更好地满足本土需求。
- 技术领先:社区提供的模型包括150+SOTA(业界领先)模型和十多个大模型,均已开源代码或开放使用。
- 易用性:ModelScope提供模型的索引和发现功能,每个模型都配套详细的模型卡片来描述模型背后的机理及相关文献,提供在线体验能力,以及丰富的数据集和模型开发代码。
- 云生态集成:ModelScope与阿里云等云产品结合,提供算力支持,促进社区的快速发展。
ModelScope主要服务和工具:
- ModelScopeEval:一个用于简化大模型评估和性能基准测试的高效、可定制框架。
- ScopeSwift:魔搭大模型训练推理工具箱,支持多种模型及训练方式。
- ModelScope-Agent:连接ModelScope模型能力与万物的桥梁,一个智能体框架。
ModelScope社区推荐了多个高质量的数据集,以下是一些精选的数据集:

- MINT-1T-HTML:这是一个开源多模态INT交叉数据集,包含1万亿个文本标记和34亿张图像,是现有开源数据集的10倍。它旨在促进多模态预训练研究。
- SafeMTData:由上海人工智能实验室推出,专注于大型语言模型在多轮交互中的安全对齐,包含1680个安全的多轮对话。该数据集基于断路器训练数据集策划而成,已经过过滤以避免与Harmbench的数据污染。
- Data-Juicer的T2V-Evolution数据池:Data-Juicer提出了一个专为集成数据模型共同开发而量身定制的新型沙盒套件。该沙盒提供了一个全面的实验平台,可实现数据和模型的快速迭代和洞察力驱动的细化。Data-Juicer提出的“探测-分析-细化”工作流程已通过T2V-Turbo上的应用程序验证,并在VBench排行榜上取得了新的最高水平。
- Infinity-Instruct:智源千万级指令微调数据集,Llama 3.1仅微调即可接近GPT-4的性能。
- Omni-MATH:这是一个专注于数学问题解答的数据集,适用于训练和评估AI模型在数学推理和问题解决方面的能力。
- CCI3-Data:这个数据集可能包含了多种类型的数据,用于支持不同的AI应用和研究。
- chinese-cosmopedia:可能是一个专注于中文宇宙知识的数据集,用于增强AI模型在中文语境下的知识理解和应用。
- Chinese Fineweb Edu Dataset:这是一个中文教育领域的数据集,可能包含了丰富的教育资源和信息,适用于教育技术领域的AI模型训练。
这些数据集覆盖了多模态学习、安全对齐、数学问题解答、多语言处理等多个领域,为AI研究和应用提供了丰富的资源。通过ModelScope社区,研究人员和开发者可以方便地获取和使用这些数据集,以推动AI技术的发展和创新。
ModelScope社区动态:
ModelScope社区不断更新,提供最新的AI模型和应用。例如,社区提供了Llama-3系列最佳实践、七天入门LLM大模型学习课程等教育资源,以及AIGC专题课程,旨在培养学习者的创新能力和专业技能。
ModelScope魔搭社区是一个充满活力的AI模型开源社区,它通过提供丰富的模型资源、易用的工具和平台、以及强大的云生态支持,为AI开发者和研究人员提供了一个优秀的合作和创新平台。随着社区的不断发展和壮大,ModelScope有望成为国内AI领域的一个重要交流和合作平台,促进AI技术的普及和应用。
评论
全部评论

暂无评论
热门推荐
相关推荐

方糖大模型
方糖大模型是像素蛋糕自主研发的AI影像生成与处理系统,专为商业摄影、广告营销、影视制作、游戏开发等场景设计。其核心优势在于通过百亿级参数规模与多尺度分层蒸馏技术,实现高效、高质量的图像生成与编辑,同时符合国家政策对安全性和规范性的严格要求。
MMaDA
MMaDA是由普林斯顿大学、字节跳动、清华大学及北京大学联合研发的多模态扩散大语言模型,旨在突破传统多模态模型在架构统一性与后训练方法上的局限性。其核心目标是通过统一的扩散架构,实现文本推理、多模态理解与图像生成的跨领域卓越性能。
ThinkSound
ThinkSound是阿里巴巴通义实验室推出的全球首款音频生成模型。它采用先进的链式推理(Chain-of-Thought,CoT)技术,能够深入分析视频画面的场景、动作与情感,进而生成与之高度匹配的音效。无论是自然风声、城市喧嚣,还是角色对话与物体碰撞音,ThinkSound都能实现音画高保真同步
Kimi-VL
Kimi-VL与Kimi-VL-Thinking是由国内知名人工智能公司Moonshot AI(月之暗面)于近期开源发布的两款视觉语言模型。这两款模型以其轻量级的架构和卓越的多模态理解与推理能力,迅速在行业内引起了广泛关注。它们不仅在多项基准测试中超越了包括GPT-4o在内的众多大型模型。
GeometryCrafter
GeometryCrafter是腾讯研发团队发布的一款专为开放世界视频设计的全新AI模型。该模型的核心在于其能够从复杂多变的开放世界视频中,提取并生成一致的几何信息。所谓“开放世界视频”,涵盖了内容多样、场景切换频繁、视角变化丰富的各类视频素材,如街头实拍、旅行记录、自然风光纪录片等。
F-Lite
F-Lite是一款基于扩散变换器架构的文本到图像生成模型,由Black Forest Labs开发并于2025年最高1024x1024图像,并具备开源特性,适用于正式登陆Hugging Face平台。该模型以10亿参数的轻量化设计,实现了高效、低成本的图像生成能力,支持通过自然语言提示生成高分辨率
SongGeneration
SongGeneration是腾讯AI Lab正式推出并开源的一款音乐生成大模型。它旨在解决音乐生成领域中普遍存在的音质、音乐性和生成速度等三大难题,通过先进的技术架构和算法,实现高质量音乐作品的自动创作。
Sec-Gemini v1
Sec-Gemini v1是谷歌基于其Gemini模型构建的一款全新AI安全模型。它集成了Gemini的先进推理能力,并结合了近乎实时的网络安全知识和工具,旨在帮助网络安全专业人员更有效地应对网络威胁,提升威胁情报分析、漏洞理解和事件响应的效率。
0
0






