


魔搭社区
1780
0
0
ModelScope魔搭社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。它致力于汇集业界领先的模型和丰富的数据集,为科研机构和科技公司提供一个分享和建设的平台。ModelScope的推出旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
工具标签:
直达网站

工具介绍
ModelScope魔搭社区是什么?
ModelScope社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。该社区成立于2022年6月,旨在汇集当前业界各类模态上工业级领先的模型和丰富的数据集,吸引了众多科研机构和科技公司共同分享和建设这一社区。ModelScope的推出,旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
社区的特点包括模型丰富,首批上架模型超过300个,覆盖视觉、语音、自然语言处理、多模态等AI主要领域,覆盖任务超过60个,其中中文模型超过100个,占比超过三分之一。社区鼓励中文模型的开发和使用,实现中文模型的丰富供给,并更好地满足本土需求。社区提供的模型包括150+SOTA(业界领先)模型和十多个大模型,均已开源代码或开放使用。
ModelScope社区提供模型的索引和发现功能,每个模型都配套详细的模型卡片来描述模型背后的机理及相关文献,提供在线体验能力,以及丰富的数据集和模型开发代码。社区与阿里云等云产品结合,提供算力支持,促进社区的快速发展。
ModelScope社区的推出,有望成为国内AI领域的一个重要交流和合作平台,促进AI技术的普及和应用。社区还提供了一系列的工具和框架,如ModelScopeEval、ScopeSwift和ModelScope-Agent,以协助模型开发和AI应用的构建。
ModelScope平台特点:
- 模型丰富:社区首批上架模型超过300个,覆盖视觉、语音、自然语言处理、多模态等AI主要领域,覆盖任务超过60个,其中中文模型超过100个,占比超过三分之一。
- 开源开放:社区鼓励中文模型的开发和使用,实现中文模型的丰富供给,并更好地满足本土需求。
- 技术领先:社区提供的模型包括150+SOTA(业界领先)模型和十多个大模型,均已开源代码或开放使用。
- 易用性:ModelScope提供模型的索引和发现功能,每个模型都配套详细的模型卡片来描述模型背后的机理及相关文献,提供在线体验能力,以及丰富的数据集和模型开发代码。
- 云生态集成:ModelScope与阿里云等云产品结合,提供算力支持,促进社区的快速发展。
ModelScope主要服务和工具:
- ModelScopeEval:一个用于简化大模型评估和性能基准测试的高效、可定制框架。
- ScopeSwift:魔搭大模型训练推理工具箱,支持多种模型及训练方式。
- ModelScope-Agent:连接ModelScope模型能力与万物的桥梁,一个智能体框架。
ModelScope社区推荐了多个高质量的数据集,以下是一些精选的数据集:
- MINT-1T-HTML:这是一个开源多模态INT交叉数据集,包含1万亿个文本标记和34亿张图像,是现有开源数据集的10倍。它旨在促进多模态预训练研究。
- SafeMTData:由上海人工智能实验室推出,专注于大型语言模型在多轮交互中的安全对齐,包含1680个安全的多轮对话。该数据集基于断路器训练数据集策划而成,已经过过滤以避免与Harmbench的数据污染。
- Data-Juicer的T2V-Evolution数据池:Data-Juicer提出了一个专为集成数据模型共同开发而量身定制的新型沙盒套件。该沙盒提供了一个全面的实验平台,可实现数据和模型的快速迭代和洞察力驱动的细化。Data-Juicer提出的“探测-分析-细化”工作流程已通过T2V-Turbo上的应用程序验证,并在VBench排行榜上取得了新的最高水平。
- Infinity-Instruct:智源千万级指令微调数据集,Llama 3.1仅微调即可接近GPT-4的性能。
- Omni-MATH:这是一个专注于数学问题解答的数据集,适用于训练和评估AI模型在数学推理和问题解决方面的能力。
- CCI3-Data:这个数据集可能包含了多种类型的数据,用于支持不同的AI应用和研究。
- chinese-cosmopedia:可能是一个专注于中文宇宙知识的数据集,用于增强AI模型在中文语境下的知识理解和应用。
- Chinese Fineweb Edu Dataset:这是一个中文教育领域的数据集,可能包含了丰富的教育资源和信息,适用于教育技术领域的AI模型训练。
这些数据集覆盖了多模态学习、安全对齐、数学问题解答、多语言处理等多个领域,为AI研究和应用提供了丰富的资源。通过ModelScope社区,研究人员和开发者可以方便地获取和使用这些数据集,以推动AI技术的发展和创新。
ModelScope社区动态:
ModelScope社区不断更新,提供最新的AI模型和应用。例如,社区提供了Llama-3系列最佳实践、七天入门LLM大模型学习课程等教育资源,以及AIGC专题课程,旨在培养学习者的创新能力和专业技能。
ModelScope魔搭社区是一个充满活力的AI模型开源社区,它通过提供丰富的模型资源、易用的工具和平台、以及强大的云生态支持,为AI开发者和研究人员提供了一个优秀的合作和创新平台。随着社区的不断发展和壮大,ModelScope有望成为国内AI领域的一个重要交流和合作平台,促进AI技术的普及和应用。
评论

全部评论

暂无评论
热门推荐
相关推荐
CivitAI - AI模型训练社区
CivitAI是一个专注于人工智能模型训练的平台,旨在为开发者、数据科学家和企业提供一个高效、可扩展的环境,以训练和部署机器学习模型天工AI大模型
昆仑万维天工AI大模型是昆仑万维集团自主研发的一系列大型语言模型(LLMs),旨在通过先进的自然语言处理和深度学习技术,为用户提供高效、智能的服务和体验。该系列模型不仅具备强大的语言理解和生成能力,还广泛应用于教育、企业客服、新闻媒体、创意产业、医疗、法律咨询、金融服务等多个行业。Arthur Engine
Arthur Engine是Arthur公司精心打造的一款实时AI评估引擎,它专为监控、调试和改进生成式AI及传统机器学习(ML)模型而设计。这款工具的最大亮点在于其开源性质,无需依赖第三方工具,即可实现数据隐私安全的同时,提供高效、灵活的AI监控与评估服务。Baichuan-NPC
Baichuan-NPC 是百川智能最新推出百川角色大模型,它通过深度优化角色知识库和对话引擎,赋予了游戏角色更加生动和真实的对话与行为表现。Baichuan-NPC 不仅能够理解复杂的上下文信息,还能根据角色性格进行自然而富有个性的互动,让游戏世界中的角色仿佛有了生命。百川大模型
百川大模型是百川智能基于先进的深度学习技术和大规模语料库训练得到的语言模型。它具备强大的自然语言处理能力和理解能力,能够生成自然、流畅、富有逻辑性的文本内容。包括闭源模型Baichuan4-Turbo、Baichuan4-Air和开源模型如Baichuan2-13B、Baichuan2-7B。开搜AI搜索
开搜AI搜索,这款国产的AI搜索引擎平台,致力于为用户提供如同Google搜索般高效、便捷的搜索体验。它利用先进的AI技术,精准把握用户的搜索意图,快速呈现最相关、最可靠的信息,让您无需像使用soso搜索时那样翻阅多个网页。纳米AI搜索
纳米AI搜索(简称纳米搜索)是由360集团近期推出的一款基于先进AI技术构建的多模态内容创作引擎,该产品已上架至苹果App Store和安卓应用商店,直接对标百度、阿里夸克、秘塔AI、Perplexity AI等多个AI搜索类产品。MMaDA
MMaDA是由普林斯顿大学、字节跳动、清华大学及北京大学联合研发的多模态扩散大语言模型,旨在突破传统多模态模型在架构统一性与后训练方法上的局限性。其核心目标是通过统一的扩散架构,实现文本推理、多模态理解与图像生成的跨领域卓越性能。
0
0