首页
AI工具集
AI资讯
AI活动
AI社区
AI短剧
AI创作大赛
AI小说
AI绘画
AI视频
AI对口型
视频转动漫风格
AI创意二维码
AI艺术字
AI智能抠图
AI短视频创作
AI 对话
我要提交AI工具
AI大模型
开搜AI搜索
开搜AI搜索,这款国产的AI搜索引擎平台,致力于为用户提供如同Google搜索般高效、便捷的搜索体验。它利用先进的AI技术,精准把握用户的搜索意图,快速呈现最相关、最可靠的信息,让您无需像使用soso搜索时那样翻阅多个网页。
DeepSeek
DeepSeek是由幻方量化于2023年4月创立的一家AI公司,专注于开发高性能的大语言模型。DeepSeek的DeepSeekChat已经通过了北京市生成式人工智能服务备案,并计划向公众开放服务。
讯飞星火
讯飞星火大模型是一款科大讯飞倾力打造的AI对话大模型产品,凭借其卓越的跨领域知识与语言理解能力,正逐步成为用户的得力助手。通过自然对话的方式,讯飞星火能够精准理解与执行用户指令,涵盖写作、绘画、搜索、问答、翻译、阅读等多元化功能。最新推出的讯飞星火4.0Turbo,在七大核心能力上更是全面超越GPT
Genie 3 - 世界模型
Google DeepMind最新发布的Genie 3 AI世界模型,能够通过文本提示实时生成可交互3D虚拟世界。24fps流畅运行,支持物理建模、自然环境模拟等功能,为游戏开发、教育培训带来革命性变化。
Amazon Bedrock
Amazon Bedrock是亚马逊云科技推出的全球最大AI模型平台,属于完全托管服务。它就像一个“AI模型超市”,通过单个API,把AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI和亚马逊自家等领先人工智能公司的高性能基础模型汇聚在一起
GPT-5
GPT-5是OpenAI最新发布的革命性大语言模型,提供GPT-5标准版、Mini版和Nano版三个版本。集成多模态能力、推理功能和验证器技术,支持免费使用,为用户提供更智能的AI对话、内容创作和编程辅助体验。
零一万物
零一万物是李开复成立的一家专注于AI 2.0大模型技术研发与应用的创新企业。在AI 2.0时代,大模型成为核心技术,它能够处理海量数据,具备强大的通用性和创造性,可跨领域、跨媒体、跨语言地执行各种任务。零一万物以大模型为基础,致力于打造一个开放、共享、协作的大模型平台。
ThinkSound
ThinkSound是阿里巴巴通义实验室推出的全球首款音频生成模型。它采用先进的链式推理(Chain-of-Thought,CoT)技术,能够深入分析视频画面的场景、动作与情感,进而生成与之高度匹配的音效。无论是自然风声、城市喧嚣,还是角色对话与物体碰撞音,ThinkSound都能实现音画高保真同步
Marey Realism
Marey Realism由洛杉矶初创公司Moonvalley与AI动画工作室Asteria联合开发,其命名致敬电影运动分析先驱Étienne-Jules Marey。作为全球首款完全基于授权数据训练的企业级AI视频模型,Marey的核心定位是“辅助而非取代专业创作者”,
SmolLM3
SmolLM3是全球知名的大模型开放平台Hugging Face于2025年7月9日发布并开源的小参数模型。它仅有30亿参数,却性能卓越,超越了Llama-3.2-3B和Qwen2.5-3B等同类开源模型。该模型具备128k上下文窗口,可处理英语、法语等6种语言文本,还支持深度思考和非思考双推理模式
AniSora
Bilibili(B站)的开源动漫视频生成模型AniSora是专为动漫视频生成设计的综合系统,该模型具备海量数据支持、时空掩码技术、专业评估体系三大核心优势,可一键生成多种动漫风格的视频内容,显著降低创作门槛并提升制作效率。
百炼
大模型服务平台百炼是阿里云精心打造的一站式大模型开发及应用构建平台。它整合了阿里云强大的云计算资源、先进的人工智能技术以及丰富的行业经验,为用户提供了从模型选择、开发、训练到应用构建、部署的全流程服务。无论是经验丰富的开发者,还是对技术不太熟悉的业务人员,都能在百炼平台上轻松开展大模型相关工作。
OceanGPT沧渊
OceanGPT(沧渊)是面向海洋科学与工程任务的专业领域大语言模型。该模型立足通用人工智能,融合大语言模型、知识图谱、生成式AI、具身智能体等AI新技术,服务于AI海洋科学研究,由海洋精准感知技术全国重点实验室(浙江大学)牵头,联合浙江大学计算机学院、海洋学院及东海实验室等多学科交叉团队研制。
SongGeneration
SongGeneration是腾讯AI Lab正式推出并开源的一款音乐生成大模型。它旨在解决音乐生成领域中普遍存在的音质、音乐性和生成速度等三大难题,通过先进的技术架构和算法,实现高质量音乐作品的自动创作。
Ming-Omni
Ming-Omni是由Inclusion AI与蚂蚁集团联合推出的开源多模态模型,其核心亮点在于统一处理图像、文本、音频和视频,并支持语音与图像生成,成为首个在模态支持能力上与GPT-4o媲美的开源模型。
Mistral AI
Mistral AI成立于2023年4月,总部位于法国巴黎,作为欧洲AI领域的领军企业,Mistral致力于通过开源模型与商业化服务,打破美国科技巨头的垄断,为全球开发者提供高性能、可信赖的AI解决方案。
ChatOne
ChatOne是一款由深圳市奇思妙物科技有限公司开发的AI大模型聚合平台,整合国内外主流AI模型(如GPT-4、文心一言等),提供多场景智能交互服务。其核心定位为“一站式AI生产力工具”,通过自然语言交互实现内容创作、知识管理、客服自动化等功能,旨在降低AI技术使用门槛,提升个人与企业效率。
dots.llm1
dots.llm1是小红书Hi Lab研发的1420亿参数专家混合模型(MoE),采用稀疏激活架构,推理时仅激活140亿参数。这一设计在保持高性能的同时,大幅降低了训练和推理成本。模型支持中英双语,上下文长度达32,768个token,适用于语义理解、知识问答、代码生成等多场景任务.
Bland TTS
Bland TTS是Bland AI公司推出的新一代文本转语音(Text-to-Speech)引擎,其核心突破在于将大型语言模型(LLM)与语音合成技术深度融合,实现了"一键克隆任意人声"与"多维度风格混搭"的双重创新。
Shisa.AI
Shisa.AI是一家总部位于日本东京的AI实验室,专注于为日本市场开发开源的AI语言和语音模型。公司致力于通过优化后训练流程和合成数据驱动的方法,提升AI模型在日语环境下的性能,推动日语AI应用的发展。Shisa V2405B模型,这一开源模型被誉为“日本有史以来训练的最强大型语言模型“。
Video-XL-2
Video-XL-2是智源研究院联合上海交通大学等机构于2025年6月发布的超长视频理解模型,其核心突破在于单张显卡即可处理万帧级视频输入(约1小时时长的30FPS视频),同时保持轻量化设计(参数规模远低于720亿参数的闭源模型)。
方糖大模型
方糖大模型是像素蛋糕自主研发的AI影像生成与处理系统,专为商业摄影、广告营销、影视制作、游戏开发等场景设计。其核心优势在于通过百亿级参数规模与多尺度分层蒸馏技术,实现高效、高质量的图像生成与编辑,同时符合国家政策对安全性和规范性的严格要求。
EVI3
EVI3是Hume公司在2025年5月29日正式发布全新语音语言模型,这一创新标志着通用语音智能领域进入的发展阶段。作为全球首个突破传统文本到语音(TTS)技术框架的语音到语音(V2S)模型,EVI3不仅重新定义了语音交互的边界,更通过多模态情感计算能力为AI语音技术树立了新的技术标杆。
MMaDA
MMaDA是由普林斯顿大学、字节跳动、清华大学及北京大学联合研发的多模态扩散大语言模型,旨在突破传统多模态模型在架构统一性与后训练方法上的局限性。其核心目标是通过统一的扩散架构,实现文本推理、多模态理解与图像生成的跨领域卓越性能。
MNN
MNN(Mobile Neural Network) 是一个专为移动端和边缘设备优化的高性能推理引擎,支持多种深度学习模型的本地化部署。其最新推出的MnnLlmApp是基于MNN框架的移动端多模态大模型应用,通过集成Qwen-2.5-Omni系列模型,首次实现了文本、图像、音频、视频的跨模态交互能力
ACE-Step(音跃)
ACE-Step(音跃)是阶跃星辰与ACE Studio于2025年5月7日联合发布并开源的音乐大模型,它是一款以生成式AI技术为核心的音乐创作工具,参数量为3.5B,支持包括LoRA和ControlNet在内的多种微调方式,可灵活适配音频编辑、人声合成、伴奏生成、声线克隆、风格迁移等多种下游任务
CausVid
CausVid是一种基于自回归因果推理架构的AI视频生成模型,专为解决传统模型“生成速度慢、长视频质量差”的痛点而设计。由麻省理工学院计算机科学人工智能实验室(CSAIL)与 Adobe Research 联合研发,这一混合模型可以在几秒钟内生成高质量视频。
Parakeet-TDT-0.6B-V2
Parakeet-TDT-0.6B-V2是英伟达在语音识别技术领域的又一力作,它基于先进的FastConformer架构,并融合了创新的TDT解码器,是一款专注于英文自动语音识别的强大模型。作为Parakeet模型的升级版本,它不仅继承了前代模型的优秀基因,还在性能和功能上实现了重大突破。
MiMo-7B
MiMo-7B是小米AI实验室发布的首个专为推理(Reasoning)设计的开源大模型,该模型以7亿参数的轻量化架构,结合强化学习优化,展现了在数学、代码和通用推理任务上的卓越性能,甚至超越了多个32亿参数以上的基线模型。
F-Lite
F-Lite是一款基于扩散变换器架构的文本到图像生成模型,由Black Forest Labs开发并于2025年最高1024x1024图像,并具备开源特性,适用于正式登陆Hugging Face平台。该模型以10亿参数的轻量化设计,实现了高效、低成本的图像生成能力,支持通过自然语言提示生成高分辨率
ChatDLM
ChatDLM是Qafind Labs于2025年推出的新一代对话生成大模型,通过融合"区块扩散(Block Diffusion)"与"专家混合(MoE)"技术,该模型在保持7B参数量级的同时,实现了A100 GPU上2800 tokens/s的推理速度,较GPT-4等通用模型提升3-5倍。
EmaFusion
EmaFusion是Ema公司推出的一款新型AI语言模型,它采用了一种创新的“级联”判断系统,能够动态平衡成本和准确性。与传统的单一策略系统相比,EmaFusion更像是一个“任务智能大脑”,能够智能地拆解复杂的问题,并将其分配给最合适的AI模型来解决。
Vidi
Vidi是字节跳动推出的一款全新多模态模型,它专注于视频理解与编辑领域,旨在通过融合视觉、音频和文本等多种模态信息,为用户提供精准、高效的视频处理解决方案。Vidi不仅能够处理长达一小时的超长视频,还能在时间检索和多模态协同处理方面展现出卓越的性能。
Flex.2-preview
Flex.2-preview是由Ostris团队发布的一款基于8亿参数的文本到图像扩散模型,专为集成到ComfyUI工作流设计。该模型在Hugging Face上开源,采用Apache2.0许可证,凭借其强大的控制能力与高效生成特性,迅速成为AI艺术创作社区的焦点。
Dia
Dia是由Nari Labs团队开发的一款拥有1.6亿参数的文本转语音(TTS)模型。它旨在直接从文本提示生成自然对话,并支持包括情绪语调、说话人标记以及(笑)、(咳嗽)、(清嗓子)等非语言音频提示等细致功能。这些功能仅通过纯文本即可实现,使得Dia在语音生成领域具有极高的灵活性和实用性。
Magi-1
Magi-1是一款由Sand.ai团队研发的自回归视频生成模型。它采用了先进的深度学习技术,通过预测视频块序列(这些视频块是连续帧的固定长度片段)来生成高质量的视频内容。Magi-1不仅支持因果时间建模,还能实现自然的流式生成,为用户提供了极大的创作自由和灵活性。
Nes2Net
Nes2Net是专为语音防伪检测量身打造的深度学习模型架构,它直接处理高维特征以避免信息损失,通过独特的嵌套结构实现多层次、多粒度的特征交互,具备无降维处理、多尺度特征提取、轻量化设计以及强鲁棒性与泛化能力等特点,能有效识别多种伪造声音类型,在提升检测精度的同时降低计算成本。
MAI-DS-R1
MAI-DS-R1是微软在DeepSeek-R1基础上进行魔改后推出的全新开源模型。它继承了DeepSeek-R1的推理性能,同时在响应敏感话题和降低安全风险方面进行了大幅度增强。这一模型旨在为用户提供更加智能、安全、多语言的AI交互体验。
SpatialLM
SpatialLM是杭州群核科技自主研发的一款专为三维空间理解设计的大语言模型。它能够从普通手机或相机拍摄的视频中,快速生成物理正确的3D场景布局。这一能力使得SpatialLM在无需昂贵激光雷达或专业设备的情况下,就能实现高精度的空间数据采集与处理。
OmniTalker
OmniTalker是阿里通义实验室开发的一款基于深度学习和多模态融合技术的新型数字人视频生成大模型。它能够通过上传一段参考视频,实现对视频中人物的表情、声音和说话风格的精准模仿,从而生成高度逼真的数字人视频。
Kimi-VL
Kimi-VL与Kimi-VL-Thinking是由国内知名人工智能公司Moonshot AI(月之暗面)于近期开源发布的两款视觉语言模型。这两款模型以其轻量级的架构和卓越的多模态理解与推理能力,迅速在行业内引起了广泛关注。它们不仅在多项基准测试中超越了包括GPT-4o在内的众多大型模型。
地球AI大脑
谷歌地球AI大脑是谷歌最新推出的一个地理智能分析平台,它整合了图像、地图、天气数据等多种信息,并利用AI模型进行深度学习。这个强大的系统可以自动理解并回答与地理位置相关的复杂问题,为人类提供前所未有的洞察能力。
Nova Sonic
Nova Sonic是亚马逊近期推出的一款新一代AI语音模型,旨在进一步提升其语音助手Alexa+的性能。这款模型通过整合语音理解和生成的能力,为用户带来更加自然流畅的对话体验。Nova Sonic的推出,标志着亚马逊在语音识别技术领域再次取得了重大突破。
Sec-Gemini v1
Sec-Gemini v1是谷歌基于其Gemini模型构建的一款全新AI安全模型。它集成了Gemini的先进推理能力,并结合了近乎实时的网络安全知识和工具,旨在帮助网络安全专业人员更有效地应对网络威胁,提升威胁情报分析、漏洞理解和事件响应的效率。
DeepCoder-14B-Preview
DeepCoder-14B-Preview是一款专为编码推理设计的生成式AI模型。它是在Deepseek-R1-Distilled-Qwen-14B基础之上,通过分布式强化学习(RL)进行了微调而成。该模型不仅性能卓越,而且开源内容丰富,为开发者提供了深入理解和研究模型开发流程的机会。
Llama3.1 Nemotron Ultra 253B
Llama3.1 Nemotron Ultra 253B是英伟达(NVIDIA)于2025年4月8日发布的最新大型语言模型(LLM)。这款模型基于Meta的Llama-3.1-405B-Instruct开发,通过创新的神经架构搜索(NAS)技术进行了深度优化,旨在提供高效、高性能的AI解决方案。
Lipsync-2
Lipsync-2是由Sync Labs公司推出的全球首个零-shot嘴型同步模型。在Ai视频技术发展的当下,嘴型同步技术对于提升视频的真实感和表现力至关重要。传统的嘴型同步技术往往需要大量的训练数据和针对特定演讲者的预训练,过程繁琐且效率低下而Lipsync-2的出现,打破了这一传统模式的束。
HiDream-I1
HiDream-I1是由千象HiDream ai(智象未来)团队打造的国产开源图像生成模型。它基于扩散模型技术,拥有17亿参数,这一规模在开源模型中颇具竞争力,能够依据文本描述生成高质量图像,为众多领域带来了全新的图像创作解决方案。
Llama
Meta Llama模型是Meta研发的大型语言模型系列,它基于先进的深度学习架构,旨在处理和理解自然语言。Llama模型以其强大的语言处理能力和广泛的应用场景,成为了AI领域的一款全能选手。无论是文本生成、语言理解,还是多模态交互,Llama模型都能展现出其卓越的性能。
Quasar Alpha
Quasar Alpha是一款近期神秘亮相的全新AI模型,由一家未具名的模型实验室推出,被称为其首款“隐秘”模型,是即将发布的长上下文基础模型的预发布版本。它凭借超长的上下文处理能力、优化的编码能力,以及免费开放策略,迅速成为业界热议焦点,为AI技术发展增添了新期待。
EasyControl
EasyControl是一个在人工智能绘画领域具有创新意义的框架,专为基于 Transformer 架构的扩散模型(DiT)设计,旨在提供高效且灵活的条件控制能力,犹如为DiT模型装上了强大的“ControlNet
Arthur Engine
Arthur Engine是Arthur公司精心打造的一款实时AI评估引擎,它专为监控、调试和改进生成式AI及传统机器学习(ML)模型而设计。这款工具的最大亮点在于其开源性质,无需依赖第三方工具,即可实现数据隐私安全的同时,提供高效、灵活的AI监控与评估服务。
GeometryCrafter
GeometryCrafter是腾讯研发团队发布的一款专为开放世界视频设计的全新AI模型。该模型的核心在于其能够从复杂多变的开放世界视频中,提取并生成一致的几何信息。所谓“开放世界视频”,涵盖了内容多样、场景切换频繁、视角变化丰富的各类视频素材,如街头实拍、旅行记录、自然风光纪录片等。
GAIA-2
GAIA-2是Wayve公司最新推出的一款专为辅助驾驶和自动驾驶设计的视频生成世界模型。它利用先进的生成式人工智能技术,能够模拟出各种复杂的驾驶场景,为自动驾驶系统的训练和验证提供丰富、多样的数据支持。
TxGemma
TxGemma是谷歌AI推出的一款专为药物开发设计的通用大规模语言模型(LLM)系列。它整合了来自不同领域的数据集,旨在优化药物开发流程,提高开发效率和成功率。
DeepSeek-V3-0324
DeepSeek-V3-0324是DeepSeek在3月25日推出的一款拥有685亿参数的先进文本生成模型,它支持BF16和F32张量类型,能够高效地进行推理和文本生成。这款模型的定位非常明确,就是为自然语言处理领域的研究人员、开发者以及内容创作者提供一个强大的工具,帮助他们在文本生成领域取得突破。
Chirp 3
高清语音模型 Chirp 3 是谷歌云推出的一款先进语音合成工具,支持 248 种不同声音和 31 种语言,能够捕捉人类语调的细微差别,生成生动自然的语音,并通过 Vertex AI 平台向开发者开放,助力程序创新。
Thera
Thera是一款基于深度学习的图片超分辨率模型。它能够通过学习低分辨率图像与高分辨率图像之间的映射关系,将模糊或低分辨率的图像转换为清晰、高分辨率的图像,简单理解就是免费提升图片清晰度。与传统的图像放大方法不同,Thera采用了更为先进的算法和模型结构,实现了更高质量的图像重建。
VACE
阿里通义Wan团队推出的视频生成和编辑模型VACE,是一款集多功能于一体的创新工具,它支持按条件生成视频、精确控制物体运动轨迹、一键替换视频主体、风格迁移、画面扩展及静态画面动态化等,极大地提升了视频创作的效率和趣味性,为视频内容创作领域带来了全新的可能性。
Gemma 3
Gemma-3是谷歌最新开源的多模态大模型,主打低成本高性能。该模型共有1B(10亿)、4B(40亿)、12B(120亿)和27B(270亿)四种参数规模,即便最大的27B参数模型,也只需要一张Nvidia H100显卡就能高效推理。相比同类模型,Gemma-3在达到相同效果时,算力需求降低了10倍
Babel
Babel是阿里巴巴达摩院推出一款专为多语言处理而设计的开源大型语言模型。不仅支持全球使用人数最多的前 25 种语言,覆盖超 90% 的世界人口,它还将触角伸向了斯瓦希里语、爪哇语、缅甸语这类在开源大语言模型(LLM)领域鲜有人问津的语种。这一极具前瞻性的行动,势必将为数十亿以这些语言服务
QwQ-32B
QwQ-32B是阿里巴巴旗下的Qwen团队最新推出的一款开源大型语言模型(LLM)。这款模型拥有320亿参数,旨在通过强化学习(RL)提升在复杂问题解决任务上的性能。QwQ-32B继承了前代模型在数学和编码任务中的出色表现,并通过进一步的技术优化和创新,成为了推理AI领域的重要竞争者。
CogView4
CogView4是智谱AI推出的开源中文文生图模型。CogView4 的参数规模精准布局至 6 亿,这一参数规模,为模型构建了一个庞大且高效的 “智慧中枢”,赋予其极为强大的运算和学习能力。还全面支持中文输入和中文文本到图像的生成,被称其为“首个能在画面中生成汉字的开源模型”
火山方舟
火山方舟是火山引擎旗下的大模型服务平台,定位为面向企业提供全面的模型即服务(MaaS,Model-as-a- Service)解决方案。它汇聚百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家 AI 科技公司及科研院所的大模型,打破模型资源分散的局面。
Gitee AI(模力方舟)
Gitee AI(模力方舟)是开源中国针对中国市场和用户需求,推出的一站式AI大模型托管平台。它致力于构建一个活跃的开发者社区,为开发者提供从模型托管、训练、部署到应用落地的全方位服务。通过汇聚最新的AI模型、数据集和应用场景,旨在帮助开发者和企业更高效地实现AI技术的落地和应用。
Magma AI
Magma是一款由微软精心打造的多模态AI模型,它旨在处理和整合图像、文本和视频等多种数据类型。与传统的AI系统不同,Magma不仅仅专注于视觉-语言理解或机器人操作等单一领域,而是将这两种能力结合成一个统一的模型,使得AI代理能够在数字和物理环境中执行更为复杂的任务。
DeepSeek Janus-Pro
DeepSeek Janus-Pro是由中国人工智能初创公司DeepSeek于2025年1月28日发布的开源多模态AI模型。该模型主要应用于文本生成图像(文生图)领域,通过先进的算法和丰富的训练数据,实现了高质量的图像生成和多模态理解。
子曰-o1
“子曰-o1”是网易有道基于多年教育数据和AI技术积累,推出的一款轻量级推理模型。它采用14B的小参数设计,能够在普通消费级显卡上高效部署,专为教育场景设计。该模型利用思维链技术,通过自我对话和纠错机制,在解题时输出详细的思考过程,帮助学生理解解题逻辑,提升学习效果。
Gemini 2.0 Flash Thinking
Gemini 2.0 Flash Thinking是谷歌推出的一款具有推理能力的智能助手模型,它基于先进的人工智能技术开发,旨在加速和简化复杂的思考过程。该模型不仅继承了Gemini 2.0系列的强大功能,还通过特别训练,能够在回答问题时展示其“思考过程”,为用户提供更深入、更透明的分析体验。
Qwen Chat
Qwen Chat是阿里通义千问团队推出的一个集成多种Qwen AI大模型的Web UI界面,它为用户提供了一个强大且高效的AI交互平台。该平台基于先进的AI技术,集成了多种Qwen AI大模型,旨在为用户提供丰富多样的功能,以满足不同场景下的需求。
朱雀大模型检测
验室上线的这款AI生成图片与文章鉴别工具-朱雀大模型检测,是一款基于深度学习和自然语言处理技术的智能检测平台。它通过对上传的图片和文章进行深度分析,捕捉真实与AI生成内容之间的差异,从而实现对AI生成内容的准确鉴别
Sana
Sana是英伟达开源的一款先进图像生成模型,它采用了深度压缩自编码器(DC-AE)和线性扩散变换器(DiT)等创新技术,能够在保持高质量图像生成的同时,实现极快的生成速度。这款模型支持生成高达4096×4096分辨率的图像,并且在16GB显卡上即可流畅运行,满足了广大用户对于高效图像生成的需求
天工AI大模型
昆仑万维天工AI大模型是昆仑万维集团自主研发的一系列大型语言模型(LLMs),旨在通过先进的自然语言处理和深度学习技术,为用户提供高效、智能的服务和体验。该系列模型不仅具备强大的语言理解和生成能力,还广泛应用于教育、企业客服、新闻媒体、创意产业、医疗、法律咨询、金融服务等多个行业。
无问芯穹
无问芯穹(Infinigence),一个专为大型模型应用开发者量身打造的企业级AI服务平台,正引领着我们步入AIGC(人工智能生成内容)的新纪元。它致力于在AI 2.0时代提供创新解决方案,搭建起大模型与多样化芯片之间的高效部署桥梁,为通用人工智能(AGI)时代的基础设施建设贡献力量。
AGI-Eval
AGI-Eval,一个由上海交通大学、同济大学、华东师范大学及DataWhale等知名高校与机构强强联合打造的大模型评测社区,正以“评测助力,让AI成为人类更好的伙伴”为使命,致力于构建一个公正、可信、科学且全面的评测生态体系。这一平台专注于评估基础模型在人类认知与问题解决任务中的通用能力,通过一系
纳米AI搜索
纳米AI搜索(简称纳米搜索)是由360集团近期推出的一款基于先进AI技术构建的多模态内容创作引擎,该产品已上架至苹果App Store和安卓应用商店,直接对标百度、阿里夸克、秘塔AI、Perplexity AI等多个AI搜索类产品。
讯飞星辰
讯飞星辰作为科大讯飞倾力打造的AI大模型定制训练平台,致力于为用户打造独一无二的专属大模型。该平台汇聚了超过20个在行业内广受认可的优质模型,诸如星火大模型、Llama3等,均在其列。更为便捷的是,讯飞星辰支持零代码微调功能,极大地降低了大模型精调的复杂性和门槛。
魔多
魔多AI社区是厚德云旗下一个专为AI创作者打造的趣玩社区,集算力GPU云服务器、模型与镜像分享、在线工作流、在线模型训练、算力激励等为一体的AI创作生态社区
Hugging Face
Hugging Face成立于2016年,作为全球大模型领域举足轻重的开放平台,最初以开发聊天机器人起步,怀揣着让人工智能技术惠及大众的愿景,逐渐转型为专注于开源人工智能,尤其是自然语言处理(NLP)技术,发展至今,它已构建起涵盖模型、工具、数据集以及活跃社区的庞大生态体系。
炉米Lumi-AI模型分享社区平台
炉米Lumi是由字节跳动推出的一个AI模型分享社区平台,旨在满足日益增长的AI模型交流与应用需求。该平台由字节跳动内部孵化,定位为一个融合模型分享、工作流搭建和模型训练的综合性平台,旨在促进AI技术在各个领域的广泛应用和深入发展。
魔搭社区
ModelScope魔搭社区是一个由阿里巴巴达摩院联合CCF开源发展委员会共同推出的中文AI模型开源社区。它致力于汇集业界领先的模型和丰富的数据集,为科研机构和科技公司提供一个分享和建设的平台。ModelScope的推出旨在降低AI应用门槛,推动技术创新和原创性模型研究的发展。
CivitAI - AI模型训练社区
CivitAI是一个专注于人工智能模型训练的平台,旨在为开发者、数据科学家和企业提供一个高效、可扩展的环境,以训练和部署机器学习模型
美图奇想大模型
美图奇想大模型(MiracleVision)是由美图公司推出的AI服务平台,专注于人脸技术、人体技术、图像识别、图像处理、图像生成等核心领域。该模型由美图影像研究院提供技术支持和保障,致力于为客户提供经市场验证的专业AI算法服务和解决方案。
Stability AI
Stability AI是一家知名的人工智能公司。该公司在 AIGC 领域具有一定影响力,其推出的文本到图像生成模型 Stable Diffusion 广为人知。Stable Diffusion 的特点是全面开源,用户配置一张家用中高端显卡,就能在本地训练和部署 AI 模型。
小悟空AI
小悟空基于大语言模型的AI工具合集,用智慧的服务,满足用户的工作、生活和娱乐需求。该应用还具有智能对话功能,可以解决用户遇到的问题并进行辅助推荐。
天幕大模型
“天幕”大模型是万兴科技推出的一款集视频、音频、图片、文本等多种模态于一体的百亿级参数多媒体大模型。该模型旨在通过先进的人工智能技术,为创意产业带来革命性的变革,让创作者能够以前所未有的方式表达创意。
Baichuan-NPC
Baichuan-NPC 是百川智能最新推出百川角色大模型,它通过深度优化角色知识库和对话引擎,赋予了游戏角色更加生动和真实的对话与行为表现。Baichuan-NPC 不仅能够理解复杂的上下文信息,还能根据角色性格进行自然而富有个性的互动,让游戏世界中的角色仿佛有了生命。
子曰
网易旗下“子曰”教育大模型六大应用成果——虚拟人口语教练Hi Echo、LLM翻译、AI作文指导、语法精讲、AIBox、文档问答。
面壁露卡
「面壁露卡 Luca」是面壁智能基于自研千亿参数基座模型 CPM 打造的多模态智能对话助手。
九章大模型MathGPT
学而思九章大模型(MathGPT)作为国内首个教育领域千亿参数大模型以及首批通过备案的教育大模型,宛如一颗璀璨新星,照亮了智慧教育前行的道路。它的诞生,不仅是技术的突破,更是教育理念与先进科技深度融合的结晶。接下来,让我们一同深入探索这一具有划时代意义的大模型。
天工AI搜索
天工AI搜索 是由昆仑万维开发的一种AI搜索引擎,它融入了大语言模型的能力,提供智能、高效、快速的搜索体验。
天工开放平台
天工开放平台,作为一家综合性技术平台,致力于提供多样化的服务和产品,以促进技术的创新和应用的发展。该平台涵盖了天工AI搜索、天工3.0大模型、搜索引擎服务,AI写作、AI陪伴以及AI音乐产品等多个领域,充分展示了其在人工智能行业的深远影响。
liblibAI
Liblib社区,也被称为哩布哩布AI,是一个专注于AI绘画的原创模型分享社区。它由北京奇点星宇科技有限公司提供,致力于激发原创AI模型和素材的创作。在这个平台上,用户可以找到最新、最热门的模型素材,并且可以免费下载超过10万个原创模型。
豆包AI官网
豆包AI(doubao)是字节跳动开发的AI智能助手,能通过文字与用户互动,提供聊天、知识解答、创意内容生成等服务,像回消息、解数学题、写文案都不在话下。它基于先进技术,持续优化以理解用户需求,为大家带来便捷的智能交互体验,是日常生活和工作中可信赖的AI助手。
文心一言
文心一言是百度推出的新一代知识增强大语言模型,属于文心大模型家族的新成员。这个模型能够与人进行对话互动、回答问题、协助创作,旨在帮助人们高效便捷地获取信息、知识和灵感。
书生大模型
书生大模型由上海人工智能实验室倾力打造,模型凭借其庞大的参数规模与卓越的功能特性,在语言理解、数学解题、图文创作等多个维度上展现出了非凡的实力。书生大模型家族涵盖了多个杰出成员,诸如书生·多模态、书生·浦语以及书生·天际等,它们在性能卓越的同时,也在各自的专业领域内发挥着不可替代的作用。
Minimax
MiniMax成立于2021年12月,是一家在通用人工智能领域迅速崛起的科技公司。自成立以来,MiniMax始终秉持“与用户共创智能”的核心理念,致力于推动人工智能技术的突破与应用。公司自主研发了多模态的通用大模型,包括文本、语音、图像、视频等多个领域,为全球企业和个人开发者提供了强大的AI技术支持
日日新SenseNova
日日新SenseNova大模型是商汤科技推出的一款综合性人工智能大模型。它基于商汤科技深厚的学术积累和技术研发实力,集成了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种能力。
紫东太初大模型
紫东太初大模型是由中国科学院自动化研究所与武汉人工智能研究院联合研发,是全球领先的跨模态通用人工智能平台,也是一个千亿参数级别的多模态大模型,它能够实现文本、图像、音频、视频、传感信号和3D点云等多种数据模态的统一表示和互相生成。
百川大模型
百川大模型是百川智能基于先进的深度学习技术和大规模语料库训练得到的语言模型。它具备强大的自然语言处理能力和理解能力,能够生成自然、流畅、富有逻辑性的文本内容。包括闭源模型Baichuan4-Turbo、Baichuan4-Air和开源模型如Baichuan2-13B、Baichuan2-7B。
智谱清言
智谱清言是由北京智谱华章科技有限公司推出的一款生成式AI助手,也可被称为ChatGLM。它集文本生成、图片生成、音视频生成等多种功能于一体的智能创作系统,基于深度学习技术,可以实现文章自动生成、智能改写、关键词提取等功能。
360智脑
360智脑是360公司自主研发的认知型通用大模型,依托其在算力、数据和工程化领域的长期积累,集成360GPT大模型、360CV大模型及多模态技术能力,构建起覆盖文本、图像、语音、视频的跨模态生成体系。
Signature AI
Signature AI,一家领先的私有AI人工智能服务提供商,致力于帮助企业构建专注于安全、保障和知识产权增长的私有AI模型,同时确保卓越的输出质量。以下是对Signature AI的详细介绍。
通义千问
阿里通义千问是阿里云自主研发的超大规模语言模型,它经过海量数据训练,具备跨领域的知识和语言理解能力。无论是知识问答、学习辅导,还是技术咨询、创作辅助,通义千问都能提供全面、准确的信息和答案。在教育辅导、客户服务、内容创作与编辑等多个领域,通义千问都展现出了其强大的应用价值
谷歌Gemini
谷歌Gemini是一款由Google开发的多模态人工智能语言模型,它具备卓越的自然语言理解和生成能力,能够处理包括文本、图像、音频、视频和代码在内的多种信息类型。于2023年12月6日正式推出,包含了三种不同规模的模型:Gemini Ultra、Gemini Nano和Gemini Pro
MiniGPT-4-大模型
MiniGPT-4是一个融合了视觉编码器和高级大型语言模型(LLM)Vicuna的创新模型,二者通过一个投影层实现协同工作。该模型展现了与GPT-4相媲美的功能,例如能够生成详尽的图像描述,以及从手绘草图创建网站。