首页
AI工具集
AI资讯
AI活动
AI社区
AI短剧
AI创作大赛
AI小说
AI绘画
AI视频
AI对口型
AI创意二维码
AI艺术字
AI智能抠图
AI漫剧创作
AI 对话
我要提交AI工具
AI TOP100 搜您想要的
搜索
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。
AITOP100
2024-04-29
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
AITOP100
2024-03-29
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。
AITOP100
2024-02-29
比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁
近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。
AITOP100
2024-01-10
Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片
2024年将是AI视频年
AITOP100
2024-01-03
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
这个推理引擎速度有多快?在单个 NVIDIA RTX 4090 GPU 上运行 LLM ,PowerInfer 的平均 token 生成速率为 13.20 tokens/s,峰值为 29.08 tokens/s,仅比顶级服务器 A100 GPU 低 18%,可适用于各种 LLM。
AITOP100
2023-12-22
2.7B能打Llama 2 70B,微软祭出「小语言模型」,96块A100 14天训出Phi-2,碾压谷歌Gemini nano
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
AITOP100
2023-12-13
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
AITOP100
2023-12-13
没有搜索到内容哟!请换个内容关键词试试吧!
热点资讯
被全网刷屏的SBTI,背后没有心理学专家,只有一个想劝人戒酒的AI
一款名为SBTI的人格测试近期在社交媒体迅速走红,以幽默自嘲的标签(如"尤物"、“吗喽”)吸引大量用户参与。测试以MBTI为基础,由非心理学专业人士使用AI技术开发,初衷是劝朋友戒酒。测试定位为娱乐性质,火爆后网站一度崩溃,引发广泛讨论。
AI TOP100
2天前
AI应用
AI内容共创计划3月奖励公示|KOL专属福利来袭,Seedance2.0白名单优先解锁!
春启新程,创作不歇!咱们AITOP100「AI内容共创计划」3月份投稿公示正式来袭~
AI TOP100
9天前
AI活动
每日AI资讯-2026年4月09日
AI行业最新资讯:字节跳动发布全双工语音大模型Seeduplex、智元发布GO-2具身大模型首创动作思维链、腾讯云QClaw V2上线多Agent协同功能、即梦AI发布叙事工具"小章鱼"Octo、MiniMax发布MMX-CLI原生接入全模态模型、Anthropic上线Claude Managed Agents公测版、Meta发布个人超级智能模型Muse Spark。
AI TOP100
2天前
AI工具
AI技术
AI大模型
AI应用
每日AI资讯-2026年4月08日
AI行业最新资讯,包括:腾讯发布"龙虾"QBotClaw国内首个支持主流大模型API自由配置的AI浏览器、微软Bing团队开源"Harrier"多语言嵌入模型支持100+种语言、爱诗科技发布PixVerse C1支持15秒1080P音画同步的影视级大模型、GLM-5.1发布能独立工作8小时的开源智能模型、AI视频赛道神秘黑马Happy Horse横空出世超越Seedance2.0
AI TOP100
3天前
AI工具
AI技术
AI大模型
AI应用
中国广电联合会演员委员会严正声明:AI换脸、声纹克隆侵权行为将被全面追责
2026年4月2日,中广联演员委员会发布严正声明,直指AI深度合成技术普及下,未经授权的演员换脸、声纹克隆成网络侵权重灾区。声明明确三大核心禁令,压实平台责任,全面升级维权,为AI技术在演艺领域应用划出法律与行业红线,守护演员合法权益。
AI TOP100
9天前
AI应用
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。
AITOP100
2024-04-29
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
AITOP100
2024-03-29
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。
AITOP100
2024-02-29
比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁
近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。
AITOP100
2024-01-10
Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片
2024年将是AI视频年
AITOP100
2024-01-03
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
这个推理引擎速度有多快?在单个 NVIDIA RTX 4090 GPU 上运行 LLM ,PowerInfer 的平均 token 生成速率为 13.20 tokens/s,峰值为 29.08 tokens/s,仅比顶级服务器 A100 GPU 低 18%,可适用于各种 LLM。
AITOP100
2023-12-22
2.7B能打Llama 2 70B,微软祭出「小语言模型」,96块A100 14天训出Phi-2,碾压谷歌Gemini nano
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
AITOP100
2023-12-13
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
AITOP100
2023-12-13
没有搜索到内容哟!请换个内容关键词试试吧!
热点资讯
被全网刷屏的SBTI,背后没有心理学专家,只有一个想劝人戒酒的AI
一款名为SBTI的人格测试近期在社交媒体迅速走红,以幽默自嘲的标签(如"尤物"、“吗喽”)吸引大量用户参与。测试以MBTI为基础,由非心理学专业人士使用AI技术开发,初衷是劝朋友戒酒。测试定位为娱乐性质,火爆后网站一度崩溃,引发广泛讨论。
AI TOP100
2天前
AI应用
AI内容共创计划3月奖励公示|KOL专属福利来袭,Seedance2.0白名单优先解锁!
春启新程,创作不歇!咱们AITOP100「AI内容共创计划」3月份投稿公示正式来袭~
AI TOP100
9天前
AI活动
每日AI资讯-2026年4月09日
AI行业最新资讯:字节跳动发布全双工语音大模型Seeduplex、智元发布GO-2具身大模型首创动作思维链、腾讯云QClaw V2上线多Agent协同功能、即梦AI发布叙事工具"小章鱼"Octo、MiniMax发布MMX-CLI原生接入全模态模型、Anthropic上线Claude Managed Agents公测版、Meta发布个人超级智能模型Muse Spark。
AI TOP100
2天前
AI工具
AI技术
AI大模型
AI应用
每日AI资讯-2026年4月08日
AI行业最新资讯,包括:腾讯发布"龙虾"QBotClaw国内首个支持主流大模型API自由配置的AI浏览器、微软Bing团队开源"Harrier"多语言嵌入模型支持100+种语言、爱诗科技发布PixVerse C1支持15秒1080P音画同步的影视级大模型、GLM-5.1发布能独立工作8小时的开源智能模型、AI视频赛道神秘黑马Happy Horse横空出世超越Seedance2.0
AI TOP100
3天前
AI工具
AI技术
AI大模型
AI应用
中国广电联合会演员委员会严正声明:AI换脸、声纹克隆侵权行为将被全面追责
2026年4月2日,中广联演员委员会发布严正声明,直指AI深度合成技术普及下,未经授权的演员换脸、声纹克隆成网络侵权重灾区。声明明确三大核心禁令,压实平台责任,全面升级维权,为AI技术在演艺领域应用划出法律与行业红线,守护演员合法权益。
AI TOP100
9天前
AI应用
热点关键词
1
商汤小浣熊
2
美间AI
3
智谱
4
灵办AI
5
可灵AI
6
无界AI
7
AI创新工坊
8
神采PromeAI
9
一帧秒创
10
豆包
11
包阅AI
12
yoyo
13
有言AI
14
豆绘AI
15
每日AI资讯
16
kimi
17
即梦AI