首页
AI工具集
AI资讯
AI活动
AI社区
AI短剧
AI创作大赛
AI小说
AI绘画
AI视频
AI对口型
视频转动漫风格
AI创意二维码
AI艺术字
AI智能抠图
AI短视频创作
AI 对话
我要提交AI工具
AI TOP100 搜您想要的
搜索
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。
AITOP100
2024-04-29
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
AITOP100
2024-03-29
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。
AITOP100
2024-02-29
比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁
近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。
AITOP100
2024-01-10
Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片
2024年将是AI视频年
AITOP100
2024-01-03
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
这个推理引擎速度有多快?在单个 NVIDIA RTX 4090 GPU 上运行 LLM ,PowerInfer 的平均 token 生成速率为 13.20 tokens/s,峰值为 29.08 tokens/s,仅比顶级服务器 A100 GPU 低 18%,可适用于各种 LLM。
AITOP100
2023-12-22
2.7B能打Llama 2 70B,微软祭出「小语言模型」,96块A100 14天训出Phi-2,碾压谷歌Gemini nano
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
AITOP100
2023-12-13
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
AITOP100
2023-12-13
没有搜索到内容哟!请换个内容关键词试试吧!
热点资讯
Sora 2上线:用“Cameo”功能,OpenAI想让视频生成成为新的社交方式
2025年9月30日,OpenAI推出Sora 2,这款视频+音频生成模型实现技术突破与产品变革。它从“特效”迈向“世界模拟”,新增Cameo功能让用户成内容主角,信息流设计凸显社交导向。Sora 2或开启AI影视社交新纪元,视频使用场景将迎来巨变,让我们一同见证。
AI TOP100
6天前
AI工具
AI技术
AI大模型
AI应用
重磅!DeepSeek-V3.2-Exp正式上线,训练推理效率飙升,API价格腰斩
2025年9月29日,AI领域迎来里程碑式更新——DeepSeek-V3.2-Exp模型携DSA稀疏注意力机制正式上线!该版本通过智能过滤无效计算,将长文本处理效率提升超30%,同时API调用成本直降54%。开发者可无缝切换新旧版本对比测试,更有TileLang工具链开源助力研发。这场效率与性价比的双重革命,正在重新定义AI技术边界。
AI TOP100
7天前
AI工具
AI技术
AI大模型
AI应用
国庆长假AI圈却炸了!Sora 2一周爆火全记录:16万下载登顶榜首背后的技术革命与全民狂欢
国庆长假刚结束,AI圈却炸了!深度复盘Sora 2发布一周全记录:16.4万下载登顶App Store,邀请码炒至千元,技术突破引发全网狂欢。从物理世界模拟到音视频同步生成,从版权争议到行业震动,全面解析这场AI视频革命的光与影。
AI top100
11小时前
AI应用
Brave浏览器即将推出Ask Brave功能,AI搜索+隐私保护双剑合璧
2025年10月1日,Brave浏览器即将上线AI搜索新功能Ask Brave,以“隐私保护+深度报告”双核驱动,重新定义智能搜索体验!用户无需切换模式,输入双问号或点击按钮即可获取带视频、链接的百科式答案,还能追问后续问题。对比谷歌AI搜索,Brave的24小时自动删记录和加密聊天功能,能否在巨头竞争中撕开差异化缺口?这场隐私牌的AI搜索战,值得期待!
AI TOP100
7天前
AI工具
AI技术
AI应用
智谱GLM-4.6正式上线,编程能力硬刚Claude Sonnet4,国产AI生态再破局
2025年9月30日,国产AI领域迎来里程碑时刻!智谱AI全新开源大模型GLM-4.6正式上线,编程能力直追国际标杆Claude Sonnet4,更突破性实现寒武纪芯片与摩尔线程GPU的国产化适配,首创FP8+Int4混合量化部署方案。这一波“技术+生态”双突破,能否让中国AI彻底摆脱硬件依赖?国产大模型与自主芯片的协同进化,正悄然改写全球AI竞争规则。
AI TOP100
7天前
AI技术
AI大模型
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。
AITOP100
2024-04-29
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
AITOP100
2024-03-29
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。
AITOP100
2024-02-29
比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁
近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。
AITOP100
2024-01-10
Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片
2024年将是AI视频年
AITOP100
2024-01-03
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
这个推理引擎速度有多快?在单个 NVIDIA RTX 4090 GPU 上运行 LLM ,PowerInfer 的平均 token 生成速率为 13.20 tokens/s,峰值为 29.08 tokens/s,仅比顶级服务器 A100 GPU 低 18%,可适用于各种 LLM。
AITOP100
2023-12-22
2.7B能打Llama 2 70B,微软祭出「小语言模型」,96块A100 14天训出Phi-2,碾压谷歌Gemini nano
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
AITOP100
2023-12-13
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
AITOP100
2023-12-13
没有搜索到内容哟!请换个内容关键词试试吧!
热点资讯
Sora 2上线:用“Cameo”功能,OpenAI想让视频生成成为新的社交方式
2025年9月30日,OpenAI推出Sora 2,这款视频+音频生成模型实现技术突破与产品变革。它从“特效”迈向“世界模拟”,新增Cameo功能让用户成内容主角,信息流设计凸显社交导向。Sora 2或开启AI影视社交新纪元,视频使用场景将迎来巨变,让我们一同见证。
AI TOP100
6天前
AI工具
AI技术
AI大模型
AI应用
重磅!DeepSeek-V3.2-Exp正式上线,训练推理效率飙升,API价格腰斩
2025年9月29日,AI领域迎来里程碑式更新——DeepSeek-V3.2-Exp模型携DSA稀疏注意力机制正式上线!该版本通过智能过滤无效计算,将长文本处理效率提升超30%,同时API调用成本直降54%。开发者可无缝切换新旧版本对比测试,更有TileLang工具链开源助力研发。这场效率与性价比的双重革命,正在重新定义AI技术边界。
AI TOP100
7天前
AI工具
AI技术
AI大模型
AI应用
国庆长假AI圈却炸了!Sora 2一周爆火全记录:16万下载登顶榜首背后的技术革命与全民狂欢
国庆长假刚结束,AI圈却炸了!深度复盘Sora 2发布一周全记录:16.4万下载登顶App Store,邀请码炒至千元,技术突破引发全网狂欢。从物理世界模拟到音视频同步生成,从版权争议到行业震动,全面解析这场AI视频革命的光与影。
AI top100
11小时前
AI应用
Brave浏览器即将推出Ask Brave功能,AI搜索+隐私保护双剑合璧
2025年10月1日,Brave浏览器即将上线AI搜索新功能Ask Brave,以“隐私保护+深度报告”双核驱动,重新定义智能搜索体验!用户无需切换模式,输入双问号或点击按钮即可获取带视频、链接的百科式答案,还能追问后续问题。对比谷歌AI搜索,Brave的24小时自动删记录和加密聊天功能,能否在巨头竞争中撕开差异化缺口?这场隐私牌的AI搜索战,值得期待!
AI TOP100
7天前
AI工具
AI技术
AI应用
智谱GLM-4.6正式上线,编程能力硬刚Claude Sonnet4,国产AI生态再破局
2025年9月30日,国产AI领域迎来里程碑时刻!智谱AI全新开源大模型GLM-4.6正式上线,编程能力直追国际标杆Claude Sonnet4,更突破性实现寒武纪芯片与摩尔线程GPU的国产化适配,首创FP8+Int4混合量化部署方案。这一波“技术+生态”双突破,能否让中国AI彻底摆脱硬件依赖?国产大模型与自主芯片的协同进化,正悄然改写全球AI竞争规则。
AI TOP100
7天前
AI技术
AI大模型
热点关键词
1
商汤小浣熊
2
美间AI
3
智谱
4
灵办AI
5
可灵AI
6
无界AI
7
AI创新工坊
8
神采PromeAI
9
一帧秒创
10
豆包
11
包阅AI
12
yoyo
13
有言AI
14
豆绘AI
15
每日AI资讯
16
kimi
17
即梦AI