首页
AI工具集
AI资讯
AI活动
AI社区
AI短剧
AI创作大赛
AI小说
AI绘画
AI视频
AI对口型
AI创意二维码
AI艺术字
AI智能抠图
AI漫剧创作
AI 对话
我要提交AI工具
AI TOP100 搜您想要的
搜索
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。
AITOP100
2024-04-29
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
AITOP100
2024-03-29
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。
AITOP100
2024-02-29
比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁
近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。
AITOP100
2024-01-10
Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片
2024年将是AI视频年
AITOP100
2024-01-03
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
这个推理引擎速度有多快?在单个 NVIDIA RTX 4090 GPU 上运行 LLM ,PowerInfer 的平均 token 生成速率为 13.20 tokens/s,峰值为 29.08 tokens/s,仅比顶级服务器 A100 GPU 低 18%,可适用于各种 LLM。
AITOP100
2023-12-22
2.7B能打Llama 2 70B,微软祭出「小语言模型」,96块A100 14天训出Phi-2,碾压谷歌Gemini nano
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
AITOP100
2023-12-13
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
AITOP100
2023-12-13
没有搜索到内容哟!请换个内容关键词试试吧!
热点资讯
谷歌三连炸!Lyria3+Google Music上线,Gemini3.1更新
谷歌深夜放大招,一次性甩出三大AI重磅更新!2月18日—20日期间,谷歌DeepMind正式推出音乐生成模型Lyria3,同步联动Google Music完成功能上线,旗舰大模型Gemini3.1也迎来史诗级更新,覆盖音乐创作、多模态推理、编程Agent全场景,直接硬刚GPT-5.2、Claude 4.6,重构AI行业竞争格局。
AI TOP100
4天前
AI技术
AI大模型
AI应用
编程党狂喜!阿里千问Qwen Coding Plan上线 双新模型适配拉满
阿里千问再放大招,正式推出编程专属套餐Qwen Coding Plan,不仅扩容模型矩阵,重磅上新Qwen3.5-Plus、Qwen3-Coder-Next两大核心模型,更全面适配QwenCode、ClaudeCode、Cline等主流AI编程工具,以订阅制模式解锁高性价比编程体验,直接硬刚同类编程模型套餐,重构AI编程效率新标杆。
AI TOP100
4天前
AI技术
AI大模型
卷疯AI模特圈!Runway集结全球顶尖阵容 覆盖全场景创作
AI内容创作赛道再迎重磅升级!Runway正式官宣,集结全球最优秀的AI模特矩阵,涵盖Kling 3.0、Kling 2.6 Pro、Kling 2.5 Turbo Pro、WAN2.2 Animate、GPT-Image-1.5、Sora 2 Pro等多款核心产品
AI top100
3天前
AI工具
AI技术
AI应用
支付宝AI付春节用户破1亿,一句话解锁AI支付新体验
马年春节AI赛道再传捷报!2月23日(大年初七)蚂蚁集团披露实战数据,支付宝“AI付”在春节期间用户数突破1亿,结合此前2月12日支付笔数超1.2亿的成绩,成功跻身全球首个支付笔数与用户数双破亿的AI原生支付产品,用一句话下单的丝滑体验,打响了AI原生支付规模化应用的第一枪。
AI top100
2天前
AI工具
AI大模型
AI应用
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。
AITOP100
2024-04-29
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
AITOP100
2024-03-29
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。
AITOP100
2024-02-29
比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁
近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。
AITOP100
2024-01-10
Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片
2024年将是AI视频年
AITOP100
2024-01-03
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
这个推理引擎速度有多快?在单个 NVIDIA RTX 4090 GPU 上运行 LLM ,PowerInfer 的平均 token 生成速率为 13.20 tokens/s,峰值为 29.08 tokens/s,仅比顶级服务器 A100 GPU 低 18%,可适用于各种 LLM。
AITOP100
2023-12-22
2.7B能打Llama 2 70B,微软祭出「小语言模型」,96块A100 14天训出Phi-2,碾压谷歌Gemini nano
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
AITOP100
2023-12-13
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
AITOP100
2023-12-13
没有搜索到内容哟!请换个内容关键词试试吧!
热点资讯
谷歌三连炸!Lyria3+Google Music上线,Gemini3.1更新
谷歌深夜放大招,一次性甩出三大AI重磅更新!2月18日—20日期间,谷歌DeepMind正式推出音乐生成模型Lyria3,同步联动Google Music完成功能上线,旗舰大模型Gemini3.1也迎来史诗级更新,覆盖音乐创作、多模态推理、编程Agent全场景,直接硬刚GPT-5.2、Claude 4.6,重构AI行业竞争格局。
AI TOP100
4天前
AI技术
AI大模型
AI应用
编程党狂喜!阿里千问Qwen Coding Plan上线 双新模型适配拉满
阿里千问再放大招,正式推出编程专属套餐Qwen Coding Plan,不仅扩容模型矩阵,重磅上新Qwen3.5-Plus、Qwen3-Coder-Next两大核心模型,更全面适配QwenCode、ClaudeCode、Cline等主流AI编程工具,以订阅制模式解锁高性价比编程体验,直接硬刚同类编程模型套餐,重构AI编程效率新标杆。
AI TOP100
4天前
AI技术
AI大模型
卷疯AI模特圈!Runway集结全球顶尖阵容 覆盖全场景创作
AI内容创作赛道再迎重磅升级!Runway正式官宣,集结全球最优秀的AI模特矩阵,涵盖Kling 3.0、Kling 2.6 Pro、Kling 2.5 Turbo Pro、WAN2.2 Animate、GPT-Image-1.5、Sora 2 Pro等多款核心产品
AI top100
3天前
AI工具
AI技术
AI应用
支付宝AI付春节用户破1亿,一句话解锁AI支付新体验
马年春节AI赛道再传捷报!2月23日(大年初七)蚂蚁集团披露实战数据,支付宝“AI付”在春节期间用户数突破1亿,结合此前2月12日支付笔数超1.2亿的成绩,成功跻身全球首个支付笔数与用户数双破亿的AI原生支付产品,用一句话下单的丝滑体验,打响了AI原生支付规模化应用的第一枪。
AI top100
2天前
AI工具
AI大模型
AI应用
热点关键词
1
商汤小浣熊
2
美间AI
3
智谱
4
灵办AI
5
可灵AI
6
无界AI
7
AI创新工坊
8
神采PromeAI
9
一帧秒创
10
豆包
11
包阅AI
12
yoyo
13
有言AI
14
豆绘AI
15
每日AI资讯
16
kimi
17
即梦AI