首页
AI工具集
AI资讯
AI活动
AI社区
AI短剧
AI创作大赛
AI小说
AI绘画
AI视频
AI对口型
视频转动漫风格
AI创意二维码
AI艺术字
AI智能抠图
AI短视频创作
AI 对话
我要提交AI工具
AI TOP100 搜您想要的
搜索
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。
AITOP100
2024-04-29
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
AITOP100
2024-03-29
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。
AITOP100
2024-02-29
比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁
近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。
AITOP100
2024-01-10
Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片
2024年将是AI视频年
AITOP100
2024-01-03
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
这个推理引擎速度有多快?在单个 NVIDIA RTX 4090 GPU 上运行 LLM ,PowerInfer 的平均 token 生成速率为 13.20 tokens/s,峰值为 29.08 tokens/s,仅比顶级服务器 A100 GPU 低 18%,可适用于各种 LLM。
AITOP100
2023-12-22
2.7B能打Llama 2 70B,微软祭出「小语言模型」,96块A100 14天训出Phi-2,碾压谷歌Gemini nano
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
AITOP100
2023-12-13
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
AITOP100
2023-12-13
没有搜索到内容哟!请换个内容关键词试试吧!
热点资讯
DeepSeek V3.1正式发布:128K上下文窗口重新定义AI模型能力边界
DeepSeek V3.1正式发布!上下文窗口扩展至128K,支持10万+汉字处理,多步推理性能提升43%,模型幻觉减少38%。深度求索最新AI大模型在长文档分析、代码理解等场景表现卓越,免费体验官网已上线。
AI TOP100
3天前
AI工具
AI技术
AI大模型
AI应用
AITOP100 AI应用重磅更新!Veo3、即梦AI 3.0、Vidu Q1、海螺AI、Luma全新升级
AITOP100平台重磅更新!新接入Veo3以及即梦AI 3.0文生图和视频功能,Vidu Q1多参考图支持,海螺AI运镜控制升级。AI绘画视频功能全面优化,支持收藏、重新生成、创作记录等。立即体验最新AI创作工具!
AI TOP100
2天前
AI工具
AI技术
AI应用
即梦AI智能多帧功能上线:10张图生成54秒超长镜头,视频创作门槛大降!
视频创作门槛被即梦AI“一键击穿”!最新上线的智能多帧功能,仅需上传10张关键帧图片,就能生成54秒电影级连贯长镜头,连推拉、环绕等复杂运镜都能精准还原。从美妆博主3倍播放量的实测案例,到广告主成本直降90%的颠覆,这项技术正在重新定义“人人都是导演”的可能性。现在登录官网,体验“图片变专业视频”的黑科技!
AI TOP100
20小时前
AI工具
AI技术
AI大模型
AI应用
可灵2.1首尾帧功能炸场!影视级转场+复杂运镜,一键解锁创作自由!
视频创作总被转场卡顿、动作失真、风格跳变劝退?可灵2.1首尾帧功能携“多模态语义推理+自适应扩散引导”两大黑科技炸场!AI不仅能精准理解你的创作意图,自动补全连贯动作,还能实时纠偏,确保视频丝滑如手绘动画。从短视频到影视级镜头,四大功能实测惊艳,更有挑战赛送千元京东卡!专业级创作,现在“傻瓜式”实现。
AI TOP100
22小时前
AI工具
AI技术
AI大模型
AI应用
DeepSeek V3.1全面技术解读:从架构到应用的系统性评估与对比分析
深度解析DeepSeek V3.1的技术创新:100万token上下文窗口、MoE+MLA架构优势、与GPT-4.1/Claude竞品对比、训练成本分析及实际应用指导。包含权威基准测试数据和工程落地建议。
AI TOP100
3天前
AI工具
AI技术
AI大模型
AI应用
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。
AITOP100
2024-04-29
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
AITOP100
2024-03-29
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。
AITOP100
2024-02-29
比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁
近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。
AITOP100
2024-01-10
Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片
2024年将是AI视频年
AITOP100
2024-01-03
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
这个推理引擎速度有多快?在单个 NVIDIA RTX 4090 GPU 上运行 LLM ,PowerInfer 的平均 token 生成速率为 13.20 tokens/s,峰值为 29.08 tokens/s,仅比顶级服务器 A100 GPU 低 18%,可适用于各种 LLM。
AITOP100
2023-12-22
2.7B能打Llama 2 70B,微软祭出「小语言模型」,96块A100 14天训出Phi-2,碾压谷歌Gemini nano
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
AITOP100
2023-12-13
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
AITOP100
2023-12-13
没有搜索到内容哟!请换个内容关键词试试吧!
热点资讯
DeepSeek V3.1正式发布:128K上下文窗口重新定义AI模型能力边界
DeepSeek V3.1正式发布!上下文窗口扩展至128K,支持10万+汉字处理,多步推理性能提升43%,模型幻觉减少38%。深度求索最新AI大模型在长文档分析、代码理解等场景表现卓越,免费体验官网已上线。
AI TOP100
3天前
AI工具
AI技术
AI大模型
AI应用
AITOP100 AI应用重磅更新!Veo3、即梦AI 3.0、Vidu Q1、海螺AI、Luma全新升级
AITOP100平台重磅更新!新接入Veo3以及即梦AI 3.0文生图和视频功能,Vidu Q1多参考图支持,海螺AI运镜控制升级。AI绘画视频功能全面优化,支持收藏、重新生成、创作记录等。立即体验最新AI创作工具!
AI TOP100
2天前
AI工具
AI技术
AI应用
即梦AI智能多帧功能上线:10张图生成54秒超长镜头,视频创作门槛大降!
视频创作门槛被即梦AI“一键击穿”!最新上线的智能多帧功能,仅需上传10张关键帧图片,就能生成54秒电影级连贯长镜头,连推拉、环绕等复杂运镜都能精准还原。从美妆博主3倍播放量的实测案例,到广告主成本直降90%的颠覆,这项技术正在重新定义“人人都是导演”的可能性。现在登录官网,体验“图片变专业视频”的黑科技!
AI TOP100
20小时前
AI工具
AI技术
AI大模型
AI应用
可灵2.1首尾帧功能炸场!影视级转场+复杂运镜,一键解锁创作自由!
视频创作总被转场卡顿、动作失真、风格跳变劝退?可灵2.1首尾帧功能携“多模态语义推理+自适应扩散引导”两大黑科技炸场!AI不仅能精准理解你的创作意图,自动补全连贯动作,还能实时纠偏,确保视频丝滑如手绘动画。从短视频到影视级镜头,四大功能实测惊艳,更有挑战赛送千元京东卡!专业级创作,现在“傻瓜式”实现。
AI TOP100
22小时前
AI工具
AI技术
AI大模型
AI应用
DeepSeek V3.1全面技术解读:从架构到应用的系统性评估与对比分析
深度解析DeepSeek V3.1的技术创新:100万token上下文窗口、MoE+MLA架构优势、与GPT-4.1/Claude竞品对比、训练成本分析及实际应用指导。包含权威基准测试数据和工程落地建议。
AI TOP100
3天前
AI工具
AI技术
AI大模型
AI应用
热点关键词
1
商汤小浣熊
2
美间AI
3
智谱
4
灵办AI
5
可灵AI
6
无界AI
7
AI创新工坊
8
神采PromeAI
9
一帧秒创
10
豆包
11
包阅AI
12
yoyo
13
有言AI
14
豆绘AI
15
每日AI资讯
16
kimi
17
即梦AI