概览模型排行榜硬件市场评测训练租用ProAPI文档
语言
Lucebox Hub campaign banner

概览

所有已批准基准测试运行的全站统计数据。

392 近30天
1,478运行次数
57 近30天
142贡献者
293已测试模型
70硬件配置
51tok/s吞吐量中位数
2,665tok/s峰值吞吐量

基准测试活跃度

每月通过的测试数
1,478近12个月
7月8月9月10月11月12月1月2月3月4月5月6月

最快硬件

H200 SXM · 496 tok/s
H200 SXM496 tok/s
H200 NVL333 tok/s
RTX A5000261 tok/s
RTX 3060 Ti225 tok/s
RTX 5070 Ti221 tok/s
RTX A6000131 tok/s
RTX 3090 Ti119 tok/s
Strix Halo Radeon 8060S105 tok/s
RTX 5090102 tok/s
RTX 5060 Ti101 tok/s

各引擎吞吐量

hipfire · 155 tok/s
hipfire155 tok/s
SGLang88 tok/s
lmstudio85 tok/s
mlx83 tok/s
ollama69 tok/s
vllm66 tok/s
llama.cpp46 tok/s

测试最多的硬件

Intel Arc Pro B70 · 236
Intel Arc Pro B70236
Ryzen AI Max 395205
Radeon AI Pro R9700163
RTX 3090141
RTX 306072
GB10 Grace Blackwell71
RX 7900 XTX58
RTX 509053
RTX PRO 6000 Blackwell40
RTX 308037
M5 Max29
GTX 1080 Ti27

测试最多的模型

Qwen3.6-35B-A3B · 92
Qwen3.6-35B-A3B92
Qwen3.6-27B83
MiniMax-M2.7-int4-AutoRound60
gemma-4-26B-A4B-it-GGUF52
Qwen3.6-27B45
MiniMax-M2.740
Ornstein3.6-27B-MTP-NSC-ACE-SABER-GGUF33
Qwen3.6-27B-MTP-GGUF32
Qwen3.6-27B-GGUF31
Qwen3.5-9B27
gemma-4-31B-it22
Qwen3.6-27B-int4-AutoRound20

最热门的量化格式

Q4_K_M · 410
Q4_K_M410
Q8_0115
Q4_072
NVFP467
INT4 AutoRound W4A1665
Q4_K_XL52
fp843
UD-Q4_K_XL40
Q5_K_M39
MQ436

最热门的模型规模

15–35B · 692
<1B4
1–4B56
4–8B89
8–15B200
15–35B692
35–70B243
70–140B90
140B+75
Unknown29

最热门的推理引擎

llama.cpp · 985
llama.cpp985
vllm296
ollama89
hipfire41
mlx39
SGLang15
lmstudio13

上下文长度

≤2K · 586
≤2K586
4K145
8K153
16K40
32K143
64K59
128K+352

硬件类别

Discrete GPU · 1,042
Discrete GPU1,042
Unified memory421
CPU only15

架构分布

Dense · 1,178
Dense1,178
Mixture-of-Experts300

顶级贡献者

steveseguin · 211
steveseguin211
1337Hero143
gdwallasign94
crown90
AngkorAI67
Skiipy45
schuttdev39
basecampbernie34
gkraker0432
snnn29