ภาพรวมโมเดลลีดเดอร์บอร์ดฮาร์ดแวร์ตลาดซื้อขายการประเมินฝึกเช่าProเอกสาร API
ภาษา
Lucebox Hub campaign banner

โมเดล

114 model groups · 404 total

Qwen3.6-27B

Qwen / Qwen3.6-27B

28B
Qwenimage-text-to-text318 benchmarks total
transformerssafetensorsqwen3_5image-text-to-text
ดีที่สุด255 tok/s
มัธยฐาน42.4 tok/s
ต่ำสุด1.6 tok/s
ดูเบนช์มาร์ก →

Qwen3.6-35B-A3B

Qwen / Qwen3.6-35B-A3B

MoE3B active / 36B total
Qwenimage-text-to-text208 benchmarks total
transformerssafetensorsqwen3_5_moeimage-text-to-text
ดีที่สุด391 tok/s
มัธยฐาน71.3 tok/s
ต่ำสุด6.4 tok/s
ดูเบนช์มาร์ก →

MiniMax-M2.7

MiniMaxAI / MiniMax-M2.7

MoE229B
Minimaxtext-generation117 benchmarks total
transformerssafetensorsminimax_m2text-generation
ดีที่สุด496 tok/s
มัธยฐาน32.2 tok/s
ต่ำสุด0.5 tok/s
ดูเบนช์มาร์ก →

gemma-4-26B-A4B

google / gemma-4-26B-A4B

MoE4B active / 27B total
Gemmaimage-text-to-text86 benchmarks total
transformerssafetensorsgemma4image-text-to-text
ดูเบนช์มาร์ก →

Qwen3.5-9B-Base

Qwen / Qwen3.5-9B-Base

10B
Qwenimage-text-to-text63 benchmarks total
transformerssafetensorsqwen3_5image-text-to-text
ดูเบนช์มาร์ก →

Qwen3.5-27B

Qwen / Qwen3.5-27B

28B
Qwenimage-text-to-text63 benchmarks total
transformerssafetensorsqwen3_5image-text-to-text
ดีที่สุด287 tok/s
มัธยฐาน30.9 tok/s
ต่ำสุด2.2 tok/s
ดูเบนช์มาร์ก →

gemma-4-E4B

google / gemma-4-E4B

8B
Gemmaany-to-any41 benchmarks total
transformerssafetensorsgemma4image-text-to-text
ดีที่สุด70.5 tok/s
มัธยฐาน70.5 tok/s
ต่ำสุด70.5 tok/s
ดูเบนช์มาร์ก →

gemma-4-31B

google / gemma-4-31B

33B
Gemmaimage-text-to-text37 benchmarks total
transformerssafetensorsgemma4image-text-to-text
ดูเบนช์มาร์ก →

Ornstein3.6-27B-MTP-NSC-ACE-SABER

GestaltLabs / Ornstein3.6-27B-MTP-NSC-ACE-SABER

27B
Qwenimage-text-to-text37 benchmarks total
transformerssafetensorsqwen3_5image-text-to-text
ดูเบนช์มาร์ก →

Qwen3.5-35B-A3B-Base

Qwen / Qwen3.5-35B-A3B-Base

MoE3B active / 36B total
Qwenimage-text-to-text35 benchmarks total
transformerssafetensorsqwen3_5_moeimage-text-to-text
ดูเบนช์มาร์ก →

Meta-Llama-3-8B-Instruct

meta-llama / Meta-Llama-3-8B-Instruct

8B
Llamatext-generation31 benchmarks total
transformerssafetensorsllamatext-generation
ดีที่สุด148 tok/s
มัธยฐาน48.4 tok/s
ต่ำสุด13.6 tok/s
ดูเบนช์มาร์ก →

Qwen3-Coder-30B-A3B-Instruct

Qwen / Qwen3-Coder-30B-A3B-Instruct

MoE3B active / 31B total
Qwentext-generation31 benchmarks total
transformerssafetensorsqwen3_moetext-generation
ดีที่สุด101 tok/s
มัธยฐาน84.2 tok/s
ต่ำสุด75.9 tok/s
ดูเบนช์มาร์ก →

DeepSeek-V4-Flash

deepseek-ai / DeepSeek-V4-Flash

MoE158B
Deepseektext-generation30 benchmarks total
transformerssafetensorsdeepseek_v4text-generation
ดีที่สุด262 tok/s
มัธยฐาน33.0 tok/s
ต่ำสุด18.6 tok/s
ดูเบนช์มาร์ก →

gemma-4-12B

google / gemma-4-12B

12B
Gemmaany-to-any25 benchmarks total
transformerssafetensorsgemma4_unifiedimage-text-to-text
ดีที่สุด25.8 tok/s
มัธยฐาน25.8 tok/s
ต่ำสุด25.8 tok/s
ดูเบนช์มาร์ก →

Qwen3.5-122B-A10B

Qwen / Qwen3.5-122B-A10B

MoE10B active / 125B total
Qwenimage-text-to-text25 benchmarks total
transformerssafetensorsqwen3_5_moeimage-text-to-text
ดีที่สุด27.3 tok/s
มัธยฐาน25.4 tok/s
ต่ำสุด3.2 tok/s
ดูเบนช์มาร์ก →

gpt-oss-20b

openai / gpt-oss-20b

MoE22B
Gpttext-generation24 benchmarks total
transformerssafetensorsgpt_osstext-generation
ดีที่สุด991 tok/s
มัธยฐาน80.3 tok/s
ต่ำสุด12.0 tok/s
ดูเบนช์มาร์ก →

Qwen2.5-14B

Qwen / Qwen2.5-14B

15B
Qwentext-generation22 benchmarks total
safetensorsqwen2text-generationconversational
ดูเบนช์มาร์ก →

LFM2.5-8B-A1B-Base

LiquidAI / LFM2.5-8B-A1B-Base

MoE1B active / 8B total
text-generation21 benchmarks total
transformerssafetensorslfm2_moetext-generation
ดูเบนช์มาร์ก →

Qwen3.5-4B-Base

Qwen / Qwen3.5-4B-Base

5B
Qwenimage-text-to-text18 benchmarks total
transformerssafetensorsqwen3_5image-text-to-text
ดูเบนช์มาร์ก →

Qwen3-Coder-Next

Qwen / Qwen3-Coder-Next

80B
Qwentext-generation18 benchmarks total
transformerssafetensorsqwen3_nexttext-generation
ดีที่สุด80.8 tok/s
มัธยฐาน55.8 tok/s
ต่ำสุด48.2 tok/s
ดูเบนช์มาร์ก →

gemma-4-E2B

google / gemma-4-E2B

5B
Gemmaany-to-any16 benchmarks total
transformerssafetensorsgemma4image-text-to-text
ดูเบนช์มาร์ก →

Llama-3.1-8B

meta-llama / Llama-3.1-8B

8B
Llamatext-generation15 benchmarks total
transformerssafetensorsllamatext-generation
ดูเบนช์มาร์ก →

Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

nvidia / Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

MoE3B active / 33B total
any-to-any13 benchmarks total
transformerssafetensorsNemotronH_Nano_Omni_Reasoning_V3feature-extraction
ดีที่สุด107 tok/s
มัธยฐาน90.6 tok/s
ต่ำสุด57.9 tok/s
Eval score· 1 eval
100.0%
ดูเบนช์มาร์ก →

Mistral-Medium-3.5-128B

mistralai / Mistral-Medium-3.5-128B

128B
Mistral13 benchmarks total
safetensorsmistral3vLLMen
ดีที่สุด7.4 tok/s
มัธยฐาน6.5 tok/s
ต่ำสุด6.2 tok/s
ดูเบนช์มาร์ก →

gpt-oss-120b

openai / gpt-oss-120b

MoE120B
Gpttext-generation13 benchmarks total
transformerssafetensorsgpt_osstext-generation
ดีที่สุด223 tok/s
มัธยฐาน70.0 tok/s
ต่ำสุด59.2 tok/s
ดูเบนช์มาร์ก →

Qwen2.5-7B

Qwen / Qwen2.5-7B

8B
Qwentext-generation12 benchmarks total
transformerssafetensorsqwen2text-generation
ดีที่สุด1.4k tok/s
มัธยฐาน1.4k tok/s
ต่ำสุด1.4k tok/s
ดูเบนช์มาร์ก →

Qwen3-30B-A3B-Base

Qwen / Qwen3-30B-A3B-Base

MoE3B active / 31B total
Qwentext-generation11 benchmarks total
transformerssafetensorsqwen3_moetext-generation
ดูเบนช์มาร์ก →

GLM-4.7-Flash

zai-org / GLM-4.7-Flash

MoE31B
text-generation11 benchmarks total
transformerssafetensorsglm4_moe_litetext-generation
ดีที่สุด212 tok/s
มัธยฐาน176 tok/s
ต่ำสุด92.9 tok/s
ดูเบนช์มาร์ก →

Nemotron-Cascade-2-30B-A3B

nvidia / Nemotron-Cascade-2-30B-A3B

MoE3B active / 32B total
text-generation11 benchmarks total
transformerssafetensorsnemotron_htext-generation
ดีที่สุด141 tok/s
มัธยฐาน95.4 tok/s
ต่ำสุด89.8 tok/s
ดูเบนช์มาร์ก →

gemma-3-12b-pt

google / gemma-3-12b-pt

12B
Gemmaimage-text-to-text10 benchmarks total
transformerssafetensorsgemma3image-text-to-text
ดูเบนช์มาร์ก →

Qwen3.6-27B-DFlash

z-lab / Qwen3.6-27B-DFlash

2B
Qwentext-generation10 benchmarks total
transformerssafetensorsqwen3feature-extraction
ดีที่สุด215 tok/s
มัธยฐาน39.2 tok/s
ต่ำสุด26.9 tok/s
ดูเบนช์มาร์ก →

Ornith-1.0-35B-GGUF

deepreinforce-ai / Ornith-1.0-35B-GGUF

35B
text-generation9 benchmarks total
transformersgguftext-generationlicense:mit
ดีที่สุด253 tok/s
มัธยฐาน64.4 tok/s
ต่ำสุด27.8 tok/s
ดูเบนช์มาร์ก →

Nex-N2-mini

nex-agi / Nex-N2-mini

MoE35B
Qwentext-generation9 benchmarks total
transformerssafetensorsqwen3_5_moeimage-text-to-text
ดีที่สุด107 tok/s
มัธยฐาน104 tok/s
ต่ำสุด40.5 tok/s
ดูเบนช์มาร์ก →

GLM-5.2

zai-org / GLM-5.2

MoE753B
text-generation8 benchmarks total
transformerssafetensorsglm_moe_dsatext-generation
ดูเบนช์มาร์ก →

Qwen3.5-0.8B-Base

Qwen / Qwen3.5-0.8B-Base

1B
Qwenimage-text-to-text8 benchmarks total
transformerssafetensorsqwen3_5image-text-to-text
ดีที่สุด2.7k tok/s
มัธยฐาน2.7k tok/s
ต่ำสุด2.7k tok/s
ดูเบนช์มาร์ก →

DeepSeek-R1-Distill-Qwen-7B

deepseek-ai / DeepSeek-R1-Distill-Qwen-7B

8B
Deepseek-R1text-generation8 benchmarks total
transformerssafetensorsqwen2text-generation
ดีที่สุด144 tok/s
มัธยฐาน69.0 tok/s
ต่ำสุด38.1 tok/s
ดูเบนช์มาร์ก →

Ling-2.6-flash

inclusionAI / Ling-2.6-flash

MoE107B
text-generation8 benchmarks total
safetensorsbailing_hybridtext-generationconversational
ดีที่สุด94.9 tok/s
มัธยฐาน86.2 tok/s
ต่ำสุด82.3 tok/s
ดูเบนช์มาร์ก →

Qwen2.5-72B

Qwen / Qwen2.5-72B

73B
Qwentext-generation8 benchmarks total
transformerssafetensorsqwen2text-generation
ดูเบนช์มาร์ก →

LFM2.5-1.2B-Base

LiquidAI / LFM2.5-1.2B-Base

1B
text-generation7 benchmarks total
transformerssafetensorslfm2text-generation
ดูเบนช์มาร์ก →

Ornith-1.0-9B

deepreinforce-ai / Ornith-1.0-9B

0M
Qwentext-generation6 benchmarks total
transformerssafetensorsqwen3_5image-text-to-text
ดีที่สุด77.5 tok/s
มัธยฐาน25.7 tok/s
ต่ำสุด24.7 tok/s
ดูเบนช์มาร์ก →

Qwen3-8B-Base

Qwen / Qwen3-8B-Base

8B
Qwentext-generation6 benchmarks total
transformerssafetensorsqwen3text-generation
ดูเบนช์มาร์ก →

DeepSeek-Coder-V2-Lite-Instruct

deepseek-ai / DeepSeek-Coder-V2-Lite-Instruct

MoE16B
Deepseek-Codertext-generation6 benchmarks total
transformerssafetensorsdeepseek_v2text-generation
ดีที่สุด150 tok/s
มัธยฐาน87.0 tok/s
ต่ำสุด39.0 tok/s
ดูเบนช์มาร์ก →

Llama-2-7b-hf

meta-llama / Llama-2-7b-hf

7B
Llamatext-generation5 benchmarks total
transformerspytorchsafetensorsllama
ดีที่สุด202 tok/s
มัธยฐาน50.4 tok/s
ต่ำสุด19.1 tok/s
ดูเบนช์มาร์ก →

Llama-3.2-1B-Instruct

meta-llama / Llama-3.2-1B-Instruct

1B
Llamatext-generation5 benchmarks total
transformerssafetensorsllamatext-generation
ดีที่สุด448 tok/s
มัธยฐาน195 tok/s
ต่ำสุด184 tok/s
ดูเบนช์มาร์ก →

granite-4.0-h-micro

ibm-granite / granite-4.0-h-micro

MoE3B
text-generation5 benchmarks total
transformerssafetensorsgranitemoehybridtext-generation
ดีที่สุด141 tok/s
มัธยฐาน45.3 tok/s
ต่ำสุด45.0 tok/s
ดูเบนช์มาร์ก →

LFM2-8B-A1B

LiquidAI / LFM2-8B-A1B

MoE1B active / 8B total
text-generation5 benchmarks total
transformerssafetensorslfm2_moetext-generation
ดีที่สุด18.3 tok/s
มัธยฐาน18.3 tok/s
ต่ำสุด9.9 tok/s
ดูเบนช์มาร์ก →

NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

nvidia / NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

MoE3B active / 32B total
text-generation5 benchmarks total
transformerssafetensorsnemotron_htext-generation
ดีที่สุด313 tok/s
มัธยฐาน286 tok/s
ต่ำสุด117 tok/s
ดูเบนช์มาร์ก →

Qwen3-14B-Base

Qwen / Qwen3-14B-Base

15B
Qwentext-generation5 benchmarks total
transformerssafetensorsqwen3text-generation
ดูเบนช์มาร์ก →

Mistral-Small-3.1-24B-Base-2503

mistralai / Mistral-Small-3.1-24B-Base-2503

24B
Mistral5 benchmarks total
vllmsafetensorsmistral3mistral-common
ดูเบนช์มาร์ก →

gemma-3-1b-pt

google / gemma-3-1b-pt

1B
Gemmatext-generation5 benchmarks total
transformerssafetensorsgemma3_texttext-generation
ดูเบนช์มาร์ก →

Qwen3.5-2B-Base

Qwen / Qwen3.5-2B-Base

2B
Qwenimage-text-to-text5 benchmarks total
transformerssafetensorsqwen3_5image-text-to-text
ดูเบนช์มาร์ก →

Qwen2.5-1.5B

Qwen / Qwen2.5-1.5B

2B
Qwentext-generation5 benchmarks total
transformerssafetensorsqwen2text-generation
ดูเบนช์มาร์ก →

NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

nvidia / NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

MoE12B active / 67B total
Opttext-generation5 benchmarks total
transformerssafetensorsnemotron_htext-generation
ดีที่สุด262 tok/s
มัธยฐาน175 tok/s
ต่ำสุด49.6 tok/s
ดูเบนช์มาร์ก →

DeepSeek-R1-Distill-Qwen-14B

deepseek-ai / DeepSeek-R1-Distill-Qwen-14B

15B
Deepseek-R1text-generation4 benchmarks total
transformerssafetensorsarxiv:2501.12948license:mit
ดีที่สุด24.4 tok/s
มัธยฐาน24.4 tok/s
ต่ำสุด24.4 tok/s
ดูเบนช์มาร์ก →

gemma-3n-E4B

google / gemma-3n-E4B

8B
Gemmaimage-text-to-text4 benchmarks total
transformerssafetensorsgemma3nimage-text-to-text
ดูเบนช์มาร์ก →

MiniMax-M2

MiniMaxAI / MiniMax-M2

229B
Minimaxtext-generation4 benchmarks total
transformerssafetensorsminimax_m2text-generation
ดีที่สุด493 tok/s
มัธยฐาน398 tok/s
ต่ำสุด303 tok/s
ดูเบนช์มาร์ก →

GLM-5.1

zai-org / GLM-5.1

MoE754B
text-generation4 benchmarks total
transformerssafetensorsglm_moe_dsatext-generation
ดูเบนช์มาร์ก →

Qwen3-32B

Qwen / Qwen3-32B

33B
Qwentext-generation4 benchmarks total
transformerssafetensorsqwen3text-generation
ดีที่สุด79.3 tok/s
มัธยฐาน22.8 tok/s
ต่ำสุด3.2 tok/s
ดูเบนช์มาร์ก →

granite-4.1-30b

ibm-granite / granite-4.1-30b

29B
text-generation4 benchmarks total
transformerssafetensorsgranitetext-generation
ดีที่สุด17.9 tok/s
มัธยฐาน16.4 tok/s
ต่ำสุด15.6 tok/s
ดูเบนช์มาร์ก →

Gemopus-4-26B-A4B-it

Jackrong / Gemopus-4-26B-A4B-it

MoE4B active / 27B total
Gemmatext-generation4 benchmarks total
safetensorsgemma4gemmainstruction-tuned
ดีที่สุด64.3 tok/s
มัธยฐาน55.0 tok/s
ต่ำสุด45.7 tok/s
ดูเบนช์มาร์ก →

Qwen3-VL-8B-Instruct

Qwen / Qwen3-VL-8B-Instruct

9B
Qwenimage-text-to-text3 benchmarks total
transformerssafetensorsqwen3_vlimage-text-to-text
ดีที่สุด95.9 tok/s
มัธยฐาน95.9 tok/s
ต่ำสุด95.9 tok/s
ดูเบนช์มาร์ก →

Ornith-1.0-35B

deepreinforce-ai / Ornith-1.0-35B

MoE0M
Qwentext-generation3 benchmarks total
transformerssafetensorsqwen3_5_moeimage-text-to-text
ดีที่สุด89.1 tok/s
มัธยฐาน78.4 tok/s
ต่ำสุด67.8 tok/s
ดูเบนช์มาร์ก →

gemma-3-4b-pt

google / gemma-3-4b-pt

4B
Gemmaimage-text-to-text3 benchmarks total
transformerssafetensorsgemma3image-text-to-text
ดูเบนช์มาร์ก →

Step-3.7-Flash

stepfun-ai / Step-3.7-Flash

MoE201B
image-text-to-text3 benchmarks total
transformerssafetensorsstep3p7text-generation
ดูเบนช์มาร์ก →

phi-4

microsoft / phi-4

15B
Phitext-generation3 benchmarks total
transformerssafetensorsphi3text-generation
ดีที่สุด77.0 tok/s
มัธยฐาน36.0 tok/s
ต่ำสุด36.0 tok/s
ดูเบนช์มาร์ก →

Qwen3-4B-Base

Qwen / Qwen3-4B-Base

4B
Qwentext-generation3 benchmarks total
transformerssafetensorsqwen3text-generation
ดูเบนช์มาร์ก →

NVIDIA-Nemotron-3-Super-120B-A12B-BF16

nvidia / NVIDIA-Nemotron-3-Super-120B-A12B-BF16

MoE12B active / 124B total
text-generation3 benchmarks total
transformerssafetensorsnemotron_htext-generation
ดูเบนช์มาร์ก →

MiniMax-M2.5

MiniMaxAI / MiniMax-M2.5

MoE229B
Minimaxtext-generation3 benchmarks total
transformerssafetensorsminimax_m2text-generation
ดีที่สุด504 tok/s
มัธยฐาน419 tok/s
ต่ำสุด334 tok/s
ดูเบนช์มาร์ก →

DeepSeek-V4-Flash-DSpark

deepseek-ai / DeepSeek-V4-Flash-DSpark

MoE165B
Deepseektext-generation2 benchmarks total
transformerssafetensorsdeepseek_v4text-generation
ดีที่สุด262 tok/s
มัธยฐาน262 tok/s
ต่ำสุด262 tok/s
ดูเบนช์มาร์ก →

Qwen2.5-VL-7B-Instruct

Qwen / Qwen2.5-VL-7B-Instruct

8B
Qwenimage-text-to-text2 benchmarks total
transformerssafetensorsqwen2_5_vlimage-text-to-text
ดูเบนช์มาร์ก →

Ornith-1.0-9B-GGUF

deepreinforce-ai / Ornith-1.0-9B-GGUF

9B
text-generation2 benchmarks total
transformersgguftext-generationlicense:mit
ดีที่สุด32.0 tok/s
มัธยฐาน31.9 tok/s
ต่ำสุด31.8 tok/s
ดูเบนช์มาร์ก →

diffusiongemma-26B-A4B-it

google / diffusiongemma-26B-A4B-it

MoE4B active / 26B total
Gemmaimage-text-to-text2 benchmarks total
transformerssafetensorsdiffusion_gemmaimage-text-to-text
ดูเบนช์มาร์ก →

Qwen2.5-0.5B

Qwen / Qwen2.5-0.5B

0M
Qwentext-generation2 benchmarks total
transformerssafetensorsqwen2text-generation
ดูเบนช์มาร์ก →

NVIDIA-Nemotron-Nano-12B-v2-Base

nvidia / NVIDIA-Nemotron-Nano-12B-v2-Base

12B
text-generation2 benchmarks total
transformerssafetensorsnvidiapytorch
ดูเบนช์มาร์ก →

Kimi-K2.5

moonshotai / Kimi-K2.5

1.1T
image-text-to-text2 benchmarks total
transformerssafetensorskimi_k25feature-extraction
ดีที่สุด74.0 tok/s
มัธยฐาน74.0 tok/s
ต่ำสุด74.0 tok/s
ดูเบนช์มาร์ก →

Llama-3.2-3B-Instruct

meta-llama / Llama-3.2-3B-Instruct

3B
Llamatext-generation2 benchmarks total
transformerssafetensorsllamatext-generation
ดีที่สุด79.9 tok/s
มัธยฐาน65.4 tok/s
ต่ำสุด50.9 tok/s
ดูเบนช์มาร์ก →

MiniMax-M2.1

MiniMaxAI / MiniMax-M2.1

229B
Minimaxtext-generation2 benchmarks total
transformerssafetensorsminimax_m2text-generation
ดีที่สุด499 tok/s
มัธยฐาน416 tok/s
ต่ำสุด333 tok/s
ดูเบนช์มาร์ก →

Qwen3.5-35B-A3B-4bit

mlx-community / Qwen3.5-35B-A3B-4bit

MoE3B active / 6B total
Qwenimage-text-to-text2 benchmarks total
transformerssafetensorsqwen3_5_moeimage-text-to-text
ดีที่สุด140 tok/s
มัธยฐาน122 tok/s
ต่ำสุด105 tok/s
ดูเบนช์มาร์ก →

Qwen3-VL-30B-A3B-Instruct

Qwen / Qwen3-VL-30B-A3B-Instruct

31B
Qwenimage-text-to-text2 benchmarks total
transformerssafetensorsqwen3_vl_moeimage-text-to-text
ดีที่สุด56.6 tok/s
มัธยฐาน52.2 tok/s
ต่ำสุด47.7 tok/s
ดูเบนช์มาร์ก →

Ministral-3-3B-Base-2512

mistralai / Ministral-3-3B-Base-2512

4B
Mistral2 benchmarks total
vllmsafetensorsmistral3mistral-common
ดูเบนช์มาร์ก →

Llama-3.1-70B

meta-llama / Llama-3.1-70B

71B
Llamatext-generation2 benchmarks total
transformerssafetensorsllamatext-generation
ดูเบนช์มาร์ก →

Ornith-1.0-397B

deepreinforce-ai / Ornith-1.0-397B

MoE397B
Qwentext-generation1 benchmarks total
transformerssafetensorsqwen3_5_moeimage-text-to-text
ดูเบนช์มาร์ก →

MiniMax-M3

MiniMaxAI / MiniMax-M3

MoE427B
Minimaximage-text-to-text1 benchmarks total
transformerssafetensorsminimax_m3_vlimage-text-to-text
ดูเบนช์มาร์ก →

Unlimited-OCR

baidu / Unlimited-OCR

MoE3B
image-text-to-text1 benchmarks total
transformerssafetensorsunlimited-ocrfeature-extraction
ดีที่สุด365 tok/s
มัธยฐาน365 tok/s
ต่ำสุด365 tok/s
ดูเบนช์มาร์ก →

Qwen3-1.7B-Base

Qwen / Qwen3-1.7B-Base

2B
Qwentext-generation1 benchmarks total
transformerssafetensorsqwen3text-generation
ดูเบนช์มาร์ก →

gemma-4-26B-A4B-it-QAT-MLX-4bit

lmstudio-community / gemma-4-26B-A4B-it-QAT-MLX-4bit

MoE4B active / 5B total
Gemmaimage-text-to-text1 benchmarks total
transformerssafetensorsgemma4image-text-to-text
ดีที่สุด65.3 tok/s
มัธยฐาน65.3 tok/s
ต่ำสุด65.3 tok/s
ดูเบนช์มาร์ก →

granite-4.1-8b

ibm-granite / granite-4.1-8b

9B
1 benchmarks total
transformerssafetensorslanguagegranite-4.1
ดูเบนช์มาร์ก →

Step-3.7-Flash-NVFP4

stepfun-ai / Step-3.7-Flash-NVFP4

MoE104B
Optimage-text-to-text1 benchmarks total
transformerssafetensorsstep3p7text-generation
ดีที่สุด27.4 tok/s
มัธยฐาน27.4 tok/s
ต่ำสุด27.4 tok/s
ดูเบนช์มาร์ก →

Qwable-3.6-35b

Mia-AiLab / Qwable-3.6-35b

35B
Qwen1 benchmarks total
transformersggufqwenqwen3
ดีที่สุด54.1 tok/s
มัธยฐาน54.1 tok/s
ต่ำสุด54.1 tok/s
ดูเบนช์มาร์ก →

Qwen2.5-3B

Qwen / Qwen2.5-3B

3B
Qwentext-generation1 benchmarks total
safetensorsqwen2text-generationconversational
ดูเบนช์มาร์ก →

GPT-OSS-20B-Uncensored-HauhauCS-Aggressive

HauhauCS / GPT-OSS-20B-Uncensored-HauhauCS-Aggressive

20B
Gpt1 benchmarks total
ggufuncensoredabliteratedmxfp4
ดีที่สุด66.8 tok/s
มัธยฐาน66.8 tok/s
ต่ำสุด66.8 tok/s
ดูเบนช์มาร์ก →

UncensoredLM-DeepSeek-R1-Distill-Qwen-14B

uncensoredai / UncensoredLM-DeepSeek-R1-Distill-Qwen-14B

14B
Deepseek-R11 benchmarks total
safetensorsqwen2license:apache-2.0region:us
ดีที่สุด27.0 tok/s
มัธยฐาน27.0 tok/s
ต่ำสุด27.0 tok/s
ดูเบนช์มาร์ก →

Qwen3.5-9B-Red_Team

LuisPPB16 / Qwen3.5-9B-Red_Team

9B
Qwen1 benchmarks total
ggufqwen3_5llama.cppunsloth
ดีที่สุด35.9 tok/s
มัธยฐาน35.9 tok/s
ต่ำสุด35.9 tok/s
ดูเบนช์มาร์ก →

rwkv-7-world

BlinkDL / rwkv-7-world

Starcodertext-generation1 benchmarks total
pytorchtext-generationcausal-lmrwkv
ดูเบนช์มาร์ก →

LFM2.5-350M-Base

LiquidAI / LFM2.5-350M-Base

0M
text-generation1 benchmarks total
transformerssafetensorslfm2text-generation
ดูเบนช์มาร์ก →

MiniCPM3-4B

openbmb / MiniCPM3-4B

4B
text-generation1 benchmarks total
transformerspytorchminicpm3text-generation
ดีที่สุด6.1 tok/s
มัธยฐาน6.1 tok/s
ต่ำสุด6.1 tok/s
ดูเบนช์มาร์ก →

North-Mini-Code-1.0

CohereLabs / North-Mini-Code-1.0

30B
Coheretext-generation1 benchmarks total
transformerssafetensorscohere2_moetext-generation
ดีที่สุด258 tok/s
มัธยฐาน258 tok/s
ต่ำสุด258 tok/s
ดูเบนช์มาร์ก →

Qwen3.5-0.8B-Q8_0.gguf

Manojb / Qwen3.5-0.8B-Q8_0.gguf

1B
Qwen1 benchmarks total
ggufendpoints_compatibleregion:usconversational
ดีที่สุด346 tok/s
มัธยฐาน346 tok/s
ต่ำสุด346 tok/s
ดูเบนช์มาร์ก →

MiniCPM5-1B-GGUF

openbmb / MiniCPM5-1B-GGUF

1B
Llamatext-generation1 benchmarks total
transformersggufminicpmminicpm5
ดีที่สุด126 tok/s
มัธยฐาน126 tok/s
ต่ำสุด126 tok/s
ดูเบนช์มาร์ก →

Qwen3.6-35B-A3B-4bit-DWQ

mlx-community / Qwen3.6-35B-A3B-4bit-DWQ

35B
Qwentext-generation1 benchmarks total
mlxsafetensorsqwen3_5_moetext-generation
ดีที่สุด78.9 tok/s
มัธยฐาน78.9 tok/s
ต่ำสุด78.9 tok/s
ดูเบนช์มาร์ก →

MiMo-V2.5

XiaomiMiMo / MiMo-V2.5

311B
1 benchmarks total
safetensorsmimo_v2multimodalvision-language
ดูเบนช์มาร์ก →

Qwen3.5-122B-A10B-GPTQ-Int4

Qwen / Qwen3.5-122B-A10B-GPTQ-Int4

125B
Qwenimage-text-to-text1 benchmarks total
transformerssafetensorsqwen3_5_moeimage-text-to-text
ดีที่สุด49.1 tok/s
มัธยฐาน49.1 tok/s
ต่ำสุด49.1 tok/s
ดูเบนช์มาร์ก →

Llama-2-7b

meta-llama / Llama-2-7b

7B
Llamatext-generation1 benchmarks total
facebookmetapytorchllama
ดีที่สุด110 tok/s
มัธยฐาน110 tok/s
ต่ำสุด110 tok/s
ดูเบนช์มาร์ก →

Qwen2.5-32B

Qwen / Qwen2.5-32B

33B
Qwentext-generation1 benchmarks total
safetensorsqwen2text-generationconversational
ดูเบนช์มาร์ก →

Ternary-Bonsai-8B-unpacked

prism-ml / Ternary-Bonsai-8B-unpacked

8B
Qwen1 benchmarks total
safetensorsqwen3prismmlbonsai
ดูเบนช์มาร์ก →

GLM-5

zai-org / GLM-5

MoE754B
text-generation1 benchmarks total
transformerssafetensorsglm_moe_dsatext-generation
ดูเบนช์มาร์ก →

LFM2-24B-A2B

LiquidAI / LFM2-24B-A2B

24B
text-generation1 benchmarks total
transformerssafetensorsliquidlfm2
ดีที่สุด161 tok/s
มัธยฐาน161 tok/s
ต่ำสุด161 tok/s
ดูเบนช์มาร์ก →

DeepSeek-V4-Flash-2bit-DQ

mlx-community / DeepSeek-V4-Flash-2bit-DQ

284B
Deepseektext-generation1 benchmarks total
mlxsafetensorstext-generationen
ดีที่สุด17.0 tok/s
มัธยฐาน17.0 tok/s
ต่ำสุด17.0 tok/s
ดูเบนช์มาร์ก →

Qwen3-VL-2B-Instruct

Qwen / Qwen3-VL-2B-Instruct

2B
Qwenimage-text-to-text1 benchmarks total
transformerssafetensorsqwen3_vlimage-text-to-text
ดีที่สุด27.9 tok/s
มัธยฐาน27.9 tok/s
ต่ำสุด27.9 tok/s
ดูเบนช์มาร์ก →

Qwen3-30B-A3B-Instruct-2507

Qwen / Qwen3-30B-A3B-Instruct-2507

31B
Qwentext-generation1 benchmarks total
transformerssafetensorsqwen3_moetext-generation
ดูเบนช์มาร์ก →

Gemopus-4-26B-A4B-it-GGUF

Jackrong / Gemopus-4-26B-A4B-it-GGUF

26B
Gemmatext-generation1 benchmarks total
ggufgemma4gemmainstruction-tuned
ดีที่สุด94.5 tok/s
มัธยฐาน94.5 tok/s
ต่ำสุด94.5 tok/s
ดูเบนช์มาร์ก →

Qwen2-VL-7B

Qwen / Qwen2-VL-7B

8B
Qwenimage-text-to-text
transformerssafetensorsqwen2_vlimage-text-to-text
ดูเบนช์มาร์ก →

Qwen3.5-9B-NSC-ACE-SABER-GGUF

GestaltLabs / Qwen3.5-9B-NSC-ACE-SABER-GGUF

9B
Qwen
ggufqwen3_5nsc-acesaber
ดูเบนช์มาร์ก →

LFM2-24B-A2B-GGUF

lmstudio-community / LFM2-24B-A2B-GGUF

24B
ggufendpoints_compatibleregion:usconversational
ดูเบนช์มาร์ก →