モデルリーダーボードハードウェアマーケットプレイス評価トレーニングレンタルProAPIドキュメント
言語
Lucebox Hub campaign banner

モデル

95 件のモデルグループ · 合計 337 件

Qwen3.6-27B

Qwen / Qwen3.6-27B

28B
Qwenimage-text-to-text合計 283 件のベンチマーク
transformerssafetensorsqwen3_5image-text-to-text
最高255 tok/s
中央値42.7 tok/s
最小1.6 tok/s
ベンチマークを見る →

Qwen3.6-35B-A3B

Qwen / Qwen3.6-35B-A3B

36B
Qwenimage-text-to-text合計 164 件のベンチマーク
transformerssafetensorsqwen3_5_moeimage-text-to-text
最高260 tok/s
中央値75.2 tok/s
最小6.4 tok/s
ベンチマークを見る →

MiniMax-M2.7

MiniMaxAI / MiniMax-M2.7

229B
Minimaxtext-generation合計 117 件のベンチマーク
transformerssafetensorsminimax_m2text-generation
最高496 tok/s
中央値32.2 tok/s
最小0.5 tok/s
ベンチマークを見る →

Qwen3.5-27B

Qwen / Qwen3.5-27B

28B
Qwenimage-text-to-text合計 60 件のベンチマーク
transformerssafetensorsqwen3_5image-text-to-text
最高287 tok/s
中央値30.9 tok/s
最小2.2 tok/s
ベンチマークを見る →

Qwen3.5-9B-Base

Qwen / Qwen3.5-9B-Base

10B
Qwenimage-text-to-text合計 53 件のベンチマーク
transformerssafetensorsqwen3_5image-text-to-text
ベンチマークを見る →

gemma-4-E4B

google / gemma-4-E4B

8B
Gemmaany-to-any合計 34 件のベンチマーク
transformerssafetensorsgemma4image-text-to-text
ベンチマークを見る →

Ornstein3.6-27B-MTP-NSC-ACE-SABER

GestaltLabs / Ornstein3.6-27B-MTP-NSC-ACE-SABER

27B
Qwenimage-text-to-text合計 33 件のベンチマーク
transformerssafetensorsqwen3_5image-text-to-text
ベンチマークを見る →

Qwen3.5-35B-A3B-Base

Qwen / Qwen3.5-35B-A3B-Base

36B
Qwenimage-text-to-text合計 31 件のベンチマーク
transformerssafetensorsqwen3_5_moeimage-text-to-text
ベンチマークを見る →

gemma-4-26B-A4B

google / gemma-4-26B-A4B

27B
Gemmaimage-text-to-text合計 28 件のベンチマーク
transformerssafetensorsgemma4image-text-to-text
ベンチマークを見る →

gemma-4-31B

google / gemma-4-31B

33B
Gemmaimage-text-to-text合計 25 件のベンチマーク
transformerssafetensorsgemma4image-text-to-text
ベンチマークを見る →

Qwen2.5-14B

Qwen / Qwen2.5-14B

15B
Qwentext-generation合計 22 件のベンチマーク
safetensorsqwen2text-generationconversational
ベンチマークを見る →

Qwen3.5-122B-A10B

Qwen / Qwen3.5-122B-A10B

125B
Qwenimage-text-to-text合計 22 件のベンチマーク
transformerssafetensorsqwen3_5_moeimage-text-to-text
最高27.3 tok/s
中央値26.1 tok/s
最小3.2 tok/s
ベンチマークを見る →

Qwen3-Coder-30B-A3B-Instruct

Qwen / Qwen3-Coder-30B-A3B-Instruct

31B
Qwentext-generation合計 22 件のベンチマーク
transformerssafetensorsqwen3_moetext-generation
最高101 tok/s
中央値84.3 tok/s
最小79.8 tok/s
ベンチマークを見る →

LFM2.5-8B-A1B-Base

LiquidAI / LFM2.5-8B-A1B-Base

8B
text-generation合計 20 件のベンチマーク
transformerssafetensorslfm2_moetext-generation
ベンチマークを見る →

Qwen3.5-4B-Base

Qwen / Qwen3.5-4B-Base

5B
Qwenimage-text-to-text合計 16 件のベンチマーク
transformerssafetensorsqwen3_5image-text-to-text
ベンチマークを見る →

Qwen3-Coder-Next

Qwen / Qwen3-Coder-Next

80B
Qwentext-generation合計 16 件のベンチマーク
transformerssafetensorsqwen3_nexttext-generation
最高80.8 tok/s
中央値55.8 tok/s
最小51.2 tok/s
ベンチマークを見る →

Llama-3.1-8B

meta-llama / Llama-3.1-8B

8B
Llamatext-generation合計 15 件のベンチマーク
transformerssafetensorsllamatext-generation
ベンチマークを見る →

gemma-4-12B

google / gemma-4-12B

12B
Gemmaany-to-any合計 14 件のベンチマーク
transformerssafetensorsgemma4_unifiedimage-text-to-text
最高25.8 tok/s
中央値25.8 tok/s
最小25.8 tok/s
ベンチマークを見る →

Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

nvidia / Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

33B
any-to-any合計 13 件のベンチマーク
transformerssafetensorsNemotronH_Nano_Omni_Reasoning_V3image-feature-extraction
最高107 tok/s
中央値90.6 tok/s
最小57.9 tok/s
ベンチマークを見る →

Qwen2.5-7B

Qwen / Qwen2.5-7B

8B
Qwentext-generation合計 12 件のベンチマーク
transformerssafetensorsqwen2text-generation
最高1.4k tok/s
中央値1.4k tok/s
最小1.4k tok/s
ベンチマークを見る →

gpt-oss-20b

openai / gpt-oss-20b

22B
Gpttext-generation合計 12 件のベンチマーク
transformerssafetensorsgpt_osstext-generation
最高991 tok/s
中央値87.1 tok/s
最小12.0 tok/s
ベンチマークを見る →

gemma-4-E2B

google / gemma-4-E2B

5B
Gemmaany-to-any合計 11 件のベンチマーク
transformerssafetensorsgemma4image-text-to-text
ベンチマークを見る →

gpt-oss-120b

openai / gpt-oss-120b

120B
Gpttext-generation合計 11 件のベンチマーク
transformerssafetensorsgpt_osstext-generation
最高223 tok/s
中央値70.7 tok/s
最小62.7 tok/s
ベンチマークを見る →

gemma-3-12b-pt

google / gemma-3-12b-pt

12B
Gemmaimage-text-to-text合計 10 件のベンチマーク
transformerssafetensorsgemma3image-text-to-text
ベンチマークを見る →

Qwen3.6-27B-DFlash

z-lab / Qwen3.6-27B-DFlash

2B
Qwentext-generation合計 10 件のベンチマーク
transformerssafetensorsqwen3image-feature-extraction
最高215 tok/s
中央値39.2 tok/s
最小26.9 tok/s
ベンチマークを見る →

Nex-N2-mini

nex-agi / Nex-N2-mini

35B
Qwentext-generation合計 9 件のベンチマーク
transformerssafetensorsqwen3_5_moeimage-text-to-text
最高107 tok/s
中央値104 tok/s
最小40.5 tok/s
ベンチマークを見る →

DeepSeek-V4-Flash

deepseek-ai / DeepSeek-V4-Flash

158B
Deepseektext-generation合計 9 件のベンチマーク
transformerssafetensorsdeepseek_v4text-generation
最高45.7 tok/s
中央値19.7 tok/s
最小18.6 tok/s
ベンチマークを見る →

GLM-4.7-Flash

zai-org / GLM-4.7-Flash

31B
text-generation合計 9 件のベンチマーク
transformerssafetensorsglm4_moe_litetext-generation
最高212 tok/s
中央値176 tok/s
最小92.9 tok/s
ベンチマークを見る →

DeepSeek-R1-Distill-Qwen-7B

deepseek-ai / DeepSeek-R1-Distill-Qwen-7B

8B
Deepseek-R1text-generation合計 8 件のベンチマーク
transformerssafetensorsqwen2text-generation
最高144 tok/s
中央値69.0 tok/s
最小38.1 tok/s
ベンチマークを見る →

Ling-2.6-flash

inclusionAI / Ling-2.6-flash

107B
text-generation合計 8 件のベンチマーク
safetensorsbailing_hybridtext-generationconversational
最高94.9 tok/s
中央値86.2 tok/s
最小82.3 tok/s
ベンチマークを見る →

Qwen2.5-72B

Qwen / Qwen2.5-72B

73B
Qwentext-generation合計 8 件のベンチマーク
transformerssafetensorsqwen2text-generation
ベンチマークを見る →

Nemotron-Cascade-2-30B-A3B

nvidia / Nemotron-Cascade-2-30B-A3B

32B
text-generation合計 8 件のベンチマーク
transformerssafetensorsnemotron_htext-generation
最高141 tok/s
中央値95.4 tok/s
最小89.8 tok/s
ベンチマークを見る →

Qwen3.5-0.8B-Base

Qwen / Qwen3.5-0.8B-Base

1B
Qwenimage-text-to-text合計 7 件のベンチマーク
transformerssafetensorsqwen3_5image-text-to-text
最高2.7k tok/s
中央値2.7k tok/s
最小2.7k tok/s
ベンチマークを見る →

Mistral-Medium-3.5-128B

mistralai / Mistral-Medium-3.5-128B

128B
Mistral合計 7 件のベンチマーク
safetensorsmistral3vLLMen
最高7.4 tok/s
中央値6.6 tok/s
最小6.2 tok/s
ベンチマークを見る →

Qwen3-30B-A3B-Base

Qwen / Qwen3-30B-A3B-Base

31B
Qwentext-generation合計 7 件のベンチマーク
transformerssafetensorsqwen3_moetext-generation
ベンチマークを見る →

DeepSeek-Coder-V2-Lite-Instruct

deepseek-ai / DeepSeek-Coder-V2-Lite-Instruct

MoE16B
Deepseek-Codertext-generation合計 6 件のベンチマーク
transformerssafetensorsdeepseek_v2text-generation
最高150 tok/s
中央値87.0 tok/s
最小39.0 tok/s
ベンチマークを見る →

NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

nvidia / NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

32B
text-generation合計 5 件のベンチマーク
transformerssafetensorsnemotron_htext-generation
最高313 tok/s
中央値286 tok/s
最小117 tok/s
ベンチマークを見る →

Qwen3-14B-Base

Qwen / Qwen3-14B-Base

15B
Qwentext-generation合計 5 件のベンチマーク
transformerssafetensorsqwen3text-generation
ベンチマークを見る →

Mistral-Small-3.1-24B-Base-2503

mistralai / Mistral-Small-3.1-24B-Base-2503

24B
Mistral合計 5 件のベンチマーク
vllmsafetensorsmistral3mistral-common
ベンチマークを見る →

gemma-3-1b-pt

google / gemma-3-1b-pt

1B
Gemmatext-generation合計 5 件のベンチマーク
transformerssafetensorsgemma3_texttext-generation
ベンチマークを見る →

Qwen3.5-2B-Base

Qwen / Qwen3.5-2B-Base

2B
Qwenimage-text-to-text合計 5 件のベンチマーク
transformerssafetensorsqwen3_5image-text-to-text
ベンチマークを見る →

Qwen2.5-1.5B

Qwen / Qwen2.5-1.5B

2B
Qwentext-generation合計 5 件のベンチマーク
transformerssafetensorsqwen2text-generation
ベンチマークを見る →

Qwen3-8B-Base

Qwen / Qwen3-8B-Base

8B
Qwentext-generation合計 5 件のベンチマーク
transformerssafetensorsqwen3text-generation
ベンチマークを見る →

NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

nvidia / NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

67B
Opttext-generation合計 5 件のベンチマーク
transformerssafetensorsnemotron_htext-generation
最高262 tok/s
中央値175 tok/s
最小49.6 tok/s
ベンチマークを見る →

LFM2.5-1.2B-Base

LiquidAI / LFM2.5-1.2B-Base

1B
text-generation合計 4 件のベンチマーク
transformerssafetensorslfm2text-generation
ベンチマークを見る →

granite-4.0-h-micro

ibm-granite / granite-4.0-h-micro

3B
text-generation合計 4 件のベンチマーク
transformerssafetensorsgranitemoehybridtext-generation
最高68.6 tok/s
中央値45.2 tok/s
最小45.0 tok/s
ベンチマークを見る →

LFM2-8B-A1B

LiquidAI / LFM2-8B-A1B

MoE1B アクティブ / 8B 合計
text-generation合計 4 件のベンチマーク
transformerssafetensorslfm2_moetext-generation
最高18.3 tok/s
中央値18.3 tok/s
最小9.9 tok/s
ベンチマークを見る →

DeepSeek-R1-Distill-Qwen-14B

deepseek-ai / DeepSeek-R1-Distill-Qwen-14B

15B
Deepseek-R1text-generation合計 4 件のベンチマーク
transformerssafetensorsarxiv:2501.12948license:mit
最高24.4 tok/s
中央値24.4 tok/s
最小24.4 tok/s
ベンチマークを見る →

gemma-3n-E4B

google / gemma-3n-E4B

8B
Gemmaimage-text-to-text合計 4 件のベンチマーク
transformerssafetensorsgemma3nimage-text-to-text
ベンチマークを見る →

MiniMax-M2

MiniMaxAI / MiniMax-M2

229B
Minimaxtext-generation合計 4 件のベンチマーク
transformerssafetensorsminimax_m2text-generation
最高493 tok/s
中央値398 tok/s
最小303 tok/s
ベンチマークを見る →

GLM-5.1

zai-org / GLM-5.1

754B
text-generation合計 4 件のベンチマーク
transformerssafetensorsglm_moe_dsatext-generation
ベンチマークを見る →

granite-4.1-30b

ibm-granite / granite-4.1-30b

29B
text-generation合計 4 件のベンチマーク
transformerssafetensorsgranitetext-generation
最高17.9 tok/s
中央値16.4 tok/s
最小15.6 tok/s
ベンチマークを見る →

Gemopus-4-26B-A4B-it

Jackrong / Gemopus-4-26B-A4B-it

27B
Gemmatext-generation合計 4 件のベンチマーク
safetensorsgemma4gemmainstruction-tuned
最高64.3 tok/s
中央値55.0 tok/s
最小45.7 tok/s
ベンチマークを見る →

phi-4

microsoft / phi-4

15B
Phitext-generation合計 3 件のベンチマーク
transformerssafetensorsphi3text-generation
最高77.0 tok/s
中央値36.0 tok/s
最小36.0 tok/s
ベンチマークを見る →

NVIDIA-Nemotron-3-Super-120B-A12B-BF16

nvidia / NVIDIA-Nemotron-3-Super-120B-A12B-BF16

124B
text-generation合計 3 件のベンチマーク
transformerssafetensorsnemotron_htext-generation
ベンチマークを見る →

Qwen3-32B

Qwen / Qwen3-32B

33B
Qwentext-generation合計 3 件のベンチマーク
transformerssafetensorsqwen3text-generation
最高79.3 tok/s
中央値22.9 tok/s
最小22.8 tok/s
ベンチマークを見る →

MiniMax-M2.5

MiniMaxAI / MiniMax-M2.5

229B
Minimaxtext-generation合計 3 件のベンチマーク
transformerssafetensorsminimax_m2text-generation
最高504 tok/s
中央値419 tok/s
最小334 tok/s
ベンチマークを見る →

Step-3.7-Flash

stepfun-ai / Step-3.7-Flash

MoE201B
image-text-to-text合計 2 件のベンチマーク
transformerssafetensorsstep3p7text-generation
ベンチマークを見る →

NVIDIA-Nemotron-Nano-12B-v2-Base

nvidia / NVIDIA-Nemotron-Nano-12B-v2-Base

12B
text-generation合計 2 件のベンチマーク
transformerssafetensorsnvidiapytorch
ベンチマークを見る →

Qwen3-4B-Base

Qwen / Qwen3-4B-Base

4B
Qwentext-generation合計 2 件のベンチマーク
transformerssafetensorsqwen3text-generation
ベンチマークを見る →

Kimi-K2.5

moonshotai / Kimi-K2.5

1.1T
image-text-to-text合計 2 件のベンチマーク
transformerssafetensorskimi_k25image-feature-extraction
最高74.0 tok/s
中央値74.0 tok/s
最小74.0 tok/s
ベンチマークを見る →

Llama-3.2-3B-Instruct

meta-llama / Llama-3.2-3B-Instruct

3B
Llamatext-generation合計 2 件のベンチマーク
transformerssafetensorsllamatext-generation
最高79.9 tok/s
中央値65.4 tok/s
最小50.9 tok/s
ベンチマークを見る →

MiniMax-M2.1

MiniMaxAI / MiniMax-M2.1

229B
Minimaxtext-generation合計 2 件のベンチマーク
transformerssafetensorsminimax_m2text-generation
最高499 tok/s
中央値416 tok/s
最小333 tok/s
ベンチマークを見る →

Qwen3-VL-30B-A3B-Instruct

Qwen / Qwen3-VL-30B-A3B-Instruct

31B
Qwenimage-text-to-text合計 2 件のベンチマーク
transformerssafetensorsqwen3_vl_moeimage-text-to-text
最高56.6 tok/s
中央値52.2 tok/s
最小47.7 tok/s
ベンチマークを見る →

Ministral-3-3B-Base-2512

mistralai / Ministral-3-3B-Base-2512

4B
Mistral合計 2 件のベンチマーク
vllmsafetensorsmistral3mistral-common
ベンチマークを見る →

Llama-3.1-70B

meta-llama / Llama-3.1-70B

71B
Llamatext-generation合計 2 件のベンチマーク
transformerssafetensorsllamatext-generation
ベンチマークを見る →

GLM-5.2

zai-org / GLM-5.2

753B
text-generation合計 1 件のベンチマーク
transformerssafetensorsglm_moe_dsatext-generation
ベンチマークを見る →

Qwen2.5-3B

Qwen / Qwen2.5-3B

3B
Qwentext-generation合計 1 件のベンチマーク
safetensorsqwen2text-generationconversational
ベンチマークを見る →

GPT-OSS-20B-Uncensored-HauhauCS-Aggressive

HauhauCS / GPT-OSS-20B-Uncensored-HauhauCS-Aggressive

20B
Gpt合計 1 件のベンチマーク
ggufuncensoredabliteratedmxfp4
最高66.8 tok/s
中央値66.8 tok/s
最小66.8 tok/s
ベンチマークを見る →

UncensoredLM-DeepSeek-R1-Distill-Qwen-14B

uncensoredai / UncensoredLM-DeepSeek-R1-Distill-Qwen-14B

14B
Deepseek-R1合計 1 件のベンチマーク
safetensorsqwen2license:apache-2.0region:us
最高27.0 tok/s
中央値27.0 tok/s
最小27.0 tok/s
ベンチマークを見る →

Qwen3.5-9B-Red_Team

LuisPPB16 / Qwen3.5-9B-Red_Team

9B
Qwen合計 1 件のベンチマーク
ggufqwen3_5llama.cppunsloth
最高35.9 tok/s
中央値35.9 tok/s
最小35.9 tok/s
ベンチマークを見る →

rwkv-7-world

BlinkDL / rwkv-7-world

Starcodertext-generation合計 1 件のベンチマーク
pytorchtext-generationcausal-lmrwkv
ベンチマークを見る →

LFM2.5-350M-Base

LiquidAI / LFM2.5-350M-Base

0M
text-generation合計 1 件のベンチマーク
transformerssafetensorslfm2text-generation
ベンチマークを見る →

MiniCPM3-4B

openbmb / MiniCPM3-4B

4B
text-generation合計 1 件のベンチマーク
transformerspytorchminicpm3text-generation
最高6.1 tok/s
中央値6.1 tok/s
最小6.1 tok/s
ベンチマークを見る →

North-Mini-Code-1.0

CohereLabs / North-Mini-Code-1.0

30B
Coheretext-generation合計 1 件のベンチマーク
transformerssafetensorscohere2_moetext-generation
最高258 tok/s
中央値258 tok/s
最小258 tok/s
ベンチマークを見る →

Qwen3.5-0.8B-Q8_0.gguf

Manojb / Qwen3.5-0.8B-Q8_0.gguf

1B
Qwen合計 1 件のベンチマーク
ggufendpoints_compatibleregion:usconversational
最高346 tok/s
中央値346 tok/s
最小346 tok/s
ベンチマークを見る →

MiniCPM5-1B-GGUF

openbmb / MiniCPM5-1B-GGUF

1B
Llamatext-generation合計 1 件のベンチマーク
transformersggufminicpmminicpm5
最高126 tok/s
中央値126 tok/s
最小126 tok/s
ベンチマークを見る →

Qwen3.6-35B-A3B-4bit-DWQ

mlx-community / Qwen3.6-35B-A3B-4bit-DWQ

35B
Qwentext-generation合計 1 件のベンチマーク
mlxsafetensorsqwen3_5_moetext-generation
最高78.9 tok/s
中央値78.9 tok/s
最小78.9 tok/s
ベンチマークを見る →

MiMo-V2.5

XiaomiMiMo / MiMo-V2.5

311B
合計 1 件のベンチマーク
safetensorsmimo_v2multimodalvision-language
ベンチマークを見る →

Qwen3.5-122B-A10B-GPTQ-Int4

Qwen / Qwen3.5-122B-A10B-GPTQ-Int4

125B
Qwenimage-text-to-text合計 1 件のベンチマーク
transformerssafetensorsqwen3_5_moeimage-text-to-text
最高49.1 tok/s
中央値49.1 tok/s
最小49.1 tok/s
ベンチマークを見る →

Llama-2-7b

meta-llama / Llama-2-7b

7B
Llamatext-generation合計 1 件のベンチマーク
facebookmetapytorchllama
最高110 tok/s
中央値110 tok/s
最小110 tok/s
ベンチマークを見る →

Qwen2.5-32B

Qwen / Qwen2.5-32B

33B
Qwentext-generation合計 1 件のベンチマーク
safetensorsqwen2text-generationconversational
ベンチマークを見る →

Qwen3-VL-8B-Instruct

Qwen / Qwen3-VL-8B-Instruct

9B
Qwenimage-text-to-text合計 1 件のベンチマーク
transformerssafetensorsqwen3_vlimage-text-to-text
最高95.9 tok/s
中央値95.9 tok/s
最小95.9 tok/s
ベンチマークを見る →

Ternary-Bonsai-8B-unpacked

prism-ml / Ternary-Bonsai-8B-unpacked

8B
Qwen合計 1 件のベンチマーク
safetensorsqwen3prismmlbonsai
ベンチマークを見る →

Qwen3.5-35B-A3B-4bit

mlx-community / Qwen3.5-35B-A3B-4bit

6B
Qwenimage-text-to-text合計 1 件のベンチマーク
transformerssafetensorsqwen3_5_moeimage-text-to-text
最高105 tok/s
中央値105 tok/s
最小105 tok/s
ベンチマークを見る →

gemma-3-4b-pt

google / gemma-3-4b-pt

4B
Gemmaimage-text-to-text合計 1 件のベンチマーク
transformerssafetensorsgemma3image-text-to-text
ベンチマークを見る →

GLM-5

zai-org / GLM-5

754B
text-generation合計 1 件のベンチマーク
transformerssafetensorsglm_moe_dsatext-generation
ベンチマークを見る →

LFM2-24B-A2B

LiquidAI / LFM2-24B-A2B

24B
text-generation合計 1 件のベンチマーク
transformerssafetensorsliquidlfm2
最高161 tok/s
中央値161 tok/s
最小161 tok/s
ベンチマークを見る →

DeepSeek-V4-Flash-2bit-DQ

mlx-community / DeepSeek-V4-Flash-2bit-DQ

284B
Deepseektext-generation合計 1 件のベンチマーク
mlxsafetensorstext-generationen
最高17.0 tok/s
中央値17.0 tok/s
最小17.0 tok/s
ベンチマークを見る →

Qwen3-VL-2B-Instruct

Qwen / Qwen3-VL-2B-Instruct

2B
Qwenimage-text-to-text合計 1 件のベンチマーク
transformerssafetensorsqwen3_vlimage-text-to-text
最高27.9 tok/s
中央値27.9 tok/s
最小27.9 tok/s
ベンチマークを見る →

Qwen3-30B-A3B-Instruct-2507

Qwen / Qwen3-30B-A3B-Instruct-2507

31B
Qwentext-generation合計 1 件のベンチマーク
transformerssafetensorsqwen3_moetext-generation
ベンチマークを見る →

Gemopus-4-26B-A4B-it-GGUF

Jackrong / Gemopus-4-26B-A4B-it-GGUF

26B
Gemmatext-generation合計 1 件のベンチマーク
ggufgemma4gemmainstruction-tuned
最高94.5 tok/s
中央値94.5 tok/s
最小94.5 tok/s
ベンチマークを見る →

Qwen2-VL-7B

Qwen / Qwen2-VL-7B

8B
Qwenimage-text-to-text
transformerssafetensorsqwen2_vlimage-text-to-text
ベンチマークを見る →

Qwen3.5-9B-NSC-ACE-SABER-GGUF

GestaltLabs / Qwen3.5-9B-NSC-ACE-SABER-GGUF

9B
Qwen
ggufqwen3_5nsc-acesaber
ベンチマークを見る →

LFM2-24B-A2B-GGUF

lmstudio-community / LFM2-24B-A2B-GGUF

24B
ggufendpoints_compatibleregion:usconversational
ベンチマークを見る →