LocalMaxxing
模型
模型
評測
排行榜
更多
API
+
提交
模型
排行榜
模型
Marketplace
評測
訓練
租用
API文件
Language
English
简体中文
繁體中文
日本語
한국어
Your Ad Here
評測套件
用於評估本地LLM品質的社群基準測試套件。透過API提交結果。
Build eval
全部
官方
LM-Eval runs
Custom server-side
coding
knowledge
math
reasoning
truthfulness
writing
暫無評測套件
已通過的套件將顯示在此處。透過API提交一個。