LocalMaxxing
模型
模型
评测
排行榜
更多
API
+
提交
模型
排行榜
模型
Marketplace
评测
训练
租用
API文档
Language
English
简体中文
繁體中文
日本語
한국어
Your Ad Here
评测套件
用于评估本地LLM质量的社区基准测试套件。通过API提交结果。
Build eval
全部
官方
LM-Eval runs
Custom server-side
coding
knowledge
math
reasoning
truthfulness
writing
暂无评测套件
已通过的套件将显示在此处。通过API提交一个。