Models Leaderboard Evals API Docs

Eval Suites

Community benchmark suites for evaluating local LLM quality. Submit results via the API.

No eval suites yet

Approved suites will appear here. Submit one via the API.