Модели Таблица лидеров Оборудование Маркетплейс Оценки Обучение Аренда Документация API

Язык

Lucebox Hub campaign banner

Наборы оценок

Наборы бенчмарков сообщества для оценки качества локальных LLM. Отправляйте результаты через API.

Все Официально LM-Eval runs Custom / rated coding knowledge writing

v1.0 · LM-Eval run

Massive Multitask Language Understanding via EleutherAI lm-evaluation-harness task mmlu, 5-shot, exact-match/accuracy style scoring.

knowledge0 запуски

v1.0 · LM-Eval run

knowledge1 запуск