Модели Таблица лидеров Оборудование Маркетплейс Оценки Обучение Аренда Документация API

Язык

Lucebox Hub campaign banner

Наборы оценок

Наборы бенчмарков сообщества для оценки качества локальных LLM. Отправляйте результаты через API.

Все Официально LM-Eval runs Custom / rated coding knowledge writing

HumanEval 0-shot

v1.0 · LM-Eval run

OpenAI HumanEval via EleutherAI lm-evaluation-harness task humaneval, 0-shot, pass@k code-generation scoring.

coding1 запуск