LocalMaxxing
모델
모델
평가
리더보드
더보기
API
+
제출
모델
리더보드
모델
Marketplace
평가
학습
렌탈
API 문서
Language
English
简体中文
繁體中文
日本語
한국어
Your Ad Here
평가 스위트
로컬 LLM 품질을 평가하기 위한 커뮤니티 벤치마크 스위트입니다. API를 통해 결과를 제출하세요.
Build eval
전체
공식
LM-Eval runs
Custom server-side
coding
knowledge
math
reasoning
truthfulness
writing
아직 평가 스위트가 없습니다
승인된 스위트가 여기에 표시됩니다. API를 통해 하나를 제출하세요.