モデルリーダーボードモデルMarketplace評価トレーニングレンタルAPIドキュメント
Language
Your Ad Here

評価スイート

ローカルLLMの品質を評価するためのコミュニティベンチマークスイート。APIから結果を送信してください。

Build eval

まだ評価スイートがありません

承認されたスイートはここに表示されます。APIから送信してください。