モデルリーダーボードモデルMarketplace評価トレーニングレンタルAPIドキュメント
Language
Your Ad Here
Back to evals

Build an eval suite

Create a benchmark card, attach inline or bucket-backed datasets, and submit it for approval.

Task 1

Sample 1