LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
7.47k
•
89
Viewer
•
Updated
•
164
•
95.7k
•
286
Viewer
•
Updated
•
541
•
15.4k
•
64
Viewer
•
Updated
•
7.79k
•
476k
•
176
Updated
•
410k
•
61
Viewer
•
Updated
•
12.1k
•
43.4k
•
334
Viewer
•
Updated
•
231k
•
145k
•
422
Viewer
•
Updated
•
1.63k
•
34.4k
•
228
Viewer
•
Updated
•
17.6k
•
347k
•
647
Viewer
•
Updated
•
60k
•
465k
•
112
Updated
•
18.2k
•
54
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
424
•
17
Viewer
•
Updated
•
34.6k
•
2.31k
•
108
Viewer
•
Updated
•
95.4k
•
4.28k
•
38