llm - a josang1204 Collection

josang1204 's Collections

llm

llm

updated 2 days ago

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Paper • 2502.09696 • Published Feb 13 • 39
MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Paper • 2502.10391 • Published Feb 14 • 32
Autellix: An Efficient Serving Engine for LLM Agents as General Programs

Paper • 2502.13965 • Published 28 days ago • 18
SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 27 days ago • 97
li-lab/MMLU-ProX

Viewer • Updated 2 days ago • 154k • 85 • 2