r-papers - a zero9labs Collection

zero9labs 's Collections

r-papers

updated about 23 hours ago

QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning

Paper • 2505.17667 • Published 11 days ago • 83
Distilling LLM Agent into Small Models with Retrieval and Code Tools

Paper • 2505.17612 • Published 11 days ago • 75
Qwen3 Technical Report

Paper • 2505.09388 • Published 20 days ago • 175
Absolute Zero: Reinforced Self-play Reasoning with Zero Data

Paper • 2505.03335 • Published 28 days ago • 168
MALT: Improving Reasoning with Multi-Agent LLM Training

Paper • 2412.01928 • Published Dec 2, 2024 • 45