Reasoning LLMs - a thomas-ferraz Collection

thomas-ferraz 's Collections

Reinforcement Learning

Reasoning LLMs

updated 1 day ago

Step Back to Leap Forward: Self-Backtracking for Boosting Reasoning of Language Models

Paper • 2502.04404 • Published Feb 6 • 24
Learning Adaptive Parallel Reasoning with Language Models

Paper • 2504.15466 • Published 3 days ago • 35
TTRL: Test-Time Reinforcement Learning

Paper • 2504.16084 • Published 1 day ago • 68
THOUGHTTERMINATOR: Benchmarking, Calibrating, and Mitigating Overthinking in Reasoning Models

Paper • 2504.13367 • Published 7 days ago • 23