Papers + RL/Reasoning - a sugatoray Collection

sugatoray 's Collections

Papers + RL/Reasoning

Marimo

RLMs (Reasoning Language Models)

Books And Notes

Reasoning Datasets

SmolAgents Tools (Spaces)

Bookmark::Models

LLMs

AV LLMs

LLM Training Datasets

Papers

Leaderboards 🔥

Papers-Fundamentals

TFM: TimeSeries Foundation Models

Papers-Benchmarks

LLMs-EmbeddingModels

LLM + Datasets : Finance

Papers + RL/Reasoning

updated about 17 hours ago

DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Paper • 2503.14476 • Published Mar 18 • 123
VAPO: Efficient and Reliable Reinforcement Learning for Advanced Reasoning Tasks

Paper • 2504.05118 • Published 26 days ago • 25
SQL-R1: Training Natural Language to SQL Reasoning Model By Reinforcement Learning

Paper • 2504.08600 • Published 22 days ago • 26
A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce

Paper • 2504.11343 • Published 18 days ago • 14
OTC: Optimal Tool Calls via Reinforcement Learning

Paper • 2504.14870 • Published 12 days ago • 33
DianJin-R1: Evaluating and Enhancing Financial Reasoning in Large Language Models

Paper • 2504.15716 • Published 11 days ago • 9
WebThinker: Empowering Large Reasoning Models with Deep Research Capability

Paper • 2504.21776 • Published 3 days ago • 35
DeepCritic: Deliberate Critique with Large Language Models

Paper • 2505.00662 • Published 1 day ago • 28