Reasoning-01 - a mgkwill Collection

mgkwill 's Collections

OpenSci

chat-models-candidates

Reasoning-01

updated 5 days ago

Skywork Open Reasoner 1 Technical Report

Paper • 2505.22312 • Published 6 days ago • 50
Unveiling Instruction-Specific Neurons & Experts: An Analytical Framework for LLM's Instruction-Following Capabilities

Paper • 2505.21191 • Published 7 days ago • 2
Absolute Zero: Reinforced Self-play Reasoning with Zero Data

Paper • 2505.03335 • Published 28 days ago • 168
Qwen3 Technical Report

Paper • 2505.09388 • Published 20 days ago • 175
MiMo: Unlocking the Reasoning Potential of Language Model -- From Pretraining to Posttraining

Paper • 2505.07608 • Published 22 days ago • 77
RM-R1: Reward Modeling as Reasoning

Paper • 2505.02387 • Published 29 days ago • 74
Reinforcement Learning for Reasoning in Small LLMs: What Works and What Doesn't

Paper • 2503.16219 • Published Mar 20 • 51