RL Agents - a alexngai Collection

alexngai 's Collections

Autonomous Research

Automated Research

Test-Time Compute/Optimal Scaling

Self-Improving Agents

Codegen Benchmarks

RL Agents

updated 5 days ago

Kimi k1.5: Scaling Reinforcement Learning with LLMs

Paper • 2501.12599 • Published Jan 22 • 111