Cheng Qian's picture

10

Cheng Qian

chengq9

·

https://qiancheng0.github.io

qiancheng0

AI & ML interests

Agent, Tool Learning

Recent Activity

upvoted a collection 4 days ago

upvoted a paper 4 days ago

RM-R1: Reward Modeling as Reasoning

upvoted a collection 11 days ago

View all activity

Organizations

Collections 1

Papers 11

arxiv:2504.14870

arxiv:2504.13958

arxiv:2504.03612

arxiv:2503.01935

models 3

chengq9/ToolRL-Qwen2.5-1.5B

Updated 18 days ago • 9

chengq9/ToolRL-Qwen2.5-3B

Updated 18 days ago • 12 • 1

chengq9/ToolRL-Llama3.2-3B

Updated 18 days ago • 7

datasets 0

None public yet