QRQ's picture

1 40 3

QRQ

RichardQRQ

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

liked a Space 1 day ago

opencompass/Open_LMM_Reasoning_Leaderboard

upvoted a paper 2 days ago

Phi-4-reasoning Technical Report

View all activity

Organizations

None yet

RichardQRQ's activity

upvoted a paper 1 day ago

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

Paper • 2505.00703 • Published 2 days ago • 25

upvoted a paper 2 days ago

Phi-4-reasoning Technical Report

Paper • 2504.21318 • Published 4 days ago • 24

upvoted 3 papers 9 days ago

DreamID: High-Fidelity and Fast diffusion-based Face Swapping via Triplet ID Group Learning

Paper • 2504.14509 • Published 13 days ago • 49

I-Con: A Unifying Framework for Representation Learning

Paper • 2504.16929 • Published 10 days ago • 29

Trillion 7B Technical Report

Paper • 2504.15431 • Published 12 days ago • 34

upvoted 3 papers 11 days ago

FlowReasoner: Reinforcing Query-Level Meta-Agents

Paper • 2504.15257 • Published 12 days ago • 46

ToolRL: Reward is All Tool Learning Needs

Paper • 2504.13958 • Published 17 days ago • 42

Learning to Reason under Off-Policy Guidance

Paper • 2504.14945 • Published 12 days ago • 79

upvoted 2 papers 18 days ago

VisuoThink: Empowering LVLM Reasoning with Multimodal Tree Search

Paper • 2504.09130 • Published 21 days ago • 12

InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

Paper • 2504.10479 • Published 19 days ago • 252

upvoted 3 papers about 1 month ago

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published Mar 26 • 149

STEVE: AStep Verification Pipeline for Computer-use Agent Training

Paper • 2503.12532 • Published Mar 16 • 15

TULIP: Towards Unified Language-Image Pretraining

Paper • 2503.15485 • Published Mar 19 • 48

upvoted 6 papers about 2 months ago

Being-0: A Humanoid Robotic Agent with Vision-Language Models and Modular Skills

Paper • 2503.12533 • Published Mar 16 • 65

VisualPRM: An Effective Process Reward Model for Multimodal Reasoning

Paper • 2503.10291 • Published Mar 13 • 36

R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization

Paper • 2503.10615 • Published Mar 13 • 17

Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

Paper • 2503.03601 • Published Mar 5 • 232

SEAP: Training-free Sparse Expert Activation Pruning Unlock the Brainpower of Large Language Models

Paper • 2503.07605 • Published Mar 10 • 68

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published Mar 6 • 111

upvoted a paper 2 months ago

MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Paper • 2502.10391 • Published Feb 14 • 35