Kelvin's picture

10

Kelvin PRO

kh

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 11 days ago

J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning

upvoted a paper 11 days ago

J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization

upvoted a paper 12 days ago

Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective

View all activity

Organizations

None yet

kh's activity

upvoted 2 papers 11 days ago

J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning

Paper • 2505.10320 • Published 19 days ago • 22

J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization

Paper • 2505.13346 • Published 15 days ago • 2

upvoted a paper 12 days ago

Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective

Paper • 2505.15045 • Published 14 days ago • 53

upvoted 2 papers 13 days ago

d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning

Paper • 2504.12216 • Published Apr 16 • 2

CS-Sum: A Benchmark for Code-Switching Dialogue Summarization and the Limits of Large Language Models

Paper • 2505.13559 • Published 15 days ago • 13

upvoted 3 papers 15 days ago

Visual Planning: Let's Think Only with Images

Paper • 2505.11409 • Published 18 days ago • 53

Group Think: Multiple Concurrent Reasoning Agents Collaborating at Token Level Granularity

Paper • 2505.11107 • Published 18 days ago • 28

Qwen3 Technical Report

Paper • 2505.09388 • Published 20 days ago • 175

upvoted an article about 2 months ago

Article

Gotchas in Tokenizer Behavior Every Developer Should Know

By

•

Apr 18

• 37

upvoted a paper 4 months ago

Agency Is Frame-Dependent

Paper • 2502.04403 • Published Feb 6 • 23