Jim Lai

grimjim

AI & ML interests

Experimenting primarily with 7B-12B parameter text completion models. Not all models are intended for direct use, but aim for research and/or educational purposes.

Recent Activity

updated a model about 8 hours ago

grimjim/MagTie-v1-12B-GGUF

published a model about 9 hours ago

grimjim/MagTie-v1-12B-GGUF

updated a model 1 day ago

grimjim/MagTie-v1-12B

View all activity

Organizations

Posts 22

Post

1634

I recently have been looking at a paper titled "Why Warmup the Learning Rate? Underlying Mechanisms and Improvements", by Dayal Singh Kalra and Maissam Barkeshli, and was struck by "warmup" being analogous to simulated annealing.
https://arxiv.org/abs/2406.09405
Taking the physical analogy further, the "warmup" is a stochastic process to knock the system out of current local minima, allowing easier transition toward newer minima. It works because it reduces "fit" and therefore "friction".

View all Posts

Articles 1

Article

Exploring SLERP Abliteration

View all Articles

Collections 5

models 149

datasets 4

grimjim/PAlign-PAPI-personality_prompt.json-cleaned

Viewer • Updated Mar 11 • 300 • 28

grimjim/ontario_baby_names_1917-2022

Preview • Updated Mar 7 • 23

grimjim/empatheticdialogues

Updated Jan 14 • 32

grimjim/adversarial-10-alpaca

Viewer • Updated Aug 16, 2024 • 10 • 19 • 1

Jim Lai

AI & ML interests

Recent Activity

Organizations

Posts 22

Articles 1

Exploring SLERP Abliteration

Collections 5

grimjim/DeepSauerHuatuoSkywork-R1-o1-Llama-3.1-8B

grimjim/SauerHuatuoSkywork-o1-Llama-3.1-8B

grimjim/SauerHuatuoSkywork-o1-Llama-3.1-8B-GGUF

grimjim/HuatuoSkywork-o1-Llama-3.1-8B

grimjim/kuno-kunoichi-v1-DPO-v2-SLERP-7B

grimjim/kukulemon-7B

grimjim/kukulemon-spiked-9B

grimjim/kukulemon-32K-7B

models 149

grimjim/MagTie-v1-12B-GGUF

grimjim/MagTie-v1-12B

grimjim/Magnolia-v3b-12B-GGUF

grimjim/Magnolia-v3b-12B

grimjim/Daichi-Instructed-12B

grimjim/MagSoup-v1-12B

grimjim/gemma-3-12b-it

grimjim/gemma-3-12b-pt

grimjim/Magnolia-v10-12B

grimjim/Magnolia-v9-12B

datasets 4

grimjim/PAlign-PAPI-personality_prompt.json-cleaned

grimjim/ontario_baby_names_1917-2022

grimjim/empatheticdialogues

grimjim/adversarial-10-alpaca

Jim Lai

AI & ML interests

Recent Activity

Organizations

Posts 22

Articles 1

Exploring SLERP Abliteration

Collections 5

models 149 Sort: Recently updated

datasets 4 Sort: Recently updated

models 149

datasets 4