MambaInLlama-dpo - a JunxiongWang Collection

JunxiongWang 's Collections

M1

MambaInLlama_MATH_Reasoning

MambaInLlama-dpo

MambaInLlama-distill

Mamba2InLlama3.2-3B

Mamba-In-Zephyr

Mamba-In-Llama3

Mamba2-In-Llama3

MambaInLlama-dpo

updated Nov 17, 2024

Directly distill from Llama, the finetune in DPO