- LGAI-EXAONE/EXAONE-Deep-7.8B ์ werty1248/s1k-1.1-Ko-ReGenerated-Formatted๋ฅผ ํ์ต
- 4x H100, about 1 hour
- gradient_accumulation_steps = 2 (total batch size = 8)
- max_length = 16,384 (์๋๋ 32,768)
HRM8K ํ๊ตญ์ด ์ํ ๋ฅ๋ ฅ ๋ฒค์น๋งํฌ ์ค ์ผ๋ถ
- thinking์ ์ต๋ 8192ํ ํฐ๋ง ํ์ฉ
- ์ต๋ ํ ํฐ์ ์๋ชจํด๋ </thought> ๋ </think>๋ฅผ ์์ฑํ์ง ๋ชปํ์ ๊ฒฝ์ฐ, ๊ฐ์ ๋ก ํด๋น ํ ํฐ์ ์์ฑํ ํ ๋ต๋ณ ์์ฑ ์์ฒญ
- temperature = 0.6 (EXAONE), 0.7(Qwen2.5)
- top_p = 0.95
Model | GSM8K | KSM | MATH | Reasoning Language |
---|---|---|---|---|
LGAI-EXAONE/EXAONE-Deep-7.8B | 85.48 | 31.72 | 84.23 | English |
werty1248/EXAONE-Deep-7.8B-Ko-Thought | 78.85 | 28.01 | 79.45 | Korean |
werty1248/EXAONE-3.5-7.8B-Stratos-Ko | 83.02 | 15.97 | 67.49 | English |
werty1248/Qwen2.5-7B-s1.1-Ko-Native | 76.27 | 15.48 | 66.45 | Korean(Chinese/English) |
LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct | 81.58 | 14.71 | 63.50 | (CoT in Korean) |
ํน์ด์ฌํญ
- EXAONE-Deep-7.8B์ GSM8K์์ ์ฑ๋ฅ ๊ฐ์ ์ด ์์์ผ๋, ํ๊ตญ์ด ํ๋ ๊ณผ์ ์์ ์ฑ๋ฅ์ด ์๋ณธ ๋ชจ๋ธ๋ณด๋ค ํ๋ฝ.
- LGAI-EXAONE/EXAONE-Deep-7.8B์ ์ฃผ์ด์ง 8192ํ ํฐ์ด ๋ถ์กฑํด์ ๋ต๋ณ์ ๋ด์ง ๋ชปํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์์
- KSM์ ๊ฒฝ์ฐ, EXAONE-Deep-7.8B์ด ์ผ๋จ ๋ต๋ณ์ ์ ์ถํ๋ ๋ฐ ์ฑ๊ณตํ ์ง๋ฌธ ์ค ์ ๋ต๋ฅ ์ 75.61% (werty1248/EXAONE-Deep-7.8B-Ko-Thought๋ 52.36%)
- ๊ตฌ์ฒด์ ์ธ ๊ธฐ๋ก์ ํ์ง ์์์ง๋ง, werty1248/EXAONE-3.5-7.8B-s1.1-Ko-Native์ ์ ์๋ LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct์ ๊ฑฐ์ ๋์ผํ์
- ๊ธฐ๋ณธ EXAONE ๋ชจ๋ธ์ ์ถ๋ก ํ์ต์์ warm start๊ฐ ์๋๋ ๊ฒ์ด ์๋๊น?
- ๋ฐ๋๋ก EXAONE-Deep์ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ตญ์ด๋ก ์ฎ๊ธฐ๋ ๊ณผ์ ์ ํจ์ฌ ์ ํ์ตํจ
- ํ๊ตญ์ด ํ์ต ๊ณผ์ ์์ "ํ ๋ฒ ์ค์ํ๋ฉด ๋ญ๊ฐ ์๋ชป๋์๋์ง ๋ชจ๋ฅธ ์ฑ ๊ฐ์ ์ค๋ฅ๋ฅผ ๊ณ์ ๋ฐ๋ณต ๊ฒ์ฆํ๋ ค๋ ํ์"์ด ๋ค์ ๋ฐ์ํจ.
- ์คํจ ์์
์ง๋ฌธ: Carla๋ 200GB ํ์ผ์ ๋ค์ด๋ก๋ ์ค์
๋๋ค. ๋ณดํต 1๋ถ์ 2GB๋ฅผ ๋ค์ด๋ก๋ํ ์ ์์ง๋ง, ๋ค์ด๋ก๋์ 40%๊ฐ ์งํ๋์ ๋ Windows๊ฐ \
์
๋ฐ์ดํธ ์ค์น๋ฅผ ์ํด ์ฌ์์ํฉ๋๋ค. ์ด ๊ณผ์ ์ 20๋ถ์ด ๊ฑธ๋ฆฝ๋๋ค. ๊ทธ๋ฌ๊ณ ๋์ Carla๋ ๋ค์ด๋ก๋๋ฅผ ์ฒ์๋ถํฐ ๋ค์ ์์ํด์ผ ํฉ๋๋ค. ํ์ผ์ \
๋ค์ด๋ก๋ํ๋ ๋ฐ ์ด ์ผ๋ง๋ ๊ฑธ๋ฆฌ๋์?
๋ต๋ณ: <thought>
...(์๋ต)
๊ทธ๋ฐ๋ฐ ๋ค๋ฅธ ๊ฐ๋ฅ์ฑ์ ์์๊น? ์๋ฅผ ๋ค์ด, ์ฌ์์ ํ์ ๋ค์ด๋ก๋๋ฅผ ์์ํ ๋, ์ด๋ฏธ ๋ค์ด๋ก๋๊ฐ ์งํ๋๊ณ ์๋ ์ํ์์ ์ฌ์์์ด ๋๋ฉด, \
๊ทธ ๋ถ๋ถ์ ๋ค์ ๋ค์ด๋ก๋ํด์ผ ํ๋ ๊ฒฝ์ฐ๊ฐ ์์ ์ ์์ง ์์๊น? ๊ทธ๋ฐ๋ฐ ๋ฌธ์ ์์๋ "๋ค์ด๋ก๋๋ฅผ ์ฒ์๋ถํฐ ๋ค์ ์์ํด์ผ ํ๋ค"๊ณ ํ์ผ๋๊น, \
์ฌ์์ ํ์๋ ์ฒ์๋ถํฐ ๋ค์ ๋ค์ด๋ก๋๋ฅผ ์์ํ๋ ๊ฒ ๊ฐ์. ์ฆ, ์ฌ์์ ํ์๋ ๋จ์ ๋ฐ์ดํฐ๋ฅผ ์ฒ์๋ถํฐ ๋ค์ด๋ก๋ํ๋ ๊ฒ ์๋๋ผ, ์ด๋ฏธ \
๋ค์ด๋ก๋ํ 40%๋ฅผ ๋ค์ ๋ค์ด๋ก๋ํ๋ ๊ฒ ์๋๋ผ, ๊ทธ๋ฅ ๋ค์ ์์ํด์ ๋จ์ 60%๋ฅผ ๋ค์ด๋ก๋ํ๋ ๊ฑฐ์ผ. ์๋๋ฉด, ์ฌ์์ ํ์ ๋ค์ ๋ค์ด๋ก๋๋ฅผ \
์์ํ ๋, ์ด๋ฏธ ๋ค์ด๋ก๋ํ 40%๋ฅผ ๋ค์ ๋ค์ด๋ก๋ํด์ผ ํ๋์ง?
์ด ๋ถ๋ถ์ด ํท๊ฐ๋ฆฌ๋ค. ๋ฌธ์ ๋ฅผ ๋ค์ ์ฝ์ด๋ณด์. "๋ค์ด๋ก๋์ 40%๊ฐ ์งํ๋์ ๋ Windows๊ฐ ์
๋ฐ์ดํธ ์ค์น๋ฅผ ์ํด ์ฌ์์ํฉ๋๋ค. ์ด ๊ณผ์ ์ \
20๋ถ์ด ๊ฑธ๋ฆฝ๋๋ค. ๊ทธ๋ฌ๊ณ ๋์ Carla๋ ๋ค์ด๋ก๋๋ฅผ ์ฒ์๋ถํฐ ๋ค์ ์์ํด์ผ ํฉ๋๋ค."
์ฌ๊ธฐ์ "์ฒ์๋ถํฐ ๋ค์ ์์ํด์ผ ํ๋ค"๋ ๊ฒ์, ์ฌ์์ ํ์ ๋ค์ด๋ก๋๋ฅผ ์ฒ์๋ถํฐ ๋ค์ ์์ํ๋ ๊ฒ์ด ์๋๋ผ, ์ฌ์์ ๊ณผ์ ์ด ๋๋๊ณ ๋์ \
๋ค์ด๋ก๋๋ฅผ ๋ค์ ์์ํ๋๋ฐ, ์ด๋ ์ด๋ฏธ ๋ค์ด๋ก๋ํ 40%๋ฅผ ๋ค์ ๋ค์ด๋ก๋ํด์ผ ํ๋ ๊ฑด๊ฐ? ์๋๋ฉด, ์ฌ์์ ํ์๋ ๋จ์ 60%๋ฅผ ๋ค์ด๋ก๋ํ๋ \
๊ฑด๊ฐ?
๋ฌธ์ ์ ๋งฅ๋ฝ์, ์ฌ์์์ ์ํด ์์คํ
์ด ์ฌ์์๋๋ฉด ๋ค์ด๋ก๋๊ฐ ์ค๋จ๋๊ณ , ์ฌ์์์ด ์๋ฃ๋ ํ์ ๋ค์ ๋ค์ด๋ก๋๋ฅผ ์์ํ๋๋ฐ, ์ด๋๋ ์ฒ์๋ถํฐ \
๋ค์ ์์ํ๋ ๊ฒ์ด ์๋๋ผ, ์ด๋ฏธ ๋ค์ด๋ก๋ํ ๋ถ๋ถ์ ์ ์งํ ์ฑ๋ก ๋จ์ ๋ถ๋ถ์ ๋ค์ด๋ก๋ํด์ผ ํ ๊ฒ ๊ฐ์. ๊ทธ๋ฐ๋ฐ ๋ฌธ์ ์์๋ "์ฒ์๋ถํฐ ๋ค์ \
์์ํด์ผ ํ๋ค"๊ณ ํ์ผ๋๊น, ์ฌ์์ ํ์๋ ์ฒ์๋ถํฐ ๋ค์ ๋ค์ด๋ก๋๋ฅผ ์์ํด์, ์ด๋ฏธ ๋ค์ด๋ก๋ํ 40%๋ฅผ ๋ค์ ๋ค์ด๋ก๋ํด์ผ ํ๋ ์ํฉ์ด ๋ ์ \
์๋?
๋ง์ฝ ๊ทธ๋ ๋ค๋ฉด, ์ฌ์์ ํ์ ๋ค์ ๋ค์ด๋ก๋๋ฅผ ์์ํ ๋, ์ด๋ฏธ 40%๊ฐ ๋ค์ด๋ก๋๋ ์ํ์์ ์์ํ๋ ๊ฒ ์๋๋ผ, ์ฒ์๋ถํฐ ๋ค์ ๋ค์ด๋ก๋๋ฅผ \
์์ํด์ 40%๋ฅผ ๋ค์ ๋ค์ด๋ก๋ํด์ผ ํ๋ค๋ฉด, ์๊ฐ์ด ๋ ๊ฑธ๋ฆด ์ ์๊ฒ ์ง. ํ์ง๋ง ๋ฌธ์ ์์ "์ฒ์๋ถํฐ ๋ค์ ์์ํด์ผ ํ๋ค"๋ ํํ์ ์๋ง๋ ์ฌ์์ \
๊ณผ์ ์ด ๋๋๊ณ ๋์ ๋ค์ด๋ก๋๋ฅผ ๋ค์ ์์ํ๋๋ฐ, ์ด๋๋ ์ด๋ฏธ ๋ค์ด๋ก๋ํ ๋ฐ์ดํฐ๋ฅผ ๋ค์ ๋ค์ด๋ก๋ํ๋ ๊ฒ์ด ์๋๋ผ, ๋จ์ ๋ฐ์ดํฐ๋ฅผ ๋ค์ด๋ก๋ํ๋ \
๊ฒ์ ์๋ฏธํ ์๋ ์์ด.
(ํ๋ต)...
- ์์ด ๋ชจ๋ธ์์๋ ํ๋ฆฌ๋๋ผ๋ ํ์ด๊ณผ์ ์ด ํ๋ ค์ ํ๋ฆฐ ๋ต์ด ๋์ฌ ๋ฟ, ์ด ์ ๋๋ก ์ด์ํ ๋ ผ๋ฆฌ๋ฅผ ๋ฐ๋ณตํ์ง๋ ์์
Future work
- ์๋ EXAONE-Deep์ด ๊ฐ์ง๊ณ ์์๋, ๊ฐ๋จํ ์ง๋ฌธ์ ๋ํด์๋ ์๊ฐํ์ง ์๋ ๋ฅ๋ ฅ์ ์ ์ง์ํค๊ธฐ
- Merge, GRPO ๋ฑ์ Post Training์ผ๋ก ์ถ๋ก ์ ํ๋ ๊ฐ์
- ์ถ๋ก ๊ธธ์ด ์ต์ ํ
- Downloads last month
- 13
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
๐
Ask for provider support