lIlBrother
/

Llama-3.1-8B-Instruct-KoEn-FFT-Merge

Model card Files Files and versions Community

lIlBrother commited on Oct 22, 2024

Commit

7a0e23a

·

verified ·

1 Parent(s): c3e6945

Create README.md

Files changed (1) hide show

README.md +29 -0

README.md ADDED Viewed

	@@ -0,0 +1,29 @@

+---
+base_model:
+- unsloth/Meta-Llama-3.1-8B
+datasets:
+- lcw99/wikipedia-korean-20240501-1million-qna
+- MarkrAI/KOpen-HQ-Hermes-2.5-60K
+- garage-bAInd/Open-Platypus
+- rwkv-x-dev/openorca-gpt4
+- gbharti/finance-alpaca
+language:
+- ko
+- en
+license: llama3.1
+---
+- lcw99/wikipedia-korean-20240501-1million-qna
+- MarkrAI/KOpen-HQ-Hermes-2.5-60K
+- garage-bAInd/Open-Platypus
+- rwkv-x-dev/openorca-gpt4
+- gbharti/finance-alpaca
+- 내가 직접 만든 데이터
+를 적당히 샘플링하여 만들었음.
+문제는, lm-eval 점수는 Meta의 것보다 낮으나, 실제로 정성평가를 해보면 나쁘지 않은 모델이었음.
+Logickor는 ChatGPT api 금액을 다써서 실험 못해봄.
+해당 모델은 DPO 학습되지 않았음.