Introduction

Command r plus λͺ¨λΈμ„ μ΄μš©ν•˜μ—¬ 자체 κ΅¬μΆ•ν•œ RAG νŠΉν™” 데이터셋, CoT 데이터셋, 벀치마크 λ°μ΄ν„°μ…‹μœΌλ‘œ Qwen2.5 14B λͺ¨λΈμ„ Full fine-tuning ν•œ λͺ¨λΈμž…λ‹ˆλ‹€. ν•΄λ‹Ή λͺ¨λΈμ€ 일반적인 RAG μ„œλΉ„μŠ€μ˜ μž…λ ₯데이터에 λŒ€ν•΄μ„œ μ •ν™•ν•œ λ‹΅λ³€κ³Ό λ‹΅λ³€ 좜처λ₯Ό 생성할 수 있으며, Json ν˜•νƒœλ‘œ 닡변을 좜λ ₯ν•˜λŠ” νŠΉμ§•μ„ κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€. 좜λ ₯ 킀값은 μ•„λž˜μ™€ κ°™μŠ΅λ‹ˆλ‹€.

  1. "related_document"의 κ°’ : 질문과 κ΄€λ ¨ μžˆλŠ” λ¬Έμ„œ doc_id, 제λͺ© (key : λ¬Έμ„œ 번호, Value : λ¬Έμ„œ 제λͺ©)
  2. "source" : 질문과 κ΄€λ ¨μžˆλŠ” λ¬Έμ„œ doc_id와 닡변에 μƒμ„±ν•œ 인용ꡬ ꡬ절
  3. "answer"의 κ°’ : 좜처λ₯Ό ν‘œκΈ°ν•˜μ§€ μ•Šμ€ 3~6λ¬Έμž₯ μ„€λͺ…ν˜• λ‹΅λ³€
  4. "grounded_answer"의 κ°’ : answerκ³Ό λ™μΌν•˜λ˜ <co: doc_id>와 </co: doc_id> 기호둜 인용 좜처λ₯Ό λͺ…μ‹œν•œ λ‹΅λ³€

λ‹΅λ³€ 좜λ ₯ μ˜ˆμ‹œ

{
"related_document": {
    "D0000042284685": "가락λͺ° 전동 μ‚Όλ₯œμ°¨ ν™”μž¬μ˜ˆλ°© μΆ”μ§„ λŒ€μ±…",
    "4895": "μ°¨μ„ΈλŒ€ κ³ μ‹ λ’°μ„± 고좜λ ₯ μŠˆνΌμΆ•μ „κΈ°"
},
"source": {
    "D0000042284685": "γ€Œλ¬Όλ₯˜μš΄λ°˜μž₯λΉ„ μΆ©μ „μž₯치(리튬이온 배터리) ...",
    "4895": "μŠˆνΌμΆ•μ „κΈ°μ™€ λ¦¬νŠ¬μ΄μ°¨μ „μ§€μ˜ 비ꡐ ..."
},
"answer": "가락λͺ° 전동 μ‚Όλ₯œμ°¨μ˜ 리튬이온 배터리와 μŠˆνΌμΆ•μ „κΈ°λŠ” λ©”...",
"grounded_answer": "가락λͺ° 전동 μ‚Όλ₯œμ°¨μ˜ 리튬이온 배터리와 μŠˆνΌμΆ•μ „κΈ°λŠ” <co: 4895>λ©”μ»€λ‹ˆμ¦˜, μ†Œμž¬, 수λͺ…, 보호회둜, κ·Ήμ„±, κ³Όμ „μ••, μž”μ‘΄μš©λŸ‰μΈ‘μ •, νŠΉμ§•</co: 4895> λ“±μ—μ„œ 차이가 μžˆμŠ΅λ‹ˆλ‹€. 리튬이온 λ°°ν„°λ¦¬λŠ” <co: 4895>리튬이온 이동 λ©”μ»€λ‹ˆμ¦˜</co: 4895>을 κ°€μ§€κ³  있으며,... "
}

RAG Prompt

RAG_PROMPT = """<|im_start|>system\n\n 당신은 λŒ€ν™”ν˜• AIλ‘œμ„œ, μ‚¬μš©μžμ˜ μ§ˆλ¬Έμ— μ‹ λ’°ν•  수 μžˆλŠ” 정보λ₯Ό μ œκ³΅ν•˜λŠ” 것이 μ£Όμš” μ—­ν• μž…λ‹ˆλ‹€. μ‚¬μš©μžμ˜ μš”κ΅¬λ₯Ό μ •ν™•νžˆ μ΄ν•΄ν•˜κ³ , κ΄€λ ¨ λ¬Έμ„œλ₯Ό λΆ„μ„ν•˜μ—¬ 졜적의 닡변을 생성해야 ν•©λ‹ˆλ‹€. \n당신은 λ‹€μŒκ³Ό 같은 원칙을 μ€€μˆ˜ν•΄μ•Ό ν•©λ‹ˆλ‹€:\n1. 항상 μ‚¬μš©μžμ˜ μš”μ²­μ„ μ΅œμš°μ„ μœΌλ‘œ κ³ λ €ν•˜λ©°, λͺ…ν™•ν•˜κ³  μ΄ν•΄ν•˜κΈ° μ‰¬μš΄ 닡변을 μ œκ³΅ν•©λ‹ˆλ‹€.\n2. 제곡된 λ¬Έμ„œλ₯Ό μ΅œλŒ€ν•œ ν™œμš©ν•˜μ—¬ 응닡을 κ΅¬μ„±ν•˜λ˜, 좔가적인 뢄석과 논리λ₯Ό 톡해 μ‘λ‹΅μ˜ μ§ˆμ„ λ†’μž…λ‹ˆλ‹€.\n3. 응닡을 생성할 λ•ŒλŠ” λ°˜λ“œμ‹œ μ£Όμ–΄μ§„ 지침을 λ”°λ₯΄κ³ , λͺ…ν™•ν•œ 좜처λ₯Ό μ œκ³΅ν•΄μ•Ό ν•©λ‹ˆλ‹€.\n4. μ‚¬μš©μžμ˜ 질문이 λͺ¨ν˜Έν•  경우, λͺ…확성을 ν™•λ³΄ν•˜κΈ° μœ„ν•΄ μ§ˆλ¬Έμ„ μž¬κ΅¬μ„±ν•˜λŠ” λ°©μ•ˆμ„ κ³ λ €ν•  수 μžˆμŠ΅λ‹ˆλ‹€.\n\n# μ‚¬μš©μž μ•ˆλ‚΄λ¬Έ\n## μž‘μ—… 및 λ§₯락\n당신은 μ‚¬μš©μž μ§ˆλ¬Έμ— λŒ€ν•΄ κ΄€λ ¨ λ¬Έμ„œλ₯Ό λΆ„μ„ν•˜κ³ , μ‹ λ’°ν•  수 μžˆλŠ” 정보λ₯Ό λ°”νƒ•μœΌλ‘œ 응닡을 생성해야 ν•©λ‹ˆλ‹€. λ‹¨μˆœν•œ 정보 전달을 λ„˜μ–΄, λ¬Έλ§₯을 κ³ λ €ν•˜μ—¬ κ°€μž₯ μ μ ˆν•œ ν˜•νƒœλ‘œ 정보λ₯Ό μ œκ³΅ν•˜λŠ” 것이 μ€‘μš”ν•©λ‹ˆλ‹€.\n\n## μŠ€νƒ€μΌ κ°€μ΄λ“œ\njson ν˜•μ‹μœΌλ‘œ 닡변을 좜λ ₯ν•˜μ„Έμš”.[
    {{
        "related_document" : {{"λ¬Έμ„œ μ •λ³΄μ—μ„œ 찾은 doc_id"}}
        "source" : {{"λ¬Έμ„œ μ •λ³΄μ—μ„œ 찾은 doc_id" : "ν•΄λ‹Ή λ¬Έμ„œμ—μ„œ 찾을 수 μžˆλŠ” 인용ꡬ ꡬ절, 원문 κ·ΈλŒ€λ‘œ ν‘œκΈ°", 
                     "λ¬Έμ„œ μ •λ³΄μ—μ„œ 찾은 doc_id" : "ν•΄λ‹Ή λ¬Έμ„œμ—μ„œ 찾을 수 μžˆλŠ” 인용ꡬ ꡬ절, 원문 κ·ΈλŒ€λ‘œ ν‘œκΈ°"}},
        "answer" : "좜처λ₯Ό ν‘œκΈ°ν•˜μ§€ μ•Šμ€ 3~6λ¬Έμž₯ μ„€λͺ…ν˜• λ‹΅λ³€",
        "grounded_answer" : "answerκ³Ό λ™μΌν•˜λ˜ <co: doc_id>와 </co: doc_id> 기호둜 인용 좜처λ₯Ό λͺ…μ‹œν•œ λ‹΅λ³€"
    }}
]\n
<|im_end|>\n<|im_start|>user\n {instruction}  <|im_end|>\n<|im_start|>assistant\n"""

Quickstart

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Surromind/RAG-Specialized-LLM"
model = AutoModelForCausalLM.from_pretrained(
    model_name, torch_dtype="auto", device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = """ 질문 : NAOG 외에 λͺ½κ³¨μ˜ μ–΄λ–€ μ‚¬λžŒλ“€μ΄ ν–‰μ •μžμΉ˜λΆ€ μ§€λ°©ν–‰μ •μ—°μˆ˜μ›μ˜ ꡐ윑 ν”„λ‘œκ·Έλž¨μ— μ°Έκ°€ν•΄μ™”μ§€?\n\n doc_id : 44365 / title : ν•œκ΅­ μ§€λ°©μΈμž¬κ°œλ°œμ „λž΅ λ² νŠΈλ‚¨μ— μ „μˆ˜λœλ‹€. / content : ν•œκ΅­ μ§€λ°©μΈμž¬κ°œλ°œμ „λž΅ λ² νŠΈλ‚¨μ— μ „μˆ˜λœλ‹€.\nβ–‘ λ² νŠΈλ‚¨ λž‘μ„ μ„± μ§€λ°©μ •λΆ€ 곡무원듀이 곡무원 μΈμž¬μ±„μš© 및 ꡐ윑 ν›ˆλ ¨μ œλ„ μ‹œμŠ€ν…œ λ“± ν•œκ΅­μ˜ μΈμ μžμ›κ°œλ°œμ „λž΅μ„ 배우러 μš°λ¦¬λ‚˜λΌλ₯Ό μ°Ύμ•˜λ‹€. \nβ—‹ ν–‰μ •μžμΉ˜λΆ€ μ§€λ°©ν–‰μ •μ—°μˆ˜μ›(원μž₯ ***, μ΄ν•˜ μ—°μˆ˜μ›)은 ν•œκ΅­κ΅­μ œ ν˜‘λ ₯단(KOICA)κ³Ό κ³΅λ™μœΌλ‘œ 11μ›” 26일뢀터 12μ›” 9μΌκΉŒμ§€ 2μ£Όκ°„ λ² νŠΈλ‚¨ λž‘μ„ μ„± μ§€λ°©μ •λΆ€ 곡무원 15λͺ…을 λŒ€μƒμœΌλ‘œγ€Žλ² νŠΈλ‚¨ λž‘μ„ μ„± μ§€λ°©μ •λΆ€ 곡무원 μ—­λŸ‰κ°•ν™”κ³Όμ •(Capacity Building for Vietnamese Local Government Officials from Lan Son Province』을 μš΄μ˜ν•œλ‹€.\nβ–‘ 이번 과정은 μ—°μˆ˜μƒ λŒ€λΆ€λΆ„μ΄ λ² νŠΈλ‚¨ λž‘μ„ μ„± μ†Œμ†κ³΅λ¬΄μ›μΈ 만큼 ν•΄λ‹Ή μ§€λ°©μ •λΆ€κ°€ μš”μ²­ν•œ μ§€λ°©ν–‰μ •, 곡무원 μ±„μš©Β·κ΅μœ‘, μ§€μ—­κ²½μ œ ν™œμ„±ν™” κ°•μ˜ 및 ν˜„μž₯견학 λ“±μ˜ λ§žμΆ€ν˜• μ—°μˆ˜κ³Όμ •μœΌλ‘œ μ„€κ³„λ˜μ—ˆλ‹€. \nβ—‹ 특히, λ² νŠΈλ‚¨ μ§€λ°©μ •λΆ€ κ³΅λ¬΄μ›λ“€μ˜ 리더십과 μ—­λŸ‰μ„ κ°•ν™”ν•˜κΈ° μœ„ν•΄ 곡무원 μΈμž¬μ±„μš© 및 κ΅μœ‘ν›ˆλ ¨μ œλ„ μ‹œμŠ€ν…œμ— λŒ€ν•œ 토둠식 μ„Έλ―Έλ‚˜ λ°©μ‹μœΌλ‘œ Action Plan을 μˆ˜λ¦½ν•˜λ„λ‘ ν•˜μ—¬ μ—°μˆ˜μƒμ΄ λž‘μ„ μ„±μ˜ μΈμ μžμ›κ°œλ°œ μ •μ±…μˆ˜λ¦½μ— μ μš©ν•  수 μžˆλ„λ‘ 지원할 μ˜ˆμ •μ΄λ‹€.\nβ—‹ μ•„μšΈλŸ¬, μ—°μˆ˜λ‹¨μ€ λ†μ—…μ†Œλ“μ¦λŒ€μ™€ μ§€μ—­κ²½μ œ ν™œμ„±ν™” μ„±κ³΅μ‚¬λ‘€λ‘œ 평가 λ°›κ³  μžˆλŠ” μ™„μ£Όκ΅° 거점농민가곡센터, μ§€μ—­κ²½μ œμˆœν™˜μ„Όν„° 등을 λ°©λ¬Έν•˜μ—¬ 지역농민이 μƒμ‚°ν•œ 농산물이 2μ°¨, 3μ°¨ μ‹ν’ˆ 가곡 과정을 거쳐 μ•ˆμ •μ μœΌλ‘œ 판맀될 수 μžˆλ„λ‘ μ§€μ›ν•˜λŠ” 농산물 가곡 μ‹œμŠ€ν…œ ν˜„μž₯을 μ‚΄νŽ΄ λ³Ό μ˜ˆμ •μ΄λ‹€. \nβ—‹ 이외에도 λ² νŠΈλ‚¨ λž‘μ„ μ„±μ—μ„œ 관심이 λ§Žμ€ μΈμ²œκ²½μ œμžμœ κ΅¬μ—­μ²­μ„ κ²¬ν•™ν•˜μ—¬ ν•œκ΅­μ˜ κ²½μ œλ°œμ „μƒ λ“± ν˜„μž₯을 λ‘˜λŸ¬λ³΄λ©΄μ„œ λž‘μ„ μ„± μ§€μ—­ κ²½μ œμ— μ ‘λͺ©ν•  수 μžˆλŠ” μ²΄ν—˜μ˜ κΈ°νšŒλ„ κ°€μ§ˆ μ˜ˆμ •μ΄λ‹€. \nβ–‘ ν•œνŽΈ, μ—°μˆ˜μ›μ€ 2006λ…„λΆ€ν„° λ² νŠΈλ‚¨ μ§€λ°© 곡무원듀을 λŒ€μƒμœΌλ‘œ μ—°μˆ˜κ³Όμ •μ„ μš΄μ˜ν•œ 이후 5개 λ² νŠΈλ‚¨ κ³Όμ •κ³Ό 기타 λ‹€κ΅­ 과정을 ν†΅ν•˜μ—¬ 총 130λͺ…μ˜ μ—°μˆ˜μƒμ„ λ™μ°½μƒμœΌλ‘œ λ°°μΆœν–ˆλ‹€.doc_id : 45112 / title : β€œν•œκ΅­ 곡기업 ν˜μ‹ μ‚¬λ‘€ 배우러 μ™”μ–΄μš”!” / content : λͺ½κ³¨ NAOG κ΅μˆ˜λ‹¨ 및 κ³ μœ„κ³΅λ¬΄μ› λ°©ν•œ β€œν•œκ΅­ 곡기업 ν˜μ‹ μ‚¬λ‘€ 배우러 μ™”μ–΄μš”!” - μ§€λ°©ν–‰μ •μ—°μˆ˜μ›, 13λ…„μ§Έ λͺ½κ³¨ λ§žμΆ€ν˜• κ΅μœ‘μ‹€μ‹œ-\nβ–‘ ν–‰μ •μžμΉ˜λΆ€ μ§€λ°©ν–‰μ •μ—°μˆ˜μ›(원μž₯ μ΅œλ‘μ˜, μ΄ν•˜ μ—°μˆ˜μ›)은 3μ›” 1일뢀터 3μ›” 8μΌκΉŒμ§€ γ€Žλͺ½κ³¨ NAOG* μ—­λŸ‰κ°•ν™”κ³Όμ •γ€μ„ μš΄μ˜ν•œλ‹€. \nβ—‹ 이번 κ³Όμ •μ—λŠ” ꡐ수, κ³ μœ„κ³΅λ¬΄μ›, μ—°μˆ˜κ΄€κ³„κ΄€ 14λͺ…이 μ°Έκ°€ν•œλ‹€. \n* NAOG (κ΅­λ¦½κ±°λ²„λ„ŒμŠ€ 아카데미, National Academy of Governance) : 곡무원은 λ¬Όλ‘  μ •μΉ˜μΈΒ·λ―Όκ°„μΈ λ“± λͺ½κ³¨μ˜ μ˜€ν”Όλ‹ˆμ–Έ 리더듀을 κ΅μœ‘ν•˜λŠ” λͺ½κ³¨ μ΅œλŒ€μ˜ κ΅μœ‘κΈ°κ΄€μœΌλ‘œ μ„β€€λ°•μ‚¬ν•™μœ„ μˆ˜μ—¬\nβ–‘ μ—°μˆ˜μ›μ€ λͺ½κ³¨ NAOG와 2002λ…„ ꡐλ₯˜ν˜‘λ ₯ MOUλ₯Ό μ²΄κ²°ν•œ 이후, 13개 κ΅μœ‘κ³Όμ •(ν–‰μ •κ°œν˜, κ²½μ œλ°œμ „ μ „λž΅, ν–‰μ •μ˜ 투λͺ…μ„± 제고 λ°©μ•ˆ λ“±)을 μš΄μ˜ν•΄ 158λͺ…μ˜ NAOG κ΅μˆ˜μ™€ κ³ μœ„ 곡무원을 λ™μ°½μƒμœΌλ‘œ λ°°μΆœν–ˆκ³ , \nβ—‹ κ·Έ 이외에도 λͺ½κ³¨μ˜ 도지사, ꡰ수 λ“± 지방곡무원 1,310λͺ…을 λŒ€μƒμœΌλ‘œ ν•œκ΅­ μ§€λ°©ν–‰μ •μ˜ μš°μˆ˜μ‚¬λ‘€λ₯Ό λ²€μΉ˜λ§ˆν‚Ήν•  수 μžˆλŠ” λͺ½κ³¨κ΅°μˆ˜ κ³Όμ • λ“± λ‹€μ–‘ν•œ κ΅μœ‘ν”„λ‘œκ·Έλž¨μ„ μš΄μ˜ν•΄ 였고 μžˆλ‹€.
"""
messages = [
    {
        "role": "system",
        "content": """당신은 λŒ€ν™”ν˜• AIλ‘œμ„œ, μ‚¬μš©μžμ˜ μ§ˆλ¬Έμ— μ‹ λ’°ν•  수 μžˆλŠ” 정보λ₯Ό μ œκ³΅ν•˜λŠ” 것이 μ£Όμš” μ—­ν• μž…λ‹ˆλ‹€. μ‚¬μš©μžμ˜ μš”κ΅¬λ₯Ό μ •ν™•νžˆ μ΄ν•΄ν•˜κ³ , κ΄€λ ¨ λ¬Έμ„œλ₯Ό λΆ„μ„ν•˜μ—¬ 졜적의 닡변을 생성해야 ν•©λ‹ˆλ‹€. \n당신은 λ‹€μŒκ³Ό 같은 원칙을 μ€€μˆ˜ν•΄μ•Ό ν•©λ‹ˆλ‹€:\n1. 항상 μ‚¬μš©μžμ˜ μš”μ²­μ„ μ΅œμš°μ„ μœΌλ‘œ κ³ λ €ν•˜λ©°, λͺ…ν™•ν•˜κ³  μ΄ν•΄ν•˜κΈ° μ‰¬μš΄ 닡변을 μ œκ³΅ν•©λ‹ˆλ‹€.\n2. 제곡된 λ¬Έμ„œλ₯Ό μ΅œλŒ€ν•œ ν™œμš©ν•˜μ—¬ 응닡을 κ΅¬μ„±ν•˜λ˜, 좔가적인 뢄석과 논리λ₯Ό 톡해 μ‘λ‹΅μ˜ μ§ˆμ„ λ†’μž…λ‹ˆλ‹€.\n3. 응닡을 생성할 λ•ŒλŠ” λ°˜λ“œμ‹œ μ£Όμ–΄μ§„ 지침을 λ”°λ₯΄κ³ , λͺ…ν™•ν•œ 좜처λ₯Ό μ œκ³΅ν•΄μ•Ό ν•©λ‹ˆλ‹€.\n4. μ‚¬μš©μžμ˜ 질문이 λͺ¨ν˜Έν•  경우, λͺ…확성을 ν™•λ³΄ν•˜κΈ° μœ„ν•΄ μ§ˆλ¬Έμ„ μž¬κ΅¬μ„±ν•˜λŠ” λ°©μ•ˆμ„ κ³ λ €ν•  수 μžˆμŠ΅λ‹ˆλ‹€.\n\n# μ‚¬μš©μž μ•ˆλ‚΄λ¬Έ\n## μž‘μ—… 및 λ§₯락\n당신은 μ‚¬μš©μž μ§ˆλ¬Έμ— λŒ€ν•΄ κ΄€λ ¨ λ¬Έμ„œλ₯Ό λΆ„μ„ν•˜κ³ , μ‹ λ’°ν•  수 μžˆλŠ” 정보λ₯Ό λ°”νƒ•μœΌλ‘œ 응닡을 생성해야 ν•©λ‹ˆλ‹€. λ‹¨μˆœν•œ 정보 전달을 λ„˜μ–΄, λ¬Έλ§₯을 κ³ λ €ν•˜μ—¬ κ°€μž₯ μ μ ˆν•œ ν˜•νƒœλ‘œ 정보λ₯Ό μ œκ³΅ν•˜λŠ” 것이 μ€‘μš”ν•©λ‹ˆλ‹€.\n\n## μŠ€νƒ€μΌ κ°€μ΄λ“œ\njson ν˜•μ‹μœΌλ‘œ 닡변을 좜λ ₯ν•˜μ„Έμš”.[{"related_document" : {"λ¬Έμ„œ μ •λ³΄μ—μ„œ 찾은 doc_id"}, "source" : {"λ¬Έμ„œ μ •λ³΄μ—μ„œ 찾은 doc_id" : "ν•΄λ‹Ή λ¬Έμ„œμ—μ„œ 찾을 수 μžˆλŠ” 인용ꡬ ꡬ절, 원문 κ·ΈλŒ€λ‘œ ν‘œκΈ°", "λ¬Έμ„œ μ •λ³΄μ—μ„œ 찾은 doc_id" : "ν•΄λ‹Ή λ¬Έμ„œμ—μ„œ 찾을 수 μžˆλŠ” 인용ꡬ ꡬ절, 원문 κ·ΈλŒ€λ‘œ ν‘œκΈ°"},"answer" : "좜처λ₯Ό ν‘œκΈ°ν•˜μ§€ μ•Šμ€ 3~6λ¬Έμž₯ μ„€λͺ…ν˜• λ‹΅λ³€","grounded_answer" : "answerκ³Ό λ™μΌν•˜λ˜ <co: doc_id>와 </co: doc_id> 기호둜 인용 좜처λ₯Ό λͺ…μ‹œν•œ λ‹΅λ³€"}]\n""",
    },
    {"role": "user", "content": prompt},
]
text = tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(**model_inputs, max_new_tokens=512)
generated_ids = [
    output_ids[len(input_ids) :]
    for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

ν•™μŠ΅ ν™˜κ²½ 및 νŒŒλΌλ―Έν„°

  • νŠœλ‹ ν™˜κ²½
    • H100(80GB) * 8
  • νŒŒλΌλ―Έν„°
    • tokenizer_model_mex_length 4500
    • use_flash_attn True
    • num_train_epochs 3.0
    • weight_decay 0.001
    • lr_scheduler_type "linear"
    • per_device_train_batch_size 1
    • gradient_accumulation_steps 64
    • learning_rate 5e-06
    • bf16 True
    • deepspeed ds_stage2.json

μ‚¬μš© 데이터셋

  • AIhub 16 ν–‰μ • λ¬Έμ„œ λŒ€μƒ 기계독해 데이터
  • AIhub 17 λ‰΄μŠ€ 기사 기계독해 데이터
  • AIhub 21 λ„μ„œμžλ£Œ 기계독해
  • AIhub 149 ν‘œ 정보 μ§ˆμ˜μ‘λ‹΅ 데이터
  • AIhub 150 μˆ«μžμ—°μ‚° 기계독해 데이터
  • AIhub 151 금육, 법λ₯  λ¬Έμ„œ 기계독해 데이터
  • kyujinpy/KoCoT_2000
  • MarkrAI/KoCommercial-Dataset
  • CarrotAI/ko-instruction-dataset
  • heegyu/CoT-collection-ko

Contact us

  • μ¨λ‘œλ§ˆμΈλ“œ
  • μ„œμšΈμ‹œ 관악ꡬ λ‚¨λΆ€μˆœν™˜λ‘œ 1802, 2μΈ΅
  • 02-872-5127
  • [email protected]
Downloads last month
21
Safetensors
Model size
14.8B params
Tensor type
BF16
Β·
Inference Providers NEW
This model isn't deployed by any Inference Provider. πŸ™‹ Ask for provider support

Model tree for Surromind/RAG-Specialized-LLM

Base model

Qwen/Qwen2.5-14B
Finetuned
(69)
this model
Quantizations
1 model

Datasets used to train Surromind/RAG-Specialized-LLM