JetBrains
/

Mellum-4b-sft-python

 - code
 base_model:
 - JetBrains/Mellum-4b-base
+model-index:
+- name: Mellum-4b-sft-python
+  results:
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_python_v1.1
+      name: RepoBench 1.1 (Python)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2837
+      verified: false
+    - name: EM ≤ 8k
+      type: exact_match
+      value: 0.2987
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_python_v1.1
+      name: RepoBench 1.1 (Python, 2k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2924
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_python_v1.1
+      name: RepoBench 1.1 (Python, 4k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.3060
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_python_v1.1
+      name: RepoBench 1.1 (Python, 8k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2977
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_python_v1.1
+      name: RepoBench 1.1 (Python, 12k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2680
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_python_v1.1
+      name: RepoBench 1.1 (Python, 16k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2543
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: gonglinyuan/safim
+      name: SAFIM
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.4212
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: gonglinyuan/safim
+      name: SAFIM (Algorithmic)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.3316
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: gonglinyuan/safim
+      name: SAFIM (Control)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.3611
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: gonglinyuan/safim
+      name: SAFIM (API)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.5710
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: loubnabnl/humaneval_infilling
+      name: HumanEval Infilling (Single-Line)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.8045
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: loubnabnl/humaneval_infilling
+      name: HumanEval Infilling (Multi-Line)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.4819
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: loubnabnl/humaneval_infilling
+      name: HumanEval Infilling (Random Span)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.3768
+      verified: false
 ---
 # Model Description