Upload folder using huggingface_hub

Files changed (6) hide show

.ipynb_checkpoints/Llama3.2-1B-INT8-lora-BF16-Evaluation_Results-checkpoint.json ADDED Viewed

+{
+    "eval_loss": 0.7597980586406545,
+    "perplexity": 2.1378444576870472,
+    "performance_metrics": {
+        "accuracy:": 1.0,
+        "precision:": 1.0,
+        "recall:": 1.0,
+        "f1:": 1.0,
+        "bleu:": 0.9716335135223347,
+        "rouge:": {
+            "rouge1": 0.9847093827042951,
+            "rouge2": 0.9846102568018172,
+            "rougeL": 0.9847093827042951
+        },
+        "semantic_similarity_avg:": 0.9987004399299622
+    },
+    "mauve": 0.8832777311669464,
+    "inference_performance": {
+        "min_latency_ms": 70.59454917907715,
+        "max_latency_ms": 2859.173536300659,
+        "lower_quartile_ms": 75.28102397918701,
+        "median_latency_ms": 76.46441459655762,
+        "upper_quartile_ms": 516.7384743690491,
+        "avg_latency_ms": 626.5141687023942,
+        "min_memory_mb": 1818372.0,
+        "max_memory_mb": 1819316.0,
+        "lower_quartile_mb": 1818658.5,
+        "median_memory_mb": 1818923.0,
+        "upper_quartile_mb": 1819046.0,
+        "avg_memory_mb": 1818866.592790387
+    }
+}

Llama3.2-1B-INT8-lora-BF16-Evaluation_Results.json ADDED Viewed

+{
+    "eval_loss:": 0.7597980586406545,
+    "perplexity:": 2.1378444576870472,
+    "performance_metrics:": {
+        "accuracy:": 1.0,
+        "precision:": 1.0,
+        "recall:": 1.0,
+        "f1:": 1.0,
+        "bleu:": 0.9716128952473347,
+        "rouge:": {
+            "rouge1": 0.9847181247843387,
+            "rouge2": 0.9846230727757008,
+            "rougeL": 0.9847181247843387
+        },
+        "semantic_similarity_avg:": 0.9988512396812439
+    },
+    "mauve:": 0.8832777311669464,
+    "inference_performance:": {
+        "min_latency_ms": 73.21643829345703,
+        "max_latency_ms": 3008.4731578826904,
+        "lower_quartile_ms": 77.86405086517334,
+        "median_latency_ms": 79.05101776123047,
+        "upper_quartile_ms": 568.7307715415955,
+        "avg_latency_ms": 646.2314533136874,
+        "min_memory_gb": 0.07419586181640625,
+        "max_memory_gb": 0.07562446594238281,
+        "lower_quartile_gb": 0.0746617317199707,
+        "median_memory_gb": 0.07486915588378906,
+        "upper_quartile_gb": 0.07507467269897461,
+        "avg_memory_gb": 0.07487648606141196,
+        "model_load_memory_gb": 4.578568935394287,
+        "avg_inference_memory_gb": 0.07487648606141196
+    }
+}

Llama3.2-1B-INT8-lora-BF16-Inference_Curve.png ADDED Viewed

Llama3.2-1B-INT8-lora-BF16-Latency_Histogram.png ADDED Viewed

Llama3.2-1B-INT8-lora-BF16-Memory_Histogram.png ADDED Viewed

Llama3.2-1B-INT8-lora-BF16-Memory_Usage_Curve.png ADDED Viewed