Spaces:

cheberle
/

deepseek-llama-milch

Sleeping

App Files Files Community

cheberle commited on Jan 27

Commit

3daea5f

1 Parent(s): 9df76b8

f

Browse files

Files changed (1) hide show

app.py +32 -17

app.py CHANGED Viewed

@@ -29,52 +29,67 @@ model = PeftModel.from_pretrained(
 )
 model.eval()
-def klassifiziere_lebensmittel(produkt_text):
     """
-    Diese Funktion erstellt ein Prompt auf Deutsch, das das Modell anweist,
-    eine Lebensmittel-Kategorie (als einzelnes Label) für den eingegebenen
-    Produkttext zurückzugeben.
-    Temperatur=0.0 und do_sample=False sorgen für deterministischen Output.
     """
     prompt = (
-        f"Du bist ein Modell zur Klassifikation von Lebensmitteln. "
-        f"Analysiere die Produktbeschreibung auf Deutsch: \"{produkt_text}\".\n"
-        f"Gib bitte nur eine einzige passende Lebensmittel-Kategorie (auf Deutsch) zurück."
     )
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     with torch.no_grad():
         output = model.generate(
             **inputs,
-            max_new_tokens=30,   # Begrenze die Länge des Modell-Antwort
-            temperature=0.0,     # Keine "kreativen" Abweichungen
             top_p=1.0,
             do_sample=False
         )
-    # Ausgabe dekodieren und bereinigen
     decoded = tokenizer.decode(output[0], skip_special_tokens=True).strip()
-    # Falls das Modell mehrzeiligen Text ausgibt, nehmen wir die letzte Zeile
     lines = decoded.split("\n")
     label = lines[-1].strip()
     return label
-# Gradio-Interface aufbauen
 with gr.Blocks() as demo:
     produkt_box = gr.Textbox(
         lines=2,
         label="Produktbeschreibung",
-        placeholder="z.B. 'Aeschbach Trinkschokolade Milch, 1 kg'"
     )
     output_box = gr.Textbox(
         lines=1,
-        label="Prediziertes Lebensmittel-Label",
         placeholder="Hier erscheint das Ergebnis"
     )
-    classify_button = gr.Button("Kategorie bestimmen")
-    classify_button.click(fn=klassifiziere_lebensmittel, inputs=produkt_box, outputs=output_box)
 demo.launch()

 )
 model.eval()
+def klassifiziere_lebensmittel_fewshot(produkt_text):
     """
+    Verwendet einen Few-Shot-Prompt mit Beispielen auf Deutsch,
+    um das Modell zu einer einzigen, kurzen Lebensmittel-Kategorie
+    ohne zusätzliche Erklärungen zu führen.
     """
+    # Beispiele (Few-Shot).
+    # Du kannst die Beispiele anpassen, wenn du andere demonstrieren willst.
+    beispiele = (
+        "1) Produkt: \"Cailler Branches Milch, 44 x 46 g\"\n   Kategorie: Schokolade\n\n"
+        "2) Produkt: \"Aeschbach Trinkschokolade Milch, 1 kg\"\n   Kategorie: Trinkschokolade\n\n"
+        "3) Produkt: \"Biedermann Bio Vollmilch 3,8%, pasteurisiert\"\n   Kategorie: Milch\n\n"
+    )
+    # Prompt mit Few-Shot und neuer Eingabe
     prompt = (
+        "Du bist ein Modell zur Klassifikation von Lebensmitteln in deutsche Kategorien.\n"
+        "Hier sind einige Beispiele:\n\n"
+        f"{beispiele}"
+        f"Neues Produkt: \"{produkt_text}\"\n"
+        "Kategorie (NUR das Wort und keine Erklärung):"
     )
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     with torch.no_grad():
         output = model.generate(
             **inputs,
+            max_new_tokens=10,   # Begrenze die Antwort auf wenige Tokens
+            temperature=0.0,     # So wenig "kreatives" Rauschen wie möglich
             top_p=1.0,
             do_sample=False
         )
+    # Modell-Antwort dekodieren
     decoded = tokenizer.decode(output[0], skip_special_tokens=True).strip()
+    # Oft wiederholt das Modell das Prompt - wir nehmen daher nur die letzte Zeile
     lines = decoded.split("\n")
     label = lines[-1].strip()
     return label
+# Gradio-Interface
 with gr.Blocks() as demo:
     produkt_box = gr.Textbox(
         lines=2,
         label="Produktbeschreibung",
+        placeholder="z.B. 'Biedermann Bio Jogurt Schafmilch Himbeer, 5 x 120 g'"
     )
     output_box = gr.Textbox(
         lines=1,
+        label="Predizierte Kategorie",
         placeholder="Hier erscheint das Ergebnis"
     )
+    classify_button = gr.Button("Kategorie bestimmen (Few-Shot)")
+    classify_button.click(
+        fn=klassifiziere_lebensmittel_fewshot,
+        inputs=produkt_box,
+        outputs=output_box
+    )
 demo.launch()