PersianMindtranslator

Running

Shahrokhpk commited on Mar 18

Commit

a71c2cf

verified ·

1 Parent(s): b03c35f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,3 @@
-import streamlit as st
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
@@ -14,24 +13,12 @@ tokenizer = AutoTokenizer.from_pretrained("universitytehran/PersianMind-v1.0")
 # Conversation template
 TEMPLATE = "{context}\nYou: {prompt}\nPersianMind: "
-CONTEXT = "You are a professional persian to english translator. translate user input to english"
-# Streamlit app
-st.title("PersianMind translator")
-st.markdown("PersianMind translator")
-# User input
-prompt = st.text_input("Text (in Persian):")
-if st.button("Get Response"):
-    if prompt.strip():
-        with st.spinner("Generating response..."):
-            model_input = TEMPLATE.format(context=CONTEXT, prompt=prompt)
-            input_tokens = tokenizer(model_input, return_tensors="pt").to(device)
-            generate_ids = model.generate(**input_tokens, max_new_tokens=512, do_sample=False, repetition_penalty=1.1)
-            model_output = tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
-            response = model_output[len(model_input):]
-        st.text_area("PersianMind's Response:", response, height=200)
-    else:
-        st.warning("Please enter a text.")

 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 # Conversation template
 TEMPLATE = "{context}\nYou: {prompt}\nPersianMind: "
+CONTEXT = "به انگلیسی ترجمه کن"
+prompt = "به انگلیسی ترجمه کن: وزیر امور خارجه ایران در نشست خبری اعلام کرد که مذاکرات هسته‌ای به دلیل اختلافات اساسی درباره اجرای تعهدات متوقف شده است. او تأکید کرد که ایران همچنان به دنبال یک توافق عادلانه و متوازن است، اما طرف‌های مقابل باید از سیاست‌های دوگانه خود دست بردارند"
+model_input = TEMPLATE.format(context=CONTEXT, prompt=prompt)
+input_tokens = tokenizer(model_input, return_tensors="pt").to(device)
+generate_ids = model.generate(**input_tokens, max_new_tokens=512, do_sample=False, repetition_penalty=1.1)
+model_output = tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
+response = model_output[len(model_input):]
+print(response)