NASA-SMD-PCRAG-SCDD-GEN

Running

App Files Files Community

aquibmoin commited on Mar 22

Commit

20010b0

verified ·

1 Parent(s): e36e61e

Update app.py

Browse files

Files changed (1) hide show

app.py +3 -50

app.py CHANGED Viewed

@@ -19,6 +19,9 @@ from pinecone import Pinecone
 import logging
 import re
 from langchain_openai import ChatOpenAI
 from langchain_openai import OpenAIEmbeddings
 llm = ChatOpenAI(model="gpt-4o")
@@ -129,56 +132,6 @@ def clean_retrieved_context(raw_context):
     # Return explicitly cleaned context
     return cleaned.strip()
-def extract_keywords_with_gpt(context, max_tokens=100, temperature=0.3):
-    keyword_prompt = f"Extract 3 most important scientific keywords from the following user query:\n\n{context}"
-    response = client.chat.completions.create(
-        model="gpt-4",
-        messages=[
-            {"role": "system", "content": "You are an expert in identifying key scientific terms and concepts."},
-            {"role": "user", "content": keyword_prompt}
-        ],
-        max_tokens=max_tokens,
-        temperature=temperature
-    )
-    extracted_keywords = response.choices[0].message.content.strip()
-    cleaned_keywords = re.sub(r'\d+\.\s*', '', extracted_keywords)
-    keywords_list = [kw.strip() for kw in cleaned_keywords.split("\n") if kw.strip()]
-    return keywords_list
-def fetch_nasa_ads_references(ads_query):
-    """Fetch relevant NASA ADS papers and format them for readability."""
-    try:
-        # Query NASA ADS for relevant papers
-        papers = ADS.query_simple(ads_query)
-        if not papers or len(papers) == 0:
-            return [("No results found", "N/A", "N/A", "N/A", "N/A", "N/A")]
-        # Include authors in the references
-        references = []
-        for paper in papers[:5]:  # Limit to 5 references
-            title = paper.get('title', ['Title not available'])[0]
-            abstract = paper.get('abstract', 'Abstract not available')
-            authors = ", ".join(paper.get('author', [])[:3]) + (" et al." if len(paper.get('author', [])) > 3 else "")
-            bibcode = paper.get('bibcode', 'N/A')
-            pub = paper.get('pub', 'Unknown Journal')
-            pubdate = paper.get('pubdate', 'Unknown Date')
-            references.append((title, abstract, authors, bibcode, pub, pubdate))
-        return references
-    except Exception as e:
-        logging.error(f"Error fetching ADS references: {str(e)}")
-        return [("Error fetching references", "See logs for details", "N/A", "N/A", "N/A", "N/A")]
 def fetch_exoplanet_data():
     # Connect to NASA Exoplanet Archive TAP Service
     tap_service = vo.dal.TAPService("https://exoplanetarchive.ipac.caltech.edu/TAP")

 import logging
 import re
+from utils.ads_references import fetch_nasa_ads_references, extract_keywords_with_gpt
 from langchain_openai import ChatOpenAI
 from langchain_openai import OpenAIEmbeddings
 llm = ChatOpenAI(model="gpt-4o")
     # Return explicitly cleaned context
     return cleaned.strip()
 def fetch_exoplanet_data():
     # Connect to NASA Exoplanet Archive TAP Service
     tap_service = vo.dal.TAPService("https://exoplanetarchive.ipac.caltech.edu/TAP")