|
import time
|
|
|
|
from src.extraction.extractor import process_documents_for_extraction
|
|
|
|
if __name__ == "__main__":
|
|
print(">>> Bilgi çıkarıcı çalıştırılıyor...")
|
|
print("Not: Bu işlem dokümanların uzunluğuna ve sayısına göre biraz zaman alabilir.")
|
|
start_time = time.time()
|
|
|
|
|
|
process_documents_for_extraction()
|
|
|
|
end_time = time.time()
|
|
print(f"<<< Bilgi çıkarıcı tamamlandı. Süre: {end_time - start_time:.2f} saniye.")
|
|
print(f"Kontrol edilmesi gereken dosyalar: data/processed_data/ klasöründeki concepts.parquet, mentions.parquet, relationships.parquet ve güncellenmiş documents.parquet") |