tools.py 4.6 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141
  1. import os
  2. import pandas as pd
  3. from langchain_core.tools import tool
  4. from langchain_community.tools import DuckDuckGoSearchRun
  5. import matplotlib.pyplot as plt
  6. import seaborn as sns
  7. import matplotlib
  8. matplotlib.use('Agg') # Force Matplotlib à ne pas ouvrir de fenêtre graphique
  9. @tool
  10. def convert_csv_to_excel(csv_path: str):
  11. """Convertit un fichier CSV en Excel (.xlsx)."""
  12. if not os.path.exists(csv_path):
  13. return f"Désolé, je ne trouve pas le fichier '{csv_path}'. Vérifiez qu'il est bien présent dans le dossier du projet."
  14. try:
  15. df = pd.read_csv(csv_path)
  16. new_path = csv_path.replace(".csv", ".xlsx")
  17. df.to_excel(new_path, index=False)
  18. return f"Succès : Le fichier a été converti en {new_path}"
  19. except Exception as e:
  20. return f"Erreur lors de la lecture du CSV : {str(e)}"
  21. BASE_DIR = os.path.dirname(os.path.abspath(__file__))
  22. @tool
  23. def inspect_data(file_name: str):
  24. """
  25. Explore le fichier situé dans le dossier 'data/' pour retourner les colonnes et un aperçu.
  26. Passer uniquement le nom du fichier (ex: 'data.csv').
  27. """
  28. # 1. On nettoie le nom du fichier au cas où l'IA ajoute des guillemets
  29. clean_name = file_name.strip().replace("'", "").replace('"', "")
  30. # 2. On construit le chemin ABSOLU vers le dossier data
  31. # On suppose que ton script est à la racine du projet
  32. data_path = os.path.join(os.getcwd(), "data", clean_name)
  33. try:
  34. # 3. Vérification de l'existence du fichier
  35. if not os.path.exists(data_path):
  36. return f"Erreur : Le fichier '{clean_name}' est introuvable dans le dossier data/."
  37. # 4. Lecture selon l'extension (Note : correction de 'endiwith' en 'endswith')
  38. if data_path.lower().endswith(".csv"):
  39. df = pd.read_csv(data_path) # Utilisation de la variable data_path, PAS de la chaîne "file_path"
  40. elif data_path.lower().endswith((".xlsx", ".xls")):
  41. df = pd.read_excel(data_path)
  42. else:
  43. return "Format de fichier non supporté. Utilisez .csv ou .xlsx"
  44. # 5. Extraction des infos
  45. columns_names = df.columns.tolist()
  46. preview = df.head(3).to_string()
  47. return f"Colonnes trouvées : {columns_names}\n\nAperçu des données :\n{preview}"
  48. except Exception as e:
  49. return f"Erreur lors de l'inspection : {str(e)}"
  50. @tool
  51. def excel_code_interpreter(file_path: str, code: str):
  52. """Exécute du code Python sur le fichier (CSV ou Excel) chargé dans 'df'."""
  53. import warnings
  54. warnings.filterwarnings("ignore")
  55. # Nettoyage et construction du chemin (Ton code existant est bon ici)
  56. file_name = os.path.basename(file_path.strip().replace("'", "").replace('"', ""))
  57. data_folder_path = os.path.join(BASE_DIR, "data", file_name)
  58. root_path = os.path.join(BASE_DIR, file_name)
  59. if os.path.exists(data_folder_path):
  60. full_path = data_folder_path
  61. elif os.path.exists(root_path):
  62. full_path = root_path
  63. else:
  64. return f"ERREUR : Fichier '{file_name}' introuvable."
  65. try:
  66. # Lecture du fichier
  67. df = pd.read_csv(full_path) if file_name.endswith('.csv') else pd.read_excel(full_path)
  68. # SOLUTION : On utilise un seul dictionnaire pour simplifier
  69. # On passe les builtins réels du système pour autoriser les imports
  70. context = {
  71. "df": df,
  72. "pd": pd,
  73. "plt": plt,
  74. "os": os,
  75. "result": None,
  76. "__builtins__": __builtins__ # On donne accès aux fonctions natives
  77. }
  78. # On exécute dans le même dictionnaire pour globals et locals
  79. exec(code, context)
  80. return str(context.get("result", "Exécution terminée."))
  81. except Exception as e:
  82. return f"ERREUR PYTHON : {str(e)}"
  83. ddg = DuckDuckGoSearchRun()
  84. @tool
  85. def search_tool(query : str) :
  86. """Recherche sur le web. Limité pour économiser les tokens."""
  87. try:
  88. results = ddg.run(query)
  89. if not results:
  90. return "Aucun résultat trouvé."
  91. # 1. On nettoie les espaces superflus pour gagner des tokens
  92. clean_results = " ".join(results.split())
  93. # 2. On limite intelligemment (ex: 1200 chars pour plus de contexte)
  94. # Mais on s'assure de ne pas couper un mot au milieu
  95. limit = 1200
  96. if len(clean_results) <= limit:
  97. return clean_results
  98. return clean_results[:limit] + "... [Résultat tronqué pour économie]"
  99. except Exception as e:
  100. return f"Erreur lors de la recherche : {str(e)}"