3 minggu lalu · 0d39ba0050
--- a/Agents.py
+++ b/Agents.py
@@ -7,6 +7,11 @@ from langgraph.graph.message import add_messages
 
															 from langchain_google_genai import ChatGoogleGenerativeAI 
														
 
															 from langchain_groq import ChatGroq 
														
 
															 from langfuse import get_client
														
 
															+import pandas as pd
														
 
															+from langfuse.langchain import CallbackHandler
														
 
															+ 
														
 
															+# Initialize Langfuse CallbackHandler for Langchain (tracing)
														
 
															+langfuse_handler = CallbackHandler()
														
@@ -28,25 +33,53 @@ model =ChatGroq(model="llama-3.3-70b-versatile")
 
															 #model_llama=ChatGoogleGenerativeAI(model="gemini-2.5-flash")
														
 
															-model_gpt = ChatOpenAI(model="o3-mini") 
														
 
															+model_gpt = ChatOpenAI(model="gpt-5.3-codex" ) 
														
 
															+
														
 
															+model_gpt_5 = ChatOpenAI(model="o4-mini" )
														
 
															 tools = [ search_tool  , excel_code_interpreter,  inspect_data ]
														
 
															-model_with_tools = model.bind_tools(tools)
														
 
															+model_with_tools = model_gpt.bind_tools(tools)
														
 
															 # 3. Définition des Nœuds
														
 
															 def agent_analyseur(state: AgentState):
														
 
															+    # --- PHASE D'INSPECTION AUTOMATIQUE ---
														
 
															+    # On récupère le chemin du fichier depuis le state
														
 
															+    file_path = state.get("current_df_path")
														
 
															+    inspection_info = ""
														
 
															+    
														
 
															+    if file_path and os.path.exists(file_path):
														
 
															+        try:
														
 
															+            # Lecture des 5 premières lignes pour comprendre la structure
														
 
															+            df_temp = pd.read_csv(file_path, nrows=5) if file_path.endswith('.csv') else pd.read_excel(file_path, nrows=5)
														
 
															+            columns_list = df_temp.columns.tolist()
														
 
															+            sample_data = df_temp.head(2).to_string()
														
 
															+            inspection_info = f"\n\n### DONNÉES RÉELLES DU FICHIER :\n- Colonnes détectées : {columns_list}\n- Aperçu des données :\n{sample_data}"
														
 
															+        except Exception as e:
														
 
															+            inspection_info = f"\n\n⚠️ Erreur lors de l'inspection du fichier : {e}"
														
 
															+
														
 
															+    # --- CONSTRUCTION DU PROMPT AVEC LES DONNÉES RÉELLES ---
														
 
															     prompt = (
														
 
															-        "Tu es l'Analyseur Stratégique. Ton rôle est de décomposer la demande utilisateur en étapes techniques claires.\n"
														
 
															-        "RÈGLES CRITIQUES :\n"
														
 
															+            "Tu es l'Analyseur Stratégique de Dataltist. Ton rôle est de définir le 'QUOI' faire, pas le 'COMMENT'.\n\n"
														
 
															+            "### RÈGLES D'OR :\n"
														
 
															+            "1. PAS DE CODE : Ne génère JAMAIS de blocs de code Python (```python). C'est le rôle de l'Exécuteur.\n"
														
 
															+            "2. PLAN D'ACTION : Liste les étapes logiques en utilisant les noms de colonnes exacts.\n"
														
 
															+            "3. INSPECTION : Base-toi uniquement sur les colonnes détectées ci-dessous.\n"
														
 
															+            "4. CONCISION : Sois une tour de contrôle, donne des ordres clairs et précis.\n"
														
 
															+            f"{inspection_info}"
														
 
															+        )
														
 
															-        "1. Définis un plan d'action claire \n"
														
 
															-        "2. Ne pose JAMAIS de questions sur les données (prix, stock). L'Exécuteur doit les trouver lui-même via les outils.\n"
														
 
															-        "3. Sois concis : Ton message doit être une directive pour l'Exécuteur, pas une conversation avec l'utilisateur."
														
 
															-    )
														
 
															+    config_analyseur = {
														
 
															+        "callbacks": [langfuse_handler],
														
 
															+        "metadata": {"agent_name": "Analyseur"},
														
 
															+        "tags": ["Dataltist", "Planning"]
														
 
															+    }
														
 
															+
														
 
															     msg = [SystemMessage(content=prompt)] + state["messages"]
														
 
															-    response = model.invoke(msg)
														
 
															+    response = model.invoke(msg , config=config_analyseur)
														
 
															+    
														
 
															+    # On retourne la réponse de l'IA qui contient maintenant le plan basé sur les vraies colonnes
														
 
															     return {"messages": [response]}
														
@@ -55,30 +88,39 @@ def agent_executor(state: AgentState):
 
															     # 1. On récupère le chemin actuel depuis le State
														
 
															     # Si current_df_path est None, on met data.xlsx par défaut
														
 
															     file_path = state.get("current_df_path") or "data.xlsx"
														
 
															+    clean_path = file_path.replace("\\", "/")
														
 
															     # 2. On construit un prompt qui contient le VRAI chemin
														
 
															     prompt = (
														
 
															-        f"Tu es un Data Scientist expert spécialisé en automatisation. Le fichier cible se trouve dans le dossier 'data/' : '{file_path}'.\n"
														
 
															+        f"Tu es un Data Scientist expert spécialisé en automatisation. Le fichier cible est disponible ici : '{file_path}'.\n\n"
														
 
															         "PROTOCOLE D'ACTION IMPÉRATIF :\n"
														
 
															-        "1. INSPECTION PRÉALABLE : Avant de générer le moindre code Python, appelle TOUJOURS 'inspect_data'.\n Tu dois connaître les colonnes réelles avant de coder.\n"
														
 
															-        "2. ACTION D'ABORD : Si tu n'as pas les données externes, appelle 'search_tool' immédiatement.\n"
														
 
															-        "3. ZÉRO SIMULATION : Il est strictement interdit d'inventer des prix ou des stocks. Si l'outil 'search_tool' donne une plage de prix (ex: 30-40€), calcule la moyenne (35€).\n"
														
 
															-        "4. LOGIQUE PANDAS : Ne fais aucun calcul manuel. Utilise 'df' pour filtrer le produit exact (ex: df[df['Produit'] == 'Souris']).\n"
														
 
															-        "5. VARIABLE RESULT : Ton script Python DOIT etre complis avec tout les imports et  se terminer par 'result = ...'. C'est cette variable qui sera transmise au système.\n"
														
 
															-        "6. PERSISTANCE : Si un graphique est demandé, utilise 'plt.savefig('outputs/nom_du_graphe.png')'.\n"
														
 
															-        "Tu es un moteur d'exécution froid et précis."
														
 
															-        "STRUCTURE DE TA RÉPONSE POST-OUTIL :\n"
														
 
															+        "1. CONFIANCE STRATÉGIQUE : Utilise les noms de colonnes fournis par l'Analyseur ( Obligatoire , change pas ).\n"
														
 
															+        "2. RECHERCHE EXTERNE : Utilise 'search_tool' si des données manquent.\n"
														
 
															+        "3. ZÉRO SIMULATION : Ne jamais inventer de données.\n"
														
 
															+        "4. LOGIQUE PANDAS : Utilise 'df' pour filtrer les données exactes.\n"
														
 
															+        "5. CODE AUTONOME : Ton script Python doit être complet et prêt à l'exécution. \n"
														
 
															+        f"   - Tu DOIS impérativement définir la variable `file_path = '{clean_path}'` au début de ton code.\n"
														
 
															+        "   - Inclus tous les imports (pandas as pd, matplotlib.pyplot as plt, etc.).\n"
														
 
															+        "   - Termine impérativement par 'result = ...'.\n"
														
 
															+        "6. PERSISTANCE : Utilise 'plt.savefig('outputs/nom_du_graphe.png')' et ferme la figure avec 'plt.close()'.\n\n"
														
 
															+        "Tu es un moteur d'exécution froid et précis. Pas de discours.\n"
														
 
															+        "STRUCTURE DE RÉPONSE :\n"
														
 
															         "- 'Statut : Code exécuté avec succès.'\n"
														
 
															         "- 'Fichiers : [liste des .png générés]'\n"
														
 
															         "- 'Validation : Les données de [Colonnes] ont été traitées.'\n"
														
 
															-        "PAS DE DISCOURS, PAS D'ÉTAPES."
														
 
															     )
														
 
															     # 3. Préparation des messages
														
 
															     messages = [SystemMessage(content=prompt)] + state["messages"]
														
 
															+
														
 
															+    config_executor= {
														
 
															+        "callbacks": [langfuse_handler],
														
 
															+        "metadata": {"agent_name": "executor"},
														
 
															+        "tags": ["Dataltist", "executor"]
														
 
															+    }
														
 
															     # 4. Appel du modèle avec les outils
														
 
															-    response = model_with_tools.invoke(messages)
														
 
															+    response = model_with_tools.invoke(messages , config= config_executor )
														
 
															     return {"messages": [response]}
														
@@ -87,30 +129,34 @@ def agent_executor(state: AgentState):
 
															 def agent_reporter(state : AgentState) : 
														
 
															     prompt_reporter = (
														
 
															-        "Tu es l'Agent de Reporting.\n"
														
 
															-        "Ton rôle est de transformer les résultats techniques fournis par l'Exécuteur en un compte rendu court, clair et factuel.\n\n"
														
 
															-
														
 
															-        "RÈGLES STRICTES :\n"
														
 
															-        "- N'invente aucune information.\n"
														
 
															-        "- Ne répète pas les mêmes informations.\n"
														
 
															-        "- Évite les phrases génériques ou marketing.\n"
														
 
															-        "- Sois concis et direct.\n"
														
 
															-        "- Utilise uniquement les données réellement calculées.\n\n"
														
 
															-
														
 
															-        "FORMAT DE SORTIE OBLIGATOIRE :\n"
														
 
															-        "1) Résultats clés\n"
														
 
															-        "- Liste courte des résultats principaux (produits les plus vendus, top commerciaux, etc.)\n\n"
														
 
															-        "2) Observations\n"
														
 
															-        "- Interprétation courte basée uniquement sur les résultats.\n\n"
														
 
															-        "3) Livrables générés\n"
														
 
															-        "- Liste des graphiques et fichiers créés avec leurs chemins exacts.\n\n"
														
 
															-
														
 
															-        "IMPORTANT :\n"
														
 
															-        "- Maximum 6 à 8 lignes au total.\n"
														
 
															-        "- Pas de conclusion inutile.\n"
														
 
															-        "- Pas de texte explicatif long."
														
 
															+        "Tu es l'Agent de Reporting de Dataltist.\n"
														
 
															+        "Ton rôle : Convertir les logs de l'Exécuteur en une synthèse factuelle pour l'utilisateur.\n\n"
														
 
															+
														
 
															+        "RÈGLES CRITIQUES (ANTI-SILENCE) :\n"
														
 
															+        "- DISPONIBILITÉ : Tu dois TOUJOURS générer une réponse, même pour confirmer une erreur ou une absence de données.\n"
														
 
															+        "- STRUCTURE : Utilise des tirets pour lister les points clés.\n"
														
 
															+        "- SYNTHÈSE : Si l'Exécuteur donne 'result = 42', écris 'Résultat : 42'.\n"
														
 
															+        "- FICHIERS : Liste uniquement le nom des fichiers (ex: graphe_incendie.png), JAMAIS le chemin 'outputs/'.\n\n"
														
 
															+
														
 
															+        "FORMAT IMPÉRATIF :\n"
														
 
															+        "1. Résumé des données traitées.\n"
														
 
															+        "2. Valeurs calculées (moyennes, totaux, etc.).\n"
														
 
															+        "3. Liste des visuels générés (si présents).\n\n"
														
 
															+        "4. L'affichage doit etre claire , tu laisse les espaces .\n\n"
														
 
															+
														
 
															+        "INTERDICTIONS :\n"
														
 
															+        "- Pas de politesse inutile ('Voici le rapport...', 'J'espère que...').\n"
														
 
															+        "- Pas de répétition des étapes techniques de l'agent.\n"
														
 
															+        "- Pas de phrases vides si l'exécution a échoué : explique brièvement l'échec."
														
 
															+
														
 
															+        "RÈGLES D'AFFICHAGE DES FICHIERS :\n"
														
 
															+        "1. CITATION : Si l'Exécuteur a généré des fichiers (images ou données), cite-les obligatoirement.\n"
														
 
															+        "2. FORMAT : Utilise TOUJOURS ce format exact pour introduire un fichier : \n"
														
 
															+        "   '📊 Visualisation générée : [nom_du_fichier.png]'\n"
														
 
															+        "   '📥 Fichier disponible : [nom_du_fichier.csv/xlsx]'\n"
														
 
															+        "3. SANS CHEMIN : Ne mentionne JAMAIS le dossier 'outputs/' ou 'data/'. Utilise uniquement le nom final du fichier.\n\n"
														
 
															     )
														
 
															     messages = [SystemMessage(content=prompt_reporter)] + state["messages"]
														
 
															-    response = model.invoke(messages) 
														
 
															+    response = model.invoke(messages  ) 
														
 
															     return{"messages" : [response]}
														
--- a/__pycache__/Agents.cpython-313.pyc
+++ b/__pycache__/Agents.cpython-313.pyc
--- a/__pycache__/suggestions.cpython-313.pyc
+++ b/__pycache__/suggestions.cpython-313.pyc
--- a/__pycache__/tools.cpython-313.pyc
+++ b/__pycache__/tools.cpython-313.pyc
--- a/__pycache__/workflow_Agent.cpython-313.pyc
+++ b/__pycache__/workflow_Agent.cpython-313.pyc
--- a/pricing.py
+++ b/pricing.py
@@ -0,0 +1,55 @@
 
															+import matplotlib.pyplot as plt
														
 
															+
														
 
															+# ---------------------------
														
 
															+# Données complètes pour agents IA avec prix
														
 
															+# ---------------------------
														
 
															+agents_detailed = [
														
 
															+    # Planificateur / Brain
														
 
															+    ["Planificateur", "GPT-5.2", "Très puissant", "Élevé", "Décomposition tâches complexes", "Idéal grandes entreprises", 1.75, 14.00],
														
 
															+    ["Planificateur", "Claude Opus 4.6", "Puissant", "Moyen", "Raisonnement long, multi-étapes", "Bon pour workflows longs", 5.00, 25.00],
														
 
															+    ["Planificateur", "Gemini 3.1 Pro", "Très puissant", "Élevé", "Multimodal, long contexte", "Excellente intégration multimédia", 2.00, 12.00],
														
 
															+    ["Planificateur", "GPT-5.1 Codex", "Puissant", "Moyen", "Planification + code workflow", "Idéal pour automatisation", 1.75, 14.00],
														
 
															+    ["Planificateur", "GPT-4.1", "Correct", "Bas", "Raisonnement basique, rapide", "Projets limités / budget réduit", 3.00, 12.00],
														
 
															+
														
 
															+    # Exécutant / Tool Agent
														
 
															+    ["Exécutant", "GPT-5.1 Codex Max", "Très puissant", "Élevé", "Génération de code multi-fichiers", "Idéal pour Excel, graphiques", 1.75, 14.00],
														
 
															+    ["Exécutant", "Claude Sonnet 4.6", "Puissant", "Moyen", "Manipulation fichiers et outils", "Bon pour automatisation des tâches", 3.00, 15.00],
														
 
															+    ["Exécutant", "Gemini 3.1 Pro", "Très puissant", "Élevé", "Exécution multimodale, scripts complexes", "Gestion de workflows lourds", 2.00, 12.00],
														
 
															+    ["Exécutant", "GPT-4.1", "Correct", "Bas", "Scripts simples et rapides", "Projets simples, faible budget", 3.00, 12.00],
														
 
															+    ["Exécutant", "GPT-5 mini", "Bas", "Très bas", "Scripts simples, rapide", "Prototypage rapide", 0.25, 2.00],
														
 
															+
														
 
															+    # Rapporteur / Résumeur
														
 
															+    ["Rapporteur", "GPT-5.2", "Très puissant", "Élevé", "Synthèse logique et claire", "Rapports clients complexes", 1.75, 14.00],
														
 
															+    ["Rapporteur", "GPT-4.1", "Puissant", "Moyen", "Rapports structurés", "Rapports quotidiens / semi-complexes", 3.00, 12.00],
														
 
															+    ["Rapporteur", "Claude Sonnet 4.6", "Puissant", "Moyen", "Rapports détaillés", "Bon pour multi-étapes", 3.00, 15.00],
														
 
															+    ["Rapporteur", "Gemini 3.1 Pro", "Très puissant", "Élevé", "Synthèse multimodale", "Rapports complexes multimédia", 2.00, 12.00],
														
 
															+    ["Rapporteur", "GPT-5 mini", "Correct", "Bas", "Rapports courts rapides", "Projets simples", 0.25, 2.00],
														
 
															+]
														
 
															+
														
 
															+# ---------------------------
														
 
															+# Création du tableau
														
 
															+# ---------------------------
														
 
															+fig, ax = plt.subplots(figsize=(20, 15))
														
 
															+ax.axis('off')
														
 
															+
														
 
															+# Colonnes du tableau
														
 
															+columns = ["Rôle Agent", "Modèle", "Puissance", "Coût", "Points forts", "Contexte d'usage", "Input ($/1M tokens)", "Output ($/1M tokens)"]
														
 
															+
														
 
															+# Création du tableau matplotlib
														
 
															+table = ax.table(
														
 
															+    cellText=agents_detailed,
														
 
															+    colLabels=columns,
														
 
															+    loc='center',
														
 
															+    cellLoc='center',
														
 
															+    colColours=["#FFD700", "#ADD8E6", "#90EE90", "#FFB6C1", "#E0FFFF", "#FFFACD", "#FFE4B5", "#FFDAB9"]
														
 
															+)
														
 
															+
														
 
															+# Style et formatage
														
 
															+table.auto_set_font_size(False)
														
 
															+table.set_fontsize(9)
														
 
															+table.auto_set_column_width(list(range(len(columns))))
														
 
															+ax.set_title("🤖 Tableau complet des modèles pour agents IA avec prix Input/Output", fontsize=16, fontweight='bold')
														
 
															+
														
 
															+# Affichage
														
 
															+plt.tight_layout()
														
 
															+plt.show()
														
--- a/suggestions.py
+++ b/suggestions.py
@@ -0,0 +1,53 @@
 
															+def get_suggestions(filename):
														
 
															+    fname = filename.lower()
														
 
															+    
														
 
															+    # --- CATEGORIE 1 : BANQUE / FINANCE ---
														
 
															+    if any(word in fname for word in ["bank", "banque", "loan", "credit", "finance"]):
														
 
															+        return [
														
 
															+            "📊 Décris-moi la structure de ce dataset bancaire",
														
 
															+            "🎓 Quel niveau d'éducation a le solde (balance) moyen le plus élevé ?",
														
 
															+            "📈 Graphique : Corrélation entre l'âge et le solde moyen",
														
 
															+            "🎯 Jobs les plus communs pour les clients ayant accepté la campagne (target 'yes')",
														
 
															+            "🔮 Prédiction : Relation entre nombre de contacts et succès de la campagne",
														
 
															+            "🧼 Nettoie les données et crée un tableau récapitulatif par niveau d'études"
														
 
															+        ]
														
 
															+    
														
 
															+    # --- CATEGORIE 2 : RETAIL / E-COMMERCE ---
														
 
															+    elif any(word in fname for word in ["retail", "vente", "sales", "shop", "online"]):
														
 
															+        return [
														
 
															+            "💰 Quel mois a généré le chiffre d'affaires (CA) le plus élevé ?",
														
 
															+            "📅 Courbe d'évolution : Revenus mensuels vs Quantités vendues",
														
 
															+            "⏰ Is revenue higher in the morning or afternoon? (Analyse horaire)",
														
 
															+            "🌍 Top 5 des pays générant le plus de profit",
														
 
															+            "🛒 Panier moyen : Analyse de la valeur des transactions par client",
														
 
															+            "📦 Quels sont les 3 produits les plus vendus par catégorie ?"
														
 
															+        ]
														
 
															+
														
 
															+    # --- CATEGORIE 3 : RESSOURCES HUMAINES (RH) ---
														
 
															+    elif any(word in fname for word in ["hr", "rh", "employee", "salary", "churn"]):
														
 
															+        return [
														
 
															+            "👥 Répartition des employés par département et par genre",
														
 
															+            "💸 Analyse des salaires : Moyenne par niveau d'expérience",
														
 
															+            "📉 Facteurs principaux influençant le départ des employés (Churn)",
														
 
															+            "🏠 Corrélation entre le télétravail et la performance perçue",
														
 
															+            "📊 Graphique : Satisfaction au travail vs Ancienneté"
														
 
															+        ]
														
 
															+
														
 
															+    # --- CATEGORIE 4 : ASSURANCE (Ton projet Dataltist !) ---
														
 
															+    elif any(word in fname for word in ["insurance", "assurance", "claim", "premium", "fire"]):
														
 
															+        return [
														
 
															+            "🔥 Prédiction des primes d'assurance incendie",
														
 
															+            "📋 Analyse des sinistres par région géographique",
														
 
															+            "⚖️ Ratio sinistre/prime par type de contrat",
														
 
															+            "📉 Évolution des demandes d'indemnisation sur l'année",
														
 
															+            "🧼 Créer un segment de clients à 'Haut Risque'"
														
 
															+        ]
														
 
															+
														
 
															+    # --- PAR DÉFAUT (GÉNÉRIQUE) ---
														
 
															+    return [
														
 
															+        "🔍 Fais une analyse exploratoire (EDA) complète",
														
 
															+        "🔗 Quelles sont les 5 corrélations les plus fortes ?",
														
 
															+        "📉 Résumé statistique des variables numériques",
														
 
															+        "🧼 Identifie et liste les valeurs manquantes ou aberrantes",
														
 
															+        "📊 Génère un dashboard visuel des indicateurs clés"
														
 
															+    ]
														
--- a/test__.py
+++ b/test__.py
@@ -0,0 +1,42 @@
 
															+import os
														
 
															+from langfuse import Langfuse
														
 
															+
														
 
															+# 1. On définit les clés manuellement pour être SÛR à 100%
														
 
															+# Remplace les pointillés par tes vraies clés
														
 
															+PUBLIC_KEY = "pk-lf-f07364b3-d0a6-4252-8d65-447500b27cb7"
														
 
															+SECRET_KEY = "sk-lf-da8a0214-de29-43e0-9c53-f85f8371a37f"
														
 
															+HOST = "https://cloud.langfuse.com"
														
 
															+
														
 
															+print("--- Démarrage du test d'authentification Langfuse ---")
														
 
															+
														
 
															+try:
														
 
															+    # 2. Initialisation explicite
														
 
															+    langfuse = Langfuse(
														
 
															+        public_key=PUBLIC_KEY,
														
 
															+        secret_key=SECRET_KEY,
														
 
															+        host=HOST,
														
 
															+        debug=True # Active le mode debug pour voir ce qui se passe
														
 
															+    )
														
 
															+
														
 
															+    # 3. Test d'envoi d'une trace simple
														
 
															+    print("Tentative d'envoi d'une trace de test...")
														
 
															+    trace = langfuse.trace(name="Test Authentification Dataltist")
														
 
															+    
														
 
															+    # 4. Envoi d'un score de test
														
 
															+    print("Tentative d'envoi d'un score...")
														
 
															+    langfuse.score(
														
 
															+        trace_id=trace.id,
														
 
															+        name="test_score",
														
 
															+        value=1
														
 
															+    )
														
 
															+
														
 
															+    # 5. Forcer l'envoi vers le serveur
														
 
															+    langfuse.flush()
														
 
															+    
														
 
															+    print("\n✅ SUCCÈS : Aucune erreur d'authentification détectée.")
														
 
															+    print(f"Vérifie ton dashboard Langfuse, tu devrais voir une trace nommée 'Test Authentification Dataltist'.")
														
 
															+    print(f"ID de la trace envoyée : {trace.id}")
														
 
															+
														
 
															+except Exception as e:
														
 
															+    print(f"\n❌ ÉCHEC : Une erreur est survenue.")
														
 
															+    print(f"Détails de l'erreur : {str(e)}")
														
--- a/~$Rapport_Analytique.xlsx
+++ b/~$Rapport_Analytique.xlsx