Icône de la catégorie Ressources
Icône de la catégorie Ressources

Resources

19 nov. 2025

Automatiser la récupération de leads depuis data.gouv

image data.gouv
image data.gouv
image data.gouv

Générer des leads, c'est souvent un gros budget. Apollo coûte 49€/mois. Clay à partir de 149€/mois. Les outils de prospection sont chers.​

Pourtant, les données sont déjà disponibles. Gratuitement. Le gouvernement français met à disposition une API avec toutes les informations des entreprises. SIREN, adresse, dirigeants, secteur d'activité... tout est accessible.​

L'API Recherche d'Entreprises permet 400 appels par minute. Zéro limite de quota journalier. Aucun coût. C'est la base Sirene complète, mise à jour en temps réel par l'INSEE.​

Au lieu de payer des abonnements, on peut récupérer ces données gratuitement et les enrichir avec l'IA. Le workflow est simple : extraction depuis data.gouv.fr, enrichissement automatique, export dans le CRM.

On va construire ce système avec n8n. Tout est automatique. Les leads arrivent qualifiés dans Airtable, prêts à être contactés.

Pas le temps de lire ?

Base Airtable : BDD DATA GOUV
Workflow n8n : WORKFLOW N8N DATA GOUV

Tout est prêt à utiliser. Importez, connectez, c'est parti.

Ce qu'il faut avant de commencer

Quatre outils à configurer avant de lancer le workflow. Tout est gratuit ou avec un plan free généreux. Le setup prend 30 minutes max.

Outil

À quoi ça sert

Durée

INSEE API

Récupérer les données entreprises depuis data.gouv.fr

3 min

Airtable

Stocker et organiser les leads

10 min

Perplexity API

Enrichir automatiquement avec l'IA

5 min

n8n

Créer le workflow d'automatisation

15 min

Une fois configuré, le système tourne en autonomie.

Prêt pour la 1ere étape ?

Étape 1 : Récupérer la clé API INSEE

Étape

Détail

Aller sur portail-api.insee.fr

Ouvrez le lien dans votre navigateur.

Cliquer sur "Se connecter"

En haut à droite de la page d’accueil.

page d’accueil portail API INSEE avec bouton connexion

Choisir "CONNEXION-POUR-LES-EXTERNES"

Sur la page suivante, prenez le bouton du bas pour les utilisateurs externes.

écran identification INSEE avec bouton connexion pour les externes

Créer un compte si besoin

Cliquez sur "Enregistrement", remplissez le formulaire (nom, prénom, email, mot de passe).

formulaire inscription INSEE nom prénom email mot de passe

Activer votre compte

Ouvrez l’email reçu, cliquez sur le lien de vérification et reconnectez-vous.

écran d’attente vérification email INSEE

Accéder aux "Applications"

En haut du portail, cliquez sur "Applications" pour voir la liste de vos apps.

Créer une application

Cliquez sur "CRÉER UNE APP" (bouton bleu à droite), renseignez les informations : nom, prénom, et "n8n". Mode "Simple". Suivant.

écran création nouvelle application INSEE champ nom prénom description

Valider la création

Cliquez sur "Créer l’application".

étape finale création application INSEE validation mode simple

Aller dans le "Catalogue"

Retournez en haut, puis cliquez sur "Catalogue", cherchez "API Sirene".

catalogue API INSEE onglet recherche API Sirene

Cliquer sur "Souscrire"

En haut à droite du "API Sirene", cliquez sur "Souscrire".

bouton souscrire API Sirene INSEE choix application créée

Sélectionner votre application

Dans la liste, prenez celle que vous venez de créer. Validez.

écran sélection application pour API Sirene INSEE

Récupérer la clé API

Vos clés (consumer key + secret) s’affichent : copiez-les, elles serviront pour votre workflow.

visuel accès clés API INSEE consumer key secret à copier pour workflow

Étape 2 : Récupérer sa clé API Perplexity

Maintenant qu’on a notre clé API data.gouv, on passe à l’étape suivante : récupérer la clé API Perplexity. Cette clé nous permettra d’enrichir automatiquement nos leads avec de l’intelligence artificielle.

Rendez-vous sur le site Perplexity (perplexity.ai).

  • Connectez-vous ou créez un compte (c’est rapide et gratuit).

  • Cliquez sur “API” dans le menu de gauche.

menu perplexity onglet API pour créer une clé d’accès
  • Sélectionnez “Clés API” dans la section API.

  • Cliquez sur le bouton pour générer une nouvelle clé.

liste des clés API affichée sur perplexity après génération
  • Copiez la clé qui s’affiche.

  • L’offre gratuite vous donne 5 $ par mois, largement suffisant pour scraper 10 000 leads gratuitement.

Etape 3 creation de la base airtable

Maintenant que vous avez vos deux clés API (data.gouv et Perplexity), on va créer la base Airtable pour stocker vos leads.

Cliquez sur ce lien pour copier la base directement dans votre espace : https://airtable.com/app8J0wC6WrTYOrKN/shrLIlhgvxEIMmM9u

Une fois la base copiée, récupérez votre token API Airtable :

creation token api airtable image
  • Nommez-le "Workflow n8n"

  • Cochez les scopes : data.records:read, data.records:write, schema.bases:read

  • Dans "Access", cliquez sur "+ Add a base" et sélectionnez votre base

Exemple création token api airtable
  • Validez et copiez le token qui s'affiche

Exemple d'une clé api airtable

Etape 4 Automatiser la récupération de leads avec n8n

Maintenant que tout est en place (clés API, Airtable, Perplexity…), on peut enfin rentrer dans le cœur du système : le workflow.
Il est déjà build, il fonctionne, et on va le décortiquer calmement, partie par partie.

L’objectif :

  1. Générer toutes les pages à scraper

  2. Appeler l’API INSEE pour récupérer les entreprises

  3. Transformer proprement les données

  4. Enrichir automatiquement avec Perplexity

  5. Ranger tout dans Airtable, prêt à être contacté

On y va 👇

1️⃣ Trigger – When clicking Execute workflow

Création automatique de la liste des pages à scraper dans l’API INSEE. Une base essentielle pour récupérer plus de résultats sans limite.

C’est le point de départ.
Lorsque le bouton “Execute workflow” est cliqué dans n8n, tout le système se déclenche.
Aucune configuration particulière n’est nécessaire ici.

2️⃣ Génération des pages – Code in JavaScript (pages)

Création automatique de la liste des pages à scraper dans l’API INSEE. Une base essentielle pour récupérer plus de résultats sans limite.

Ce node génère une liste d’objets correspondant aux pages de l’API INSEE à aller chercher.

Le code utilisé :

const totalPages = 10; // Modifier ici pour récupérer plus ou moins de pages

const items = [];

for (let i = 1; i <= totalPages; i++) {
  items.push({ json: { page: i } });
}

return items;

🔍 Ce que cela produit :

  • une page 1

  • une page 2

  • une page 3

    jusqu’à la dernière page souhaitée.

📌 Pourquoi c’est nécessaire ?
Car l’API INSEE renvoie 25 entreprises maximum par page.
Pour récupérer tout un secteur ou tout un département, il faut donc appeler plusieurs pages d’affilée.

3️⃣ Boucle – Loop Over Items

Exécution d’une boucle qui envoie chaque numéro de page dans la suite du workflow. Un passage indispensable pour parcourir toutes les pages de l’API.

Ce node prend chaque page générée dans l’étape précédente (page 1, 2, 3…) et les exécute une par une.

Chaque passage dans la boucle envoie la valeur page au node HTTP Request.
Aucune configuration supplémentaire n’est à prévoir ici.

4️⃣ Appel INSEE – HTTP Request

Appel dynamique à l’API Recherche Entreprises avec filtres secteur, zone et code APE. Permet d’extraire des données officielles et fiables en temps réel.

C’est ici que n8n interroge l’API officielle :
https://recherche-entreprises.api.gouv.fr/search

✔️ Paramètres utilisés

Paramètre

À quoi il sert

Exemple

q

Mot-clé général

“immobilier”, “agence”, “sport”, “informatique”…

departement

Zone géographique

75 pour Paris, 13 pour Marseille…

activite_principale

Code APE

68.31Z (agences immobilières), 62 (informatique)…

per_page

Nombre de résultats par page

25 (maximum autorisé)

page

Numéro de la page

={{ $json.page }}

✔️ Comment choisir les bons filtres ?

1. Le paramètre q (mot-clé)

C’est le filtre le plus large.
Plus il est générique, plus le volume de leads augmente.

Exemples efficaces :

  • service

  • agence

  • conseil

  • commerce

2. Le paramètre departement

Permet de cibler une zone précise :

  • 75 = Paris

  • 69 = Lyon

  • 13 = Marseille

  • 33 = Bordeaux

Si on souhaite récupérer toute la France :
👉 Il suffit de retirer complètement ce paramètre.

3. Le paramètre activite_principale (code APE)

Très puissant mais aussi très restrictif.
Pour élargir la recherche, il est possible de ne renseigner que les deux premiers chiffres :

  • 68 → tout l’immobilier

  • 62 → tout le numérique

  • 47 → tout le commerce

Cela permet d’obtenir beaucoup plus de résultats.

4. Le paramètre page

Il est alimenté automatiquement grâce au Code Node.
Chaque passage dans la boucle envoie le numéro de la page.

🔐 Clé API INSEE
Elle est placée dans les headers :

X-INSEE-Api-Key-Integration : votre_clé_API

Obtention : https://api.insee.fr
Dans n8n, elle est directement collée dans le node HTTP Request.

5️⃣ Transformation des données – Code in JavaScript

Nettoyage et structuration des données de l’API INSEE : SIREN, dirigeant, adresse, activité principale, effectif. Chaque entreprise devient exploitable.

Ce node nettoie et restructure les données renvoyées par l’API INSEE.

Il extrait notamment :

  • nom de l’entreprise

  • SIREN

  • adresse complète

  • code postal

  • commune

  • géolocalisation

  • date de création

  • code APE

  • informations dirigeant

  • chiffre d’affaires et résultat lorsqu’ils sont disponibles

  • effectif

Chaque entreprise devient un item propre, prêt pour enrichissement.

6️⃣ Enrichissement automatique – Message a model (Perplexity)

Recherche automatique du site web, des contacts et des informations dirigeant via Perplexity. Les données brutes sont enrichies avec précision.

Ce node interroge Perplexity pour obtenir des informations complémentaires :

  • site internet

  • email professionnel

  • numéro de téléphone

  • nom complet du dirigeant

  • fonction exacte

  • adresse vérifiée

Le prompt est conçu pour forcer Perplexity à renvoyer uniquement du JSON, sans texte autour.
Cela facilite énormément le parsing.

fait des recherches sur internet et trouve moi le lien du site internet de cette entreprise {{ $json.siren }}  {{ $json.nom }} {{ $json.adresse }} {{ $json.dirigeant_nom }} {{ $json.dirigeant_prenoms }} {{ $json.dirigeant_qualite }} et le numéro de telephone du diregeant + son adresse email 



RENVOIE UNIQUEMENT DU JSON. NE RENVOIE PAS DE TEXTE.
NE METS PAS DE ```json OU DE COMMENTAIRES.
NE METS PAS D’INTRODUCTION NI DE CONCLUSION.


RENVOIE UNIQUEMENT DU JSON PUR.
PAS DE “content:”, PAS DE “role”, PAS DE formatage texte.
PAS D'ÉCHAPPEMENTS \n.
PAS DE BACKTICKS.
PAS D’INTRODUCTION.
PAS DE CONCLUSION.

Retourne STRICTEMENT ceci :

{
  "site_web": "",
  "telephone": "",
  "email": "",
  "nom_dirigeant": "",
  "prenom_dirigeant": "",
  "qualite_dirigeant": "",
  "adresse": "",
  "siren": ""
}


Règles obligatoires :

Ne renvoie que l’objet JSON (pas de content: avant).

Toutes les valeurs doivent être non échappées.

Aucune autre clé.

Si une donnée manque → mets "".

Le résultat doit commencer par { et finir par }.

Aucun retour à la ligne préfixé par \n.

Aucun texte autour.

7️⃣ Nettoyage de la réponse IA – Code in JavaScript1 puis Code in JavaScript2

Nettoyage de la réponse IA pour obtenir un JSON propre et standardisé. Garantit un enrichissement fiable et prêt à être stocké.

Ces deux nodes permettent de :

  • isoler la réponse générée par Perplexity

  • parser proprement le JSON

  • éviter les erreurs si l’IA renvoie un format imparfait

  • standardiser toutes les valeurs dans un objet simple

À la fin, chaque entreprise dispose d’un objet JSON parfaitement exploitable.

8️⃣ Insertion dans Airtable – Create a record

À cette étape, toutes les données sont prêtes : l’entreprise a été récupérée via l’INSEE, nettoyée, enrichie par l’IA, puis standardisée.

Vous avez maintenant vos variables finales, propres, cohérentes et parfaitement exploitables.
Elles peuvent être envoyées directement dans Airtable.

Le node Create a record sert à enregistrer chaque entreprise dans votre base.
Les champs alimentés sont :

  • nom de l’entreprise

  • site web

  • téléphone

  • email

  • adresse complète

  • SIREN

  • prénom du dirigeant

  • nom du dirigeant

  • fonction du dirigeant

Ces informations sont mises en forme automatiquement, sans aucune manipulation manuelle.

Airtable devient alors un véritable tableau de bord pour vos leads.
Tout arrive au bon endroit, prêt à être filtré, trié ou regroupé selon les besoins.

Si une aide est nécessaire pour aller plus loin structurer la base Airtable, automatiser le suivi, préparer une campagne ou optimiser toute la partie prospection notre agence Airtable peut vous accompagner.

https://www.linkedin.com/in/baptiste-fort-46873524b/
Dev Lowcode
Avatar - Subscription X Framer Template | Brix Templates

Passionné d'automatisation et d'IA, j'ai fondé Vision IA pour aider les entreprises à gagner du temps dans leurs processus

Générer des leads, c'est souvent un gros budget. Apollo coûte 49€/mois. Clay à partir de 149€/mois. Les outils de prospection sont chers.​

Pourtant, les données sont déjà disponibles. Gratuitement. Le gouvernement français met à disposition une API avec toutes les informations des entreprises. SIREN, adresse, dirigeants, secteur d'activité... tout est accessible.​

L'API Recherche d'Entreprises permet 400 appels par minute. Zéro limite de quota journalier. Aucun coût. C'est la base Sirene complète, mise à jour en temps réel par l'INSEE.​

Au lieu de payer des abonnements, on peut récupérer ces données gratuitement et les enrichir avec l'IA. Le workflow est simple : extraction depuis data.gouv.fr, enrichissement automatique, export dans le CRM.

On va construire ce système avec n8n. Tout est automatique. Les leads arrivent qualifiés dans Airtable, prêts à être contactés.

Pas le temps de lire ?

Base Airtable : BDD DATA GOUV
Workflow n8n : WORKFLOW N8N DATA GOUV

Tout est prêt à utiliser. Importez, connectez, c'est parti.

Ce qu'il faut avant de commencer

Quatre outils à configurer avant de lancer le workflow. Tout est gratuit ou avec un plan free généreux. Le setup prend 30 minutes max.

Outil

À quoi ça sert

Durée

INSEE API

Récupérer les données entreprises depuis data.gouv.fr

3 min

Airtable

Stocker et organiser les leads

10 min

Perplexity API

Enrichir automatiquement avec l'IA

5 min

n8n

Créer le workflow d'automatisation

15 min

Une fois configuré, le système tourne en autonomie.

Prêt pour la 1ere étape ?

Étape 1 : Récupérer la clé API INSEE

Étape

Détail

Aller sur portail-api.insee.fr

Ouvrez le lien dans votre navigateur.

Cliquer sur "Se connecter"

En haut à droite de la page d’accueil.

page d’accueil portail API INSEE avec bouton connexion

Choisir "CONNEXION-POUR-LES-EXTERNES"

Sur la page suivante, prenez le bouton du bas pour les utilisateurs externes.

écran identification INSEE avec bouton connexion pour les externes

Créer un compte si besoin

Cliquez sur "Enregistrement", remplissez le formulaire (nom, prénom, email, mot de passe).

formulaire inscription INSEE nom prénom email mot de passe

Activer votre compte

Ouvrez l’email reçu, cliquez sur le lien de vérification et reconnectez-vous.

écran d’attente vérification email INSEE

Accéder aux "Applications"

En haut du portail, cliquez sur "Applications" pour voir la liste de vos apps.

Créer une application

Cliquez sur "CRÉER UNE APP" (bouton bleu à droite), renseignez les informations : nom, prénom, et "n8n". Mode "Simple". Suivant.

écran création nouvelle application INSEE champ nom prénom description

Valider la création

Cliquez sur "Créer l’application".

étape finale création application INSEE validation mode simple

Aller dans le "Catalogue"

Retournez en haut, puis cliquez sur "Catalogue", cherchez "API Sirene".

catalogue API INSEE onglet recherche API Sirene

Cliquer sur "Souscrire"

En haut à droite du "API Sirene", cliquez sur "Souscrire".

bouton souscrire API Sirene INSEE choix application créée

Sélectionner votre application

Dans la liste, prenez celle que vous venez de créer. Validez.

écran sélection application pour API Sirene INSEE

Récupérer la clé API

Vos clés (consumer key + secret) s’affichent : copiez-les, elles serviront pour votre workflow.

visuel accès clés API INSEE consumer key secret à copier pour workflow

Étape 2 : Récupérer sa clé API Perplexity

Maintenant qu’on a notre clé API data.gouv, on passe à l’étape suivante : récupérer la clé API Perplexity. Cette clé nous permettra d’enrichir automatiquement nos leads avec de l’intelligence artificielle.

Rendez-vous sur le site Perplexity (perplexity.ai).

  • Connectez-vous ou créez un compte (c’est rapide et gratuit).

  • Cliquez sur “API” dans le menu de gauche.

menu perplexity onglet API pour créer une clé d’accès
  • Sélectionnez “Clés API” dans la section API.

  • Cliquez sur le bouton pour générer une nouvelle clé.

liste des clés API affichée sur perplexity après génération
  • Copiez la clé qui s’affiche.

  • L’offre gratuite vous donne 5 $ par mois, largement suffisant pour scraper 10 000 leads gratuitement.

Etape 3 creation de la base airtable

Maintenant que vous avez vos deux clés API (data.gouv et Perplexity), on va créer la base Airtable pour stocker vos leads.

Cliquez sur ce lien pour copier la base directement dans votre espace : https://airtable.com/app8J0wC6WrTYOrKN/shrLIlhgvxEIMmM9u

Une fois la base copiée, récupérez votre token API Airtable :

creation token api airtable image
  • Nommez-le "Workflow n8n"

  • Cochez les scopes : data.records:read, data.records:write, schema.bases:read

  • Dans "Access", cliquez sur "+ Add a base" et sélectionnez votre base

Exemple création token api airtable
  • Validez et copiez le token qui s'affiche

Exemple d'une clé api airtable

Etape 4 Automatiser la récupération de leads avec n8n

Maintenant que tout est en place (clés API, Airtable, Perplexity…), on peut enfin rentrer dans le cœur du système : le workflow.
Il est déjà build, il fonctionne, et on va le décortiquer calmement, partie par partie.

L’objectif :

  1. Générer toutes les pages à scraper

  2. Appeler l’API INSEE pour récupérer les entreprises

  3. Transformer proprement les données

  4. Enrichir automatiquement avec Perplexity

  5. Ranger tout dans Airtable, prêt à être contacté

On y va 👇

1️⃣ Trigger – When clicking Execute workflow

Création automatique de la liste des pages à scraper dans l’API INSEE. Une base essentielle pour récupérer plus de résultats sans limite.

C’est le point de départ.
Lorsque le bouton “Execute workflow” est cliqué dans n8n, tout le système se déclenche.
Aucune configuration particulière n’est nécessaire ici.

2️⃣ Génération des pages – Code in JavaScript (pages)

Création automatique de la liste des pages à scraper dans l’API INSEE. Une base essentielle pour récupérer plus de résultats sans limite.

Ce node génère une liste d’objets correspondant aux pages de l’API INSEE à aller chercher.

Le code utilisé :

const totalPages = 10; // Modifier ici pour récupérer plus ou moins de pages

const items = [];

for (let i = 1; i <= totalPages; i++) {
  items.push({ json: { page: i } });
}

return items;

🔍 Ce que cela produit :

  • une page 1

  • une page 2

  • une page 3

    jusqu’à la dernière page souhaitée.

📌 Pourquoi c’est nécessaire ?
Car l’API INSEE renvoie 25 entreprises maximum par page.
Pour récupérer tout un secteur ou tout un département, il faut donc appeler plusieurs pages d’affilée.

3️⃣ Boucle – Loop Over Items

Exécution d’une boucle qui envoie chaque numéro de page dans la suite du workflow. Un passage indispensable pour parcourir toutes les pages de l’API.

Ce node prend chaque page générée dans l’étape précédente (page 1, 2, 3…) et les exécute une par une.

Chaque passage dans la boucle envoie la valeur page au node HTTP Request.
Aucune configuration supplémentaire n’est à prévoir ici.

4️⃣ Appel INSEE – HTTP Request

Appel dynamique à l’API Recherche Entreprises avec filtres secteur, zone et code APE. Permet d’extraire des données officielles et fiables en temps réel.

C’est ici que n8n interroge l’API officielle :
https://recherche-entreprises.api.gouv.fr/search

✔️ Paramètres utilisés

Paramètre

À quoi il sert

Exemple

q

Mot-clé général

“immobilier”, “agence”, “sport”, “informatique”…

departement

Zone géographique

75 pour Paris, 13 pour Marseille…

activite_principale

Code APE

68.31Z (agences immobilières), 62 (informatique)…

per_page

Nombre de résultats par page

25 (maximum autorisé)

page

Numéro de la page

={{ $json.page }}

✔️ Comment choisir les bons filtres ?

1. Le paramètre q (mot-clé)

C’est le filtre le plus large.
Plus il est générique, plus le volume de leads augmente.

Exemples efficaces :

  • service

  • agence

  • conseil

  • commerce

2. Le paramètre departement

Permet de cibler une zone précise :

  • 75 = Paris

  • 69 = Lyon

  • 13 = Marseille

  • 33 = Bordeaux

Si on souhaite récupérer toute la France :
👉 Il suffit de retirer complètement ce paramètre.

3. Le paramètre activite_principale (code APE)

Très puissant mais aussi très restrictif.
Pour élargir la recherche, il est possible de ne renseigner que les deux premiers chiffres :

  • 68 → tout l’immobilier

  • 62 → tout le numérique

  • 47 → tout le commerce

Cela permet d’obtenir beaucoup plus de résultats.

4. Le paramètre page

Il est alimenté automatiquement grâce au Code Node.
Chaque passage dans la boucle envoie le numéro de la page.

🔐 Clé API INSEE
Elle est placée dans les headers :

X-INSEE-Api-Key-Integration : votre_clé_API

Obtention : https://api.insee.fr
Dans n8n, elle est directement collée dans le node HTTP Request.

5️⃣ Transformation des données – Code in JavaScript

Nettoyage et structuration des données de l’API INSEE : SIREN, dirigeant, adresse, activité principale, effectif. Chaque entreprise devient exploitable.

Ce node nettoie et restructure les données renvoyées par l’API INSEE.

Il extrait notamment :

  • nom de l’entreprise

  • SIREN

  • adresse complète

  • code postal

  • commune

  • géolocalisation

  • date de création

  • code APE

  • informations dirigeant

  • chiffre d’affaires et résultat lorsqu’ils sont disponibles

  • effectif

Chaque entreprise devient un item propre, prêt pour enrichissement.

6️⃣ Enrichissement automatique – Message a model (Perplexity)

Recherche automatique du site web, des contacts et des informations dirigeant via Perplexity. Les données brutes sont enrichies avec précision.

Ce node interroge Perplexity pour obtenir des informations complémentaires :

  • site internet

  • email professionnel

  • numéro de téléphone

  • nom complet du dirigeant

  • fonction exacte

  • adresse vérifiée

Le prompt est conçu pour forcer Perplexity à renvoyer uniquement du JSON, sans texte autour.
Cela facilite énormément le parsing.

fait des recherches sur internet et trouve moi le lien du site internet de cette entreprise {{ $json.siren }}  {{ $json.nom }} {{ $json.adresse }} {{ $json.dirigeant_nom }} {{ $json.dirigeant_prenoms }} {{ $json.dirigeant_qualite }} et le numéro de telephone du diregeant + son adresse email 



RENVOIE UNIQUEMENT DU JSON. NE RENVOIE PAS DE TEXTE.
NE METS PAS DE ```json OU DE COMMENTAIRES.
NE METS PAS D’INTRODUCTION NI DE CONCLUSION.


RENVOIE UNIQUEMENT DU JSON PUR.
PAS DE “content:”, PAS DE “role”, PAS DE formatage texte.
PAS D'ÉCHAPPEMENTS \n.
PAS DE BACKTICKS.
PAS D’INTRODUCTION.
PAS DE CONCLUSION.

Retourne STRICTEMENT ceci :

{
  "site_web": "",
  "telephone": "",
  "email": "",
  "nom_dirigeant": "",
  "prenom_dirigeant": "",
  "qualite_dirigeant": "",
  "adresse": "",
  "siren": ""
}


Règles obligatoires :

Ne renvoie que l’objet JSON (pas de content: avant).

Toutes les valeurs doivent être non échappées.

Aucune autre clé.

Si une donnée manque → mets "".

Le résultat doit commencer par { et finir par }.

Aucun retour à la ligne préfixé par \n.

Aucun texte autour.

7️⃣ Nettoyage de la réponse IA – Code in JavaScript1 puis Code in JavaScript2

Nettoyage de la réponse IA pour obtenir un JSON propre et standardisé. Garantit un enrichissement fiable et prêt à être stocké.

Ces deux nodes permettent de :

  • isoler la réponse générée par Perplexity

  • parser proprement le JSON

  • éviter les erreurs si l’IA renvoie un format imparfait

  • standardiser toutes les valeurs dans un objet simple

À la fin, chaque entreprise dispose d’un objet JSON parfaitement exploitable.

8️⃣ Insertion dans Airtable – Create a record

À cette étape, toutes les données sont prêtes : l’entreprise a été récupérée via l’INSEE, nettoyée, enrichie par l’IA, puis standardisée.

Vous avez maintenant vos variables finales, propres, cohérentes et parfaitement exploitables.
Elles peuvent être envoyées directement dans Airtable.

Le node Create a record sert à enregistrer chaque entreprise dans votre base.
Les champs alimentés sont :

  • nom de l’entreprise

  • site web

  • téléphone

  • email

  • adresse complète

  • SIREN

  • prénom du dirigeant

  • nom du dirigeant

  • fonction du dirigeant

Ces informations sont mises en forme automatiquement, sans aucune manipulation manuelle.

Airtable devient alors un véritable tableau de bord pour vos leads.
Tout arrive au bon endroit, prêt à être filtré, trié ou regroupé selon les besoins.

Si une aide est nécessaire pour aller plus loin structurer la base Airtable, automatiser le suivi, préparer une campagne ou optimiser toute la partie prospection notre agence Airtable peut vous accompagner.

https://www.linkedin.com/in/baptiste-fort-46873524b/
Dev Lowcode
Avatar - Subscription X Framer Template | Brix Templates

Passionné d'automatisation et d'IA, j'ai fondé Vision IA pour aider les entreprises à gagner du temps dans leurs processus

Abonnez-vous à

notre

newsletter

Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.

Icone pour illuster la newsletter de l'agence Vision IA

Abonnez-vous à

notre

newsletter

Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.

Icone pour illuster la newsletter de l'agence Vision IA

Générer des leads, c'est souvent un gros budget. Apollo coûte 49€/mois. Clay à partir de 149€/mois. Les outils de prospection sont chers.​

Pourtant, les données sont déjà disponibles. Gratuitement. Le gouvernement français met à disposition une API avec toutes les informations des entreprises. SIREN, adresse, dirigeants, secteur d'activité... tout est accessible.​

L'API Recherche d'Entreprises permet 400 appels par minute. Zéro limite de quota journalier. Aucun coût. C'est la base Sirene complète, mise à jour en temps réel par l'INSEE.​

Au lieu de payer des abonnements, on peut récupérer ces données gratuitement et les enrichir avec l'IA. Le workflow est simple : extraction depuis data.gouv.fr, enrichissement automatique, export dans le CRM.

On va construire ce système avec n8n. Tout est automatique. Les leads arrivent qualifiés dans Airtable, prêts à être contactés.

Pas le temps de lire ?

Base Airtable : BDD DATA GOUV
Workflow n8n : WORKFLOW N8N DATA GOUV

Tout est prêt à utiliser. Importez, connectez, c'est parti.

Ce qu'il faut avant de commencer

Quatre outils à configurer avant de lancer le workflow. Tout est gratuit ou avec un plan free généreux. Le setup prend 30 minutes max.

Outil

À quoi ça sert

Durée

INSEE API

Récupérer les données entreprises depuis data.gouv.fr

3 min

Airtable

Stocker et organiser les leads

10 min

Perplexity API

Enrichir automatiquement avec l'IA

5 min

n8n

Créer le workflow d'automatisation

15 min

Une fois configuré, le système tourne en autonomie.

Prêt pour la 1ere étape ?

Étape 1 : Récupérer la clé API INSEE

Étape

Détail

Aller sur portail-api.insee.fr

Ouvrez le lien dans votre navigateur.

Cliquer sur "Se connecter"

En haut à droite de la page d’accueil.

page d’accueil portail API INSEE avec bouton connexion

Choisir "CONNEXION-POUR-LES-EXTERNES"

Sur la page suivante, prenez le bouton du bas pour les utilisateurs externes.

écran identification INSEE avec bouton connexion pour les externes

Créer un compte si besoin

Cliquez sur "Enregistrement", remplissez le formulaire (nom, prénom, email, mot de passe).

formulaire inscription INSEE nom prénom email mot de passe

Activer votre compte

Ouvrez l’email reçu, cliquez sur le lien de vérification et reconnectez-vous.

écran d’attente vérification email INSEE

Accéder aux "Applications"

En haut du portail, cliquez sur "Applications" pour voir la liste de vos apps.

Créer une application

Cliquez sur "CRÉER UNE APP" (bouton bleu à droite), renseignez les informations : nom, prénom, et "n8n". Mode "Simple". Suivant.

écran création nouvelle application INSEE champ nom prénom description

Valider la création

Cliquez sur "Créer l’application".

étape finale création application INSEE validation mode simple

Aller dans le "Catalogue"

Retournez en haut, puis cliquez sur "Catalogue", cherchez "API Sirene".

catalogue API INSEE onglet recherche API Sirene

Cliquer sur "Souscrire"

En haut à droite du "API Sirene", cliquez sur "Souscrire".

bouton souscrire API Sirene INSEE choix application créée

Sélectionner votre application

Dans la liste, prenez celle que vous venez de créer. Validez.

écran sélection application pour API Sirene INSEE

Récupérer la clé API

Vos clés (consumer key + secret) s’affichent : copiez-les, elles serviront pour votre workflow.

visuel accès clés API INSEE consumer key secret à copier pour workflow

Étape 2 : Récupérer sa clé API Perplexity

Maintenant qu’on a notre clé API data.gouv, on passe à l’étape suivante : récupérer la clé API Perplexity. Cette clé nous permettra d’enrichir automatiquement nos leads avec de l’intelligence artificielle.

Rendez-vous sur le site Perplexity (perplexity.ai).

  • Connectez-vous ou créez un compte (c’est rapide et gratuit).

  • Cliquez sur “API” dans le menu de gauche.

menu perplexity onglet API pour créer une clé d’accès
  • Sélectionnez “Clés API” dans la section API.

  • Cliquez sur le bouton pour générer une nouvelle clé.

liste des clés API affichée sur perplexity après génération
  • Copiez la clé qui s’affiche.

  • L’offre gratuite vous donne 5 $ par mois, largement suffisant pour scraper 10 000 leads gratuitement.

Etape 3 creation de la base airtable

Maintenant que vous avez vos deux clés API (data.gouv et Perplexity), on va créer la base Airtable pour stocker vos leads.

Cliquez sur ce lien pour copier la base directement dans votre espace : https://airtable.com/app8J0wC6WrTYOrKN/shrLIlhgvxEIMmM9u

Une fois la base copiée, récupérez votre token API Airtable :

creation token api airtable image
  • Nommez-le "Workflow n8n"

  • Cochez les scopes : data.records:read, data.records:write, schema.bases:read

  • Dans "Access", cliquez sur "+ Add a base" et sélectionnez votre base

Exemple création token api airtable
  • Validez et copiez le token qui s'affiche

Exemple d'une clé api airtable

Etape 4 Automatiser la récupération de leads avec n8n

Maintenant que tout est en place (clés API, Airtable, Perplexity…), on peut enfin rentrer dans le cœur du système : le workflow.
Il est déjà build, il fonctionne, et on va le décortiquer calmement, partie par partie.

L’objectif :

  1. Générer toutes les pages à scraper

  2. Appeler l’API INSEE pour récupérer les entreprises

  3. Transformer proprement les données

  4. Enrichir automatiquement avec Perplexity

  5. Ranger tout dans Airtable, prêt à être contacté

On y va 👇

1️⃣ Trigger – When clicking Execute workflow

Création automatique de la liste des pages à scraper dans l’API INSEE. Une base essentielle pour récupérer plus de résultats sans limite.

C’est le point de départ.
Lorsque le bouton “Execute workflow” est cliqué dans n8n, tout le système se déclenche.
Aucune configuration particulière n’est nécessaire ici.

2️⃣ Génération des pages – Code in JavaScript (pages)

Création automatique de la liste des pages à scraper dans l’API INSEE. Une base essentielle pour récupérer plus de résultats sans limite.

Ce node génère une liste d’objets correspondant aux pages de l’API INSEE à aller chercher.

Le code utilisé :

const totalPages = 10; // Modifier ici pour récupérer plus ou moins de pages

const items = [];

for (let i = 1; i <= totalPages; i++) {
  items.push({ json: { page: i } });
}

return items;

🔍 Ce que cela produit :

  • une page 1

  • une page 2

  • une page 3

    jusqu’à la dernière page souhaitée.

📌 Pourquoi c’est nécessaire ?
Car l’API INSEE renvoie 25 entreprises maximum par page.
Pour récupérer tout un secteur ou tout un département, il faut donc appeler plusieurs pages d’affilée.

3️⃣ Boucle – Loop Over Items

Exécution d’une boucle qui envoie chaque numéro de page dans la suite du workflow. Un passage indispensable pour parcourir toutes les pages de l’API.

Ce node prend chaque page générée dans l’étape précédente (page 1, 2, 3…) et les exécute une par une.

Chaque passage dans la boucle envoie la valeur page au node HTTP Request.
Aucune configuration supplémentaire n’est à prévoir ici.

4️⃣ Appel INSEE – HTTP Request

Appel dynamique à l’API Recherche Entreprises avec filtres secteur, zone et code APE. Permet d’extraire des données officielles et fiables en temps réel.

C’est ici que n8n interroge l’API officielle :
https://recherche-entreprises.api.gouv.fr/search

✔️ Paramètres utilisés

Paramètre

À quoi il sert

Exemple

q

Mot-clé général

“immobilier”, “agence”, “sport”, “informatique”…

departement

Zone géographique

75 pour Paris, 13 pour Marseille…

activite_principale

Code APE

68.31Z (agences immobilières), 62 (informatique)…

per_page

Nombre de résultats par page

25 (maximum autorisé)

page

Numéro de la page

={{ $json.page }}

✔️ Comment choisir les bons filtres ?

1. Le paramètre q (mot-clé)

C’est le filtre le plus large.
Plus il est générique, plus le volume de leads augmente.

Exemples efficaces :

  • service

  • agence

  • conseil

  • commerce

2. Le paramètre departement

Permet de cibler une zone précise :

  • 75 = Paris

  • 69 = Lyon

  • 13 = Marseille

  • 33 = Bordeaux

Si on souhaite récupérer toute la France :
👉 Il suffit de retirer complètement ce paramètre.

3. Le paramètre activite_principale (code APE)

Très puissant mais aussi très restrictif.
Pour élargir la recherche, il est possible de ne renseigner que les deux premiers chiffres :

  • 68 → tout l’immobilier

  • 62 → tout le numérique

  • 47 → tout le commerce

Cela permet d’obtenir beaucoup plus de résultats.

4. Le paramètre page

Il est alimenté automatiquement grâce au Code Node.
Chaque passage dans la boucle envoie le numéro de la page.

🔐 Clé API INSEE
Elle est placée dans les headers :

X-INSEE-Api-Key-Integration : votre_clé_API

Obtention : https://api.insee.fr
Dans n8n, elle est directement collée dans le node HTTP Request.

5️⃣ Transformation des données – Code in JavaScript

Nettoyage et structuration des données de l’API INSEE : SIREN, dirigeant, adresse, activité principale, effectif. Chaque entreprise devient exploitable.

Ce node nettoie et restructure les données renvoyées par l’API INSEE.

Il extrait notamment :

  • nom de l’entreprise

  • SIREN

  • adresse complète

  • code postal

  • commune

  • géolocalisation

  • date de création

  • code APE

  • informations dirigeant

  • chiffre d’affaires et résultat lorsqu’ils sont disponibles

  • effectif

Chaque entreprise devient un item propre, prêt pour enrichissement.

6️⃣ Enrichissement automatique – Message a model (Perplexity)

Recherche automatique du site web, des contacts et des informations dirigeant via Perplexity. Les données brutes sont enrichies avec précision.

Ce node interroge Perplexity pour obtenir des informations complémentaires :

  • site internet

  • email professionnel

  • numéro de téléphone

  • nom complet du dirigeant

  • fonction exacte

  • adresse vérifiée

Le prompt est conçu pour forcer Perplexity à renvoyer uniquement du JSON, sans texte autour.
Cela facilite énormément le parsing.

fait des recherches sur internet et trouve moi le lien du site internet de cette entreprise {{ $json.siren }}  {{ $json.nom }} {{ $json.adresse }} {{ $json.dirigeant_nom }} {{ $json.dirigeant_prenoms }} {{ $json.dirigeant_qualite }} et le numéro de telephone du diregeant + son adresse email 



RENVOIE UNIQUEMENT DU JSON. NE RENVOIE PAS DE TEXTE.
NE METS PAS DE ```json OU DE COMMENTAIRES.
NE METS PAS D’INTRODUCTION NI DE CONCLUSION.


RENVOIE UNIQUEMENT DU JSON PUR.
PAS DE “content:”, PAS DE “role”, PAS DE formatage texte.
PAS D'ÉCHAPPEMENTS \n.
PAS DE BACKTICKS.
PAS D’INTRODUCTION.
PAS DE CONCLUSION.

Retourne STRICTEMENT ceci :

{
  "site_web": "",
  "telephone": "",
  "email": "",
  "nom_dirigeant": "",
  "prenom_dirigeant": "",
  "qualite_dirigeant": "",
  "adresse": "",
  "siren": ""
}


Règles obligatoires :

Ne renvoie que l’objet JSON (pas de content: avant).

Toutes les valeurs doivent être non échappées.

Aucune autre clé.

Si une donnée manque → mets "".

Le résultat doit commencer par { et finir par }.

Aucun retour à la ligne préfixé par \n.

Aucun texte autour.

7️⃣ Nettoyage de la réponse IA – Code in JavaScript1 puis Code in JavaScript2

Nettoyage de la réponse IA pour obtenir un JSON propre et standardisé. Garantit un enrichissement fiable et prêt à être stocké.

Ces deux nodes permettent de :

  • isoler la réponse générée par Perplexity

  • parser proprement le JSON

  • éviter les erreurs si l’IA renvoie un format imparfait

  • standardiser toutes les valeurs dans un objet simple

À la fin, chaque entreprise dispose d’un objet JSON parfaitement exploitable.

8️⃣ Insertion dans Airtable – Create a record

À cette étape, toutes les données sont prêtes : l’entreprise a été récupérée via l’INSEE, nettoyée, enrichie par l’IA, puis standardisée.

Vous avez maintenant vos variables finales, propres, cohérentes et parfaitement exploitables.
Elles peuvent être envoyées directement dans Airtable.

Le node Create a record sert à enregistrer chaque entreprise dans votre base.
Les champs alimentés sont :

  • nom de l’entreprise

  • site web

  • téléphone

  • email

  • adresse complète

  • SIREN

  • prénom du dirigeant

  • nom du dirigeant

  • fonction du dirigeant

Ces informations sont mises en forme automatiquement, sans aucune manipulation manuelle.

Airtable devient alors un véritable tableau de bord pour vos leads.
Tout arrive au bon endroit, prêt à être filtré, trié ou regroupé selon les besoins.

Si une aide est nécessaire pour aller plus loin structurer la base Airtable, automatiser le suivi, préparer une campagne ou optimiser toute la partie prospection notre agence Airtable peut vous accompagner.

https://www.linkedin.com/in/baptiste-fort-46873524b/
Dev Lowcode
Avatar - Subscription X Framer Template | Brix Templates

Passionné d'automatisation et d'IA, j'ai fondé Vision IA pour aider les entreprises à gagner du temps dans leurs processus

Générer des leads, c'est souvent un gros budget. Apollo coûte 49€/mois. Clay à partir de 149€/mois. Les outils de prospection sont chers.​

Pourtant, les données sont déjà disponibles. Gratuitement. Le gouvernement français met à disposition une API avec toutes les informations des entreprises. SIREN, adresse, dirigeants, secteur d'activité... tout est accessible.​

L'API Recherche d'Entreprises permet 400 appels par minute. Zéro limite de quota journalier. Aucun coût. C'est la base Sirene complète, mise à jour en temps réel par l'INSEE.​

Au lieu de payer des abonnements, on peut récupérer ces données gratuitement et les enrichir avec l'IA. Le workflow est simple : extraction depuis data.gouv.fr, enrichissement automatique, export dans le CRM.

On va construire ce système avec n8n. Tout est automatique. Les leads arrivent qualifiés dans Airtable, prêts à être contactés.

Pas le temps de lire ?

Base Airtable : BDD DATA GOUV
Workflow n8n : WORKFLOW N8N DATA GOUV

Tout est prêt à utiliser. Importez, connectez, c'est parti.

Ce qu'il faut avant de commencer

Quatre outils à configurer avant de lancer le workflow. Tout est gratuit ou avec un plan free généreux. Le setup prend 30 minutes max.

Outil

À quoi ça sert

Durée

INSEE API

Récupérer les données entreprises depuis data.gouv.fr

3 min

Airtable

Stocker et organiser les leads

10 min

Perplexity API

Enrichir automatiquement avec l'IA

5 min

n8n

Créer le workflow d'automatisation

15 min

Une fois configuré, le système tourne en autonomie.

Prêt pour la 1ere étape ?

Étape 1 : Récupérer la clé API INSEE

Étape

Détail

Aller sur portail-api.insee.fr

Ouvrez le lien dans votre navigateur.

Cliquer sur "Se connecter"

En haut à droite de la page d’accueil.

page d’accueil portail API INSEE avec bouton connexion

Choisir "CONNEXION-POUR-LES-EXTERNES"

Sur la page suivante, prenez le bouton du bas pour les utilisateurs externes.

écran identification INSEE avec bouton connexion pour les externes

Créer un compte si besoin

Cliquez sur "Enregistrement", remplissez le formulaire (nom, prénom, email, mot de passe).

formulaire inscription INSEE nom prénom email mot de passe

Activer votre compte

Ouvrez l’email reçu, cliquez sur le lien de vérification et reconnectez-vous.

écran d’attente vérification email INSEE

Accéder aux "Applications"

En haut du portail, cliquez sur "Applications" pour voir la liste de vos apps.

Créer une application

Cliquez sur "CRÉER UNE APP" (bouton bleu à droite), renseignez les informations : nom, prénom, et "n8n". Mode "Simple". Suivant.

écran création nouvelle application INSEE champ nom prénom description

Valider la création

Cliquez sur "Créer l’application".

étape finale création application INSEE validation mode simple

Aller dans le "Catalogue"

Retournez en haut, puis cliquez sur "Catalogue", cherchez "API Sirene".

catalogue API INSEE onglet recherche API Sirene

Cliquer sur "Souscrire"

En haut à droite du "API Sirene", cliquez sur "Souscrire".

bouton souscrire API Sirene INSEE choix application créée

Sélectionner votre application

Dans la liste, prenez celle que vous venez de créer. Validez.

écran sélection application pour API Sirene INSEE

Récupérer la clé API

Vos clés (consumer key + secret) s’affichent : copiez-les, elles serviront pour votre workflow.

visuel accès clés API INSEE consumer key secret à copier pour workflow

Étape 2 : Récupérer sa clé API Perplexity

Maintenant qu’on a notre clé API data.gouv, on passe à l’étape suivante : récupérer la clé API Perplexity. Cette clé nous permettra d’enrichir automatiquement nos leads avec de l’intelligence artificielle.

Rendez-vous sur le site Perplexity (perplexity.ai).

  • Connectez-vous ou créez un compte (c’est rapide et gratuit).

  • Cliquez sur “API” dans le menu de gauche.

menu perplexity onglet API pour créer une clé d’accès
  • Sélectionnez “Clés API” dans la section API.

  • Cliquez sur le bouton pour générer une nouvelle clé.

liste des clés API affichée sur perplexity après génération
  • Copiez la clé qui s’affiche.

  • L’offre gratuite vous donne 5 $ par mois, largement suffisant pour scraper 10 000 leads gratuitement.

Etape 3 creation de la base airtable

Maintenant que vous avez vos deux clés API (data.gouv et Perplexity), on va créer la base Airtable pour stocker vos leads.

Cliquez sur ce lien pour copier la base directement dans votre espace : https://airtable.com/app8J0wC6WrTYOrKN/shrLIlhgvxEIMmM9u

Une fois la base copiée, récupérez votre token API Airtable :

creation token api airtable image
  • Nommez-le "Workflow n8n"

  • Cochez les scopes : data.records:read, data.records:write, schema.bases:read

  • Dans "Access", cliquez sur "+ Add a base" et sélectionnez votre base

Exemple création token api airtable
  • Validez et copiez le token qui s'affiche

Exemple d'une clé api airtable

Etape 4 Automatiser la récupération de leads avec n8n

Maintenant que tout est en place (clés API, Airtable, Perplexity…), on peut enfin rentrer dans le cœur du système : le workflow.
Il est déjà build, il fonctionne, et on va le décortiquer calmement, partie par partie.

L’objectif :

  1. Générer toutes les pages à scraper

  2. Appeler l’API INSEE pour récupérer les entreprises

  3. Transformer proprement les données

  4. Enrichir automatiquement avec Perplexity

  5. Ranger tout dans Airtable, prêt à être contacté

On y va 👇

1️⃣ Trigger – When clicking Execute workflow

Création automatique de la liste des pages à scraper dans l’API INSEE. Une base essentielle pour récupérer plus de résultats sans limite.

C’est le point de départ.
Lorsque le bouton “Execute workflow” est cliqué dans n8n, tout le système se déclenche.
Aucune configuration particulière n’est nécessaire ici.

2️⃣ Génération des pages – Code in JavaScript (pages)

Création automatique de la liste des pages à scraper dans l’API INSEE. Une base essentielle pour récupérer plus de résultats sans limite.

Ce node génère une liste d’objets correspondant aux pages de l’API INSEE à aller chercher.

Le code utilisé :

const totalPages = 10; // Modifier ici pour récupérer plus ou moins de pages

const items = [];

for (let i = 1; i <= totalPages; i++) {
  items.push({ json: { page: i } });
}

return items;

🔍 Ce que cela produit :

  • une page 1

  • une page 2

  • une page 3

    jusqu’à la dernière page souhaitée.

📌 Pourquoi c’est nécessaire ?
Car l’API INSEE renvoie 25 entreprises maximum par page.
Pour récupérer tout un secteur ou tout un département, il faut donc appeler plusieurs pages d’affilée.

3️⃣ Boucle – Loop Over Items

Exécution d’une boucle qui envoie chaque numéro de page dans la suite du workflow. Un passage indispensable pour parcourir toutes les pages de l’API.

Ce node prend chaque page générée dans l’étape précédente (page 1, 2, 3…) et les exécute une par une.

Chaque passage dans la boucle envoie la valeur page au node HTTP Request.
Aucune configuration supplémentaire n’est à prévoir ici.

4️⃣ Appel INSEE – HTTP Request

Appel dynamique à l’API Recherche Entreprises avec filtres secteur, zone et code APE. Permet d’extraire des données officielles et fiables en temps réel.

C’est ici que n8n interroge l’API officielle :
https://recherche-entreprises.api.gouv.fr/search

✔️ Paramètres utilisés

Paramètre

À quoi il sert

Exemple

q

Mot-clé général

“immobilier”, “agence”, “sport”, “informatique”…

departement

Zone géographique

75 pour Paris, 13 pour Marseille…

activite_principale

Code APE

68.31Z (agences immobilières), 62 (informatique)…

per_page

Nombre de résultats par page

25 (maximum autorisé)

page

Numéro de la page

={{ $json.page }}

✔️ Comment choisir les bons filtres ?

1. Le paramètre q (mot-clé)

C’est le filtre le plus large.
Plus il est générique, plus le volume de leads augmente.

Exemples efficaces :

  • service

  • agence

  • conseil

  • commerce

2. Le paramètre departement

Permet de cibler une zone précise :

  • 75 = Paris

  • 69 = Lyon

  • 13 = Marseille

  • 33 = Bordeaux

Si on souhaite récupérer toute la France :
👉 Il suffit de retirer complètement ce paramètre.

3. Le paramètre activite_principale (code APE)

Très puissant mais aussi très restrictif.
Pour élargir la recherche, il est possible de ne renseigner que les deux premiers chiffres :

  • 68 → tout l’immobilier

  • 62 → tout le numérique

  • 47 → tout le commerce

Cela permet d’obtenir beaucoup plus de résultats.

4. Le paramètre page

Il est alimenté automatiquement grâce au Code Node.
Chaque passage dans la boucle envoie le numéro de la page.

🔐 Clé API INSEE
Elle est placée dans les headers :

X-INSEE-Api-Key-Integration : votre_clé_API

Obtention : https://api.insee.fr
Dans n8n, elle est directement collée dans le node HTTP Request.

5️⃣ Transformation des données – Code in JavaScript

Nettoyage et structuration des données de l’API INSEE : SIREN, dirigeant, adresse, activité principale, effectif. Chaque entreprise devient exploitable.

Ce node nettoie et restructure les données renvoyées par l’API INSEE.

Il extrait notamment :

  • nom de l’entreprise

  • SIREN

  • adresse complète

  • code postal

  • commune

  • géolocalisation

  • date de création

  • code APE

  • informations dirigeant

  • chiffre d’affaires et résultat lorsqu’ils sont disponibles

  • effectif

Chaque entreprise devient un item propre, prêt pour enrichissement.

6️⃣ Enrichissement automatique – Message a model (Perplexity)

Recherche automatique du site web, des contacts et des informations dirigeant via Perplexity. Les données brutes sont enrichies avec précision.

Ce node interroge Perplexity pour obtenir des informations complémentaires :

  • site internet

  • email professionnel

  • numéro de téléphone

  • nom complet du dirigeant

  • fonction exacte

  • adresse vérifiée

Le prompt est conçu pour forcer Perplexity à renvoyer uniquement du JSON, sans texte autour.
Cela facilite énormément le parsing.

fait des recherches sur internet et trouve moi le lien du site internet de cette entreprise {{ $json.siren }}  {{ $json.nom }} {{ $json.adresse }} {{ $json.dirigeant_nom }} {{ $json.dirigeant_prenoms }} {{ $json.dirigeant_qualite }} et le numéro de telephone du diregeant + son adresse email 



RENVOIE UNIQUEMENT DU JSON. NE RENVOIE PAS DE TEXTE.
NE METS PAS DE ```json OU DE COMMENTAIRES.
NE METS PAS D’INTRODUCTION NI DE CONCLUSION.


RENVOIE UNIQUEMENT DU JSON PUR.
PAS DE “content:”, PAS DE “role”, PAS DE formatage texte.
PAS D'ÉCHAPPEMENTS \n.
PAS DE BACKTICKS.
PAS D’INTRODUCTION.
PAS DE CONCLUSION.

Retourne STRICTEMENT ceci :

{
  "site_web": "",
  "telephone": "",
  "email": "",
  "nom_dirigeant": "",
  "prenom_dirigeant": "",
  "qualite_dirigeant": "",
  "adresse": "",
  "siren": ""
}


Règles obligatoires :

Ne renvoie que l’objet JSON (pas de content: avant).

Toutes les valeurs doivent être non échappées.

Aucune autre clé.

Si une donnée manque → mets "".

Le résultat doit commencer par { et finir par }.

Aucun retour à la ligne préfixé par \n.

Aucun texte autour.

7️⃣ Nettoyage de la réponse IA – Code in JavaScript1 puis Code in JavaScript2

Nettoyage de la réponse IA pour obtenir un JSON propre et standardisé. Garantit un enrichissement fiable et prêt à être stocké.

Ces deux nodes permettent de :

  • isoler la réponse générée par Perplexity

  • parser proprement le JSON

  • éviter les erreurs si l’IA renvoie un format imparfait

  • standardiser toutes les valeurs dans un objet simple

À la fin, chaque entreprise dispose d’un objet JSON parfaitement exploitable.

8️⃣ Insertion dans Airtable – Create a record

À cette étape, toutes les données sont prêtes : l’entreprise a été récupérée via l’INSEE, nettoyée, enrichie par l’IA, puis standardisée.

Vous avez maintenant vos variables finales, propres, cohérentes et parfaitement exploitables.
Elles peuvent être envoyées directement dans Airtable.

Le node Create a record sert à enregistrer chaque entreprise dans votre base.
Les champs alimentés sont :

  • nom de l’entreprise

  • site web

  • téléphone

  • email

  • adresse complète

  • SIREN

  • prénom du dirigeant

  • nom du dirigeant

  • fonction du dirigeant

Ces informations sont mises en forme automatiquement, sans aucune manipulation manuelle.

Airtable devient alors un véritable tableau de bord pour vos leads.
Tout arrive au bon endroit, prêt à être filtré, trié ou regroupé selon les besoins.

Si une aide est nécessaire pour aller plus loin structurer la base Airtable, automatiser le suivi, préparer une campagne ou optimiser toute la partie prospection notre agence Airtable peut vous accompagner.

Dev Lowcode
Avatar - Subscription X Framer Template | Brix Templates

Passionné d'automatisation et d'IA, j'ai fondé Vision IA pour aider les entreprises à gagner du temps dans leurs processus

Abonnez-vous à

notre

newsletter

Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.

Icone pour illuster la newsletter de l'agence Vision IA

Abonnez-vous à

notre

newsletter

Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.

Icone pour illuster la newsletter de l'agence Vision IA

Abonnez-vous à

notre

newsletter

Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.

Icone pour illuster la newsletter de l'agence Vision IA