Resources
19 nov. 2025
Automatiser la récupération de leads depuis data.gouv



Générer des leads, c'est souvent un gros budget. Apollo coûte 49€/mois. Clay à partir de 149€/mois. Les outils de prospection sont chers.
Pourtant, les données sont déjà disponibles. Gratuitement. Le gouvernement français met à disposition une API avec toutes les informations des entreprises. SIREN, adresse, dirigeants, secteur d'activité... tout est accessible.
L'API Recherche d'Entreprises permet 400 appels par minute. Zéro limite de quota journalier. Aucun coût. C'est la base Sirene complète, mise à jour en temps réel par l'INSEE.
Au lieu de payer des abonnements, on peut récupérer ces données gratuitement et les enrichir avec l'IA. Le workflow est simple : extraction depuis data.gouv.fr, enrichissement automatique, export dans le CRM.
On va construire ce système avec n8n. Tout est automatique. Les leads arrivent qualifiés dans Airtable, prêts à être contactés.
Pas le temps de lire ?
Base Airtable : BDD DATA GOUV
Workflow n8n : WORKFLOW N8N DATA GOUV
Tout est prêt à utiliser. Importez, connectez, c'est parti.
Ce qu'il faut avant de commencer
Quatre outils à configurer avant de lancer le workflow. Tout est gratuit ou avec un plan free généreux. Le setup prend 30 minutes max.
Outil | À quoi ça sert | Durée |
|---|---|---|
Récupérer les données entreprises depuis data.gouv.fr | 3 min | |
Stocker et organiser les leads | 10 min | |
Enrichir automatiquement avec l'IA | 5 min | |
Créer le workflow d'automatisation | 15 min |
Une fois configuré, le système tourne en autonomie.
Prêt pour la 1ere étape ?
Étape 1 : Récupérer la clé API INSEE
Étape | Détail |
|---|---|
Aller sur portail-api.insee.fr | Ouvrez le lien dans votre navigateur. |
Cliquer sur "Se connecter" | En haut à droite de la page d’accueil. ![]() |
Choisir "CONNEXION-POUR-LES-EXTERNES" | Sur la page suivante, prenez le bouton du bas pour les utilisateurs externes. ![]() |
Créer un compte si besoin | Cliquez sur "Enregistrement", remplissez le formulaire (nom, prénom, email, mot de passe). ![]() |
Activer votre compte | Ouvrez l’email reçu, cliquez sur le lien de vérification et reconnectez-vous. ![]() |
Accéder aux "Applications" | En haut du portail, cliquez sur "Applications" pour voir la liste de vos apps. ![]() |
Créer une application | Cliquez sur "CRÉER UNE APP" (bouton bleu à droite), renseignez les informations : nom, prénom, et "n8n". Mode "Simple". Suivant. ![]() |
Valider la création | Cliquez sur "Créer l’application". ![]() |
Aller dans le "Catalogue" | Retournez en haut, puis cliquez sur "Catalogue", cherchez "API Sirene". ![]() |
Cliquer sur "Souscrire" | En haut à droite du "API Sirene", cliquez sur "Souscrire". ![]() |
Sélectionner votre application | Dans la liste, prenez celle que vous venez de créer. Validez. ![]() |
Récupérer la clé API | Vos clés (consumer key + secret) s’affichent : copiez-les, elles serviront pour votre workflow. ![]() |
Étape 2 : Récupérer sa clé API Perplexity
Maintenant qu’on a notre clé API data.gouv, on passe à l’étape suivante : récupérer la clé API Perplexity. Cette clé nous permettra d’enrichir automatiquement nos leads avec de l’intelligence artificielle.
Rendez-vous sur le site Perplexity (perplexity.ai).
Connectez-vous ou créez un compte (c’est rapide et gratuit).
Cliquez sur “API” dans le menu de gauche.

Sélectionnez “Clés API” dans la section API.
Cliquez sur le bouton pour générer une nouvelle clé.

Copiez la clé qui s’affiche.
L’offre gratuite vous donne 5 $ par mois, largement suffisant pour scraper 10 000 leads gratuitement.
Etape 3 creation de la base airtable
Maintenant que vous avez vos deux clés API (data.gouv et Perplexity), on va créer la base Airtable pour stocker vos leads.
Cliquez sur ce lien pour copier la base directement dans votre espace : https://airtable.com/app8J0wC6WrTYOrKN/shrLIlhgvxEIMmM9u
Une fois la base copiée, récupérez votre token API Airtable :
Allez sur https://airtable.com/create/tokens
Cliquez sur "Create new token"

Nommez-le "Workflow n8n"
Cochez les scopes : data.records:read, data.records:write, schema.bases:read
Dans "Access", cliquez sur "+ Add a base" et sélectionnez votre base

Validez et copiez le token qui s'affiche

Etape 4 Automatiser la récupération de leads avec n8n
Maintenant que tout est en place (clés API, Airtable, Perplexity…), on peut enfin rentrer dans le cœur du système : le workflow.
Il est déjà build, il fonctionne, et on va le décortiquer calmement, partie par partie.
L’objectif :
Générer toutes les pages à scraper
Appeler l’API INSEE pour récupérer les entreprises
Transformer proprement les données
Enrichir automatiquement avec Perplexity
Ranger tout dans Airtable, prêt à être contacté
On y va 👇
1️⃣ Trigger – When clicking Execute workflow

C’est le point de départ.
Lorsque le bouton “Execute workflow” est cliqué dans n8n, tout le système se déclenche.
Aucune configuration particulière n’est nécessaire ici.
2️⃣ Génération des pages – Code in JavaScript (pages)

Ce node génère une liste d’objets correspondant aux pages de l’API INSEE à aller chercher.
Le code utilisé :
const totalPages = 10; // Modifier ici pour récupérer plus ou moins de pages const items = []; for (let i = 1; i <= totalPages; i++) { items.push({ json: { page: i } }); } return items;
🔍 Ce que cela produit :
une page 1
une page 2
une page 3
…
jusqu’à la dernière page souhaitée.
📌 Pourquoi c’est nécessaire ?
Car l’API INSEE renvoie 25 entreprises maximum par page.
Pour récupérer tout un secteur ou tout un département, il faut donc appeler plusieurs pages d’affilée.
3️⃣ Boucle – Loop Over Items

Ce node prend chaque page générée dans l’étape précédente (page 1, 2, 3…) et les exécute une par une.
Chaque passage dans la boucle envoie la valeur page au node HTTP Request.
Aucune configuration supplémentaire n’est à prévoir ici.
4️⃣ Appel INSEE – HTTP Request

C’est ici que n8n interroge l’API officielle :https://recherche-entreprises.api.gouv.fr/search
✔️ Paramètres utilisés
Paramètre | À quoi il sert | Exemple |
|---|---|---|
| Mot-clé général | “immobilier”, “agence”, “sport”, “informatique”… |
| Zone géographique | 75 pour Paris, 13 pour Marseille… |
| Code APE | 68.31Z (agences immobilières), 62 (informatique)… |
| Nombre de résultats par page | 25 (maximum autorisé) |
| Numéro de la page |
|
✔️ Comment choisir les bons filtres ?
1. Le paramètre q (mot-clé)
C’est le filtre le plus large.
Plus il est générique, plus le volume de leads augmente.
Exemples efficaces :
service
agence
conseil
commerce
2. Le paramètre departement
Permet de cibler une zone précise :
75 = Paris
69 = Lyon
13 = Marseille
33 = Bordeaux
Si on souhaite récupérer toute la France :
👉 Il suffit de retirer complètement ce paramètre.
3. Le paramètre activite_principale (code APE)
Très puissant mais aussi très restrictif.
Pour élargir la recherche, il est possible de ne renseigner que les deux premiers chiffres :
68→ tout l’immobilier62→ tout le numérique47→ tout le commerce
Cela permet d’obtenir beaucoup plus de résultats.
4. Le paramètre page
Il est alimenté automatiquement grâce au Code Node.
Chaque passage dans la boucle envoie le numéro de la page.
🔐 Clé API INSEE
Elle est placée dans les headers :
X-INSEE-Api-Key-Integration : votre_clé_API
Obtention : https://api.insee.fr
Dans n8n, elle est directement collée dans le node HTTP Request.
5️⃣ Transformation des données – Code in JavaScript

Ce node nettoie et restructure les données renvoyées par l’API INSEE.
Il extrait notamment :
nom de l’entreprise
SIREN
adresse complète
code postal
commune
géolocalisation
date de création
code APE
informations dirigeant
chiffre d’affaires et résultat lorsqu’ils sont disponibles
effectif
Chaque entreprise devient un item propre, prêt pour enrichissement.
6️⃣ Enrichissement automatique – Message a model (Perplexity)

Ce node interroge Perplexity pour obtenir des informations complémentaires :
site internet
email professionnel
numéro de téléphone
nom complet du dirigeant
fonction exacte
adresse vérifiée
Le prompt est conçu pour forcer Perplexity à renvoyer uniquement du JSON, sans texte autour.
Cela facilite énormément le parsing.
fait des recherches sur internet et trouve moi le lien du site internet de cette entreprise {{ $json.siren }} {{ $json.nom }} {{ $json.adresse }} {{ $json.dirigeant_nom }} {{ $json.dirigeant_prenoms }} {{ $json.dirigeant_qualite }} et le numéro de telephone du diregeant + son adresse email RENVOIE UNIQUEMENT DU JSON. NE RENVOIE PAS DE TEXTE. NE METS PAS DE ```json OU DE COMMENTAIRES. NE METS PAS D’INTRODUCTION NI DE CONCLUSION. RENVOIE UNIQUEMENT DU JSON PUR. PAS DE “content:”, PAS DE “role”, PAS DE formatage texte. PAS D'ÉCHAPPEMENTS \n. PAS DE BACKTICKS. PAS D’INTRODUCTION. PAS DE CONCLUSION. Retourne STRICTEMENT ceci : { "site_web": "", "telephone": "", "email": "", "nom_dirigeant": "", "prenom_dirigeant": "", "qualite_dirigeant": "", "adresse": "", "siren": "" } Règles obligatoires : Ne renvoie que l’objet JSON (pas de content: avant). Toutes les valeurs doivent être non échappées. Aucune autre clé. Si une donnée manque → mets "". Le résultat doit commencer par { et finir par }. Aucun retour à la ligne préfixé par \n. Aucun texte autour.
7️⃣ Nettoyage de la réponse IA – Code in JavaScript1 puis Code in JavaScript2

Ces deux nodes permettent de :
isoler la réponse générée par Perplexity
parser proprement le JSON
éviter les erreurs si l’IA renvoie un format imparfait
standardiser toutes les valeurs dans un objet simple
À la fin, chaque entreprise dispose d’un objet JSON parfaitement exploitable.
8️⃣ Insertion dans Airtable – Create a record
À cette étape, toutes les données sont prêtes : l’entreprise a été récupérée via l’INSEE, nettoyée, enrichie par l’IA, puis standardisée.
Vous avez maintenant vos variables finales, propres, cohérentes et parfaitement exploitables.
Elles peuvent être envoyées directement dans Airtable.
Le node Create a record sert à enregistrer chaque entreprise dans votre base.
Les champs alimentés sont :
nom de l’entreprise
site web
téléphone
email
adresse complète
SIREN
prénom du dirigeant
nom du dirigeant
fonction du dirigeant
Ces informations sont mises en forme automatiquement, sans aucune manipulation manuelle.
Airtable devient alors un véritable tableau de bord pour vos leads.
Tout arrive au bon endroit, prêt à être filtré, trié ou regroupé selon les besoins.
Si une aide est nécessaire pour aller plus loin structurer la base Airtable, automatiser le suivi, préparer une campagne ou optimiser toute la partie prospection notre agence Airtable peut vous accompagner.
Générer des leads, c'est souvent un gros budget. Apollo coûte 49€/mois. Clay à partir de 149€/mois. Les outils de prospection sont chers.
Pourtant, les données sont déjà disponibles. Gratuitement. Le gouvernement français met à disposition une API avec toutes les informations des entreprises. SIREN, adresse, dirigeants, secteur d'activité... tout est accessible.
L'API Recherche d'Entreprises permet 400 appels par minute. Zéro limite de quota journalier. Aucun coût. C'est la base Sirene complète, mise à jour en temps réel par l'INSEE.
Au lieu de payer des abonnements, on peut récupérer ces données gratuitement et les enrichir avec l'IA. Le workflow est simple : extraction depuis data.gouv.fr, enrichissement automatique, export dans le CRM.
On va construire ce système avec n8n. Tout est automatique. Les leads arrivent qualifiés dans Airtable, prêts à être contactés.
Pas le temps de lire ?
Base Airtable : BDD DATA GOUV
Workflow n8n : WORKFLOW N8N DATA GOUV
Tout est prêt à utiliser. Importez, connectez, c'est parti.
Ce qu'il faut avant de commencer
Quatre outils à configurer avant de lancer le workflow. Tout est gratuit ou avec un plan free généreux. Le setup prend 30 minutes max.
Outil | À quoi ça sert | Durée |
|---|---|---|
Récupérer les données entreprises depuis data.gouv.fr | 3 min | |
Stocker et organiser les leads | 10 min | |
Enrichir automatiquement avec l'IA | 5 min | |
Créer le workflow d'automatisation | 15 min |
Une fois configuré, le système tourne en autonomie.
Prêt pour la 1ere étape ?
Étape 1 : Récupérer la clé API INSEE
Étape | Détail |
|---|---|
Aller sur portail-api.insee.fr | Ouvrez le lien dans votre navigateur. |
Cliquer sur "Se connecter" | En haut à droite de la page d’accueil. ![]() |
Choisir "CONNEXION-POUR-LES-EXTERNES" | Sur la page suivante, prenez le bouton du bas pour les utilisateurs externes. ![]() |
Créer un compte si besoin | Cliquez sur "Enregistrement", remplissez le formulaire (nom, prénom, email, mot de passe). ![]() |
Activer votre compte | Ouvrez l’email reçu, cliquez sur le lien de vérification et reconnectez-vous. ![]() |
Accéder aux "Applications" | En haut du portail, cliquez sur "Applications" pour voir la liste de vos apps. ![]() |
Créer une application | Cliquez sur "CRÉER UNE APP" (bouton bleu à droite), renseignez les informations : nom, prénom, et "n8n". Mode "Simple". Suivant. ![]() |
Valider la création | Cliquez sur "Créer l’application". ![]() |
Aller dans le "Catalogue" | Retournez en haut, puis cliquez sur "Catalogue", cherchez "API Sirene". ![]() |
Cliquer sur "Souscrire" | En haut à droite du "API Sirene", cliquez sur "Souscrire". ![]() |
Sélectionner votre application | Dans la liste, prenez celle que vous venez de créer. Validez. ![]() |
Récupérer la clé API | Vos clés (consumer key + secret) s’affichent : copiez-les, elles serviront pour votre workflow. ![]() |
Étape 2 : Récupérer sa clé API Perplexity
Maintenant qu’on a notre clé API data.gouv, on passe à l’étape suivante : récupérer la clé API Perplexity. Cette clé nous permettra d’enrichir automatiquement nos leads avec de l’intelligence artificielle.
Rendez-vous sur le site Perplexity (perplexity.ai).
Connectez-vous ou créez un compte (c’est rapide et gratuit).
Cliquez sur “API” dans le menu de gauche.

Sélectionnez “Clés API” dans la section API.
Cliquez sur le bouton pour générer une nouvelle clé.

Copiez la clé qui s’affiche.
L’offre gratuite vous donne 5 $ par mois, largement suffisant pour scraper 10 000 leads gratuitement.
Etape 3 creation de la base airtable
Maintenant que vous avez vos deux clés API (data.gouv et Perplexity), on va créer la base Airtable pour stocker vos leads.
Cliquez sur ce lien pour copier la base directement dans votre espace : https://airtable.com/app8J0wC6WrTYOrKN/shrLIlhgvxEIMmM9u
Une fois la base copiée, récupérez votre token API Airtable :
Allez sur https://airtable.com/create/tokens
Cliquez sur "Create new token"

Nommez-le "Workflow n8n"
Cochez les scopes : data.records:read, data.records:write, schema.bases:read
Dans "Access", cliquez sur "+ Add a base" et sélectionnez votre base

Validez et copiez le token qui s'affiche

Etape 4 Automatiser la récupération de leads avec n8n
Maintenant que tout est en place (clés API, Airtable, Perplexity…), on peut enfin rentrer dans le cœur du système : le workflow.
Il est déjà build, il fonctionne, et on va le décortiquer calmement, partie par partie.
L’objectif :
Générer toutes les pages à scraper
Appeler l’API INSEE pour récupérer les entreprises
Transformer proprement les données
Enrichir automatiquement avec Perplexity
Ranger tout dans Airtable, prêt à être contacté
On y va 👇
1️⃣ Trigger – When clicking Execute workflow

C’est le point de départ.
Lorsque le bouton “Execute workflow” est cliqué dans n8n, tout le système se déclenche.
Aucune configuration particulière n’est nécessaire ici.
2️⃣ Génération des pages – Code in JavaScript (pages)

Ce node génère une liste d’objets correspondant aux pages de l’API INSEE à aller chercher.
Le code utilisé :
const totalPages = 10; // Modifier ici pour récupérer plus ou moins de pages const items = []; for (let i = 1; i <= totalPages; i++) { items.push({ json: { page: i } }); } return items;
🔍 Ce que cela produit :
une page 1
une page 2
une page 3
…
jusqu’à la dernière page souhaitée.
📌 Pourquoi c’est nécessaire ?
Car l’API INSEE renvoie 25 entreprises maximum par page.
Pour récupérer tout un secteur ou tout un département, il faut donc appeler plusieurs pages d’affilée.
3️⃣ Boucle – Loop Over Items

Ce node prend chaque page générée dans l’étape précédente (page 1, 2, 3…) et les exécute une par une.
Chaque passage dans la boucle envoie la valeur page au node HTTP Request.
Aucune configuration supplémentaire n’est à prévoir ici.
4️⃣ Appel INSEE – HTTP Request

C’est ici que n8n interroge l’API officielle :https://recherche-entreprises.api.gouv.fr/search
✔️ Paramètres utilisés
Paramètre | À quoi il sert | Exemple |
|---|---|---|
| Mot-clé général | “immobilier”, “agence”, “sport”, “informatique”… |
| Zone géographique | 75 pour Paris, 13 pour Marseille… |
| Code APE | 68.31Z (agences immobilières), 62 (informatique)… |
| Nombre de résultats par page | 25 (maximum autorisé) |
| Numéro de la page |
|
✔️ Comment choisir les bons filtres ?
1. Le paramètre q (mot-clé)
C’est le filtre le plus large.
Plus il est générique, plus le volume de leads augmente.
Exemples efficaces :
service
agence
conseil
commerce
2. Le paramètre departement
Permet de cibler une zone précise :
75 = Paris
69 = Lyon
13 = Marseille
33 = Bordeaux
Si on souhaite récupérer toute la France :
👉 Il suffit de retirer complètement ce paramètre.
3. Le paramètre activite_principale (code APE)
Très puissant mais aussi très restrictif.
Pour élargir la recherche, il est possible de ne renseigner que les deux premiers chiffres :
68→ tout l’immobilier62→ tout le numérique47→ tout le commerce
Cela permet d’obtenir beaucoup plus de résultats.
4. Le paramètre page
Il est alimenté automatiquement grâce au Code Node.
Chaque passage dans la boucle envoie le numéro de la page.
🔐 Clé API INSEE
Elle est placée dans les headers :
X-INSEE-Api-Key-Integration : votre_clé_API
Obtention : https://api.insee.fr
Dans n8n, elle est directement collée dans le node HTTP Request.
5️⃣ Transformation des données – Code in JavaScript

Ce node nettoie et restructure les données renvoyées par l’API INSEE.
Il extrait notamment :
nom de l’entreprise
SIREN
adresse complète
code postal
commune
géolocalisation
date de création
code APE
informations dirigeant
chiffre d’affaires et résultat lorsqu’ils sont disponibles
effectif
Chaque entreprise devient un item propre, prêt pour enrichissement.
6️⃣ Enrichissement automatique – Message a model (Perplexity)

Ce node interroge Perplexity pour obtenir des informations complémentaires :
site internet
email professionnel
numéro de téléphone
nom complet du dirigeant
fonction exacte
adresse vérifiée
Le prompt est conçu pour forcer Perplexity à renvoyer uniquement du JSON, sans texte autour.
Cela facilite énormément le parsing.
fait des recherches sur internet et trouve moi le lien du site internet de cette entreprise {{ $json.siren }} {{ $json.nom }} {{ $json.adresse }} {{ $json.dirigeant_nom }} {{ $json.dirigeant_prenoms }} {{ $json.dirigeant_qualite }} et le numéro de telephone du diregeant + son adresse email RENVOIE UNIQUEMENT DU JSON. NE RENVOIE PAS DE TEXTE. NE METS PAS DE ```json OU DE COMMENTAIRES. NE METS PAS D’INTRODUCTION NI DE CONCLUSION. RENVOIE UNIQUEMENT DU JSON PUR. PAS DE “content:”, PAS DE “role”, PAS DE formatage texte. PAS D'ÉCHAPPEMENTS \n. PAS DE BACKTICKS. PAS D’INTRODUCTION. PAS DE CONCLUSION. Retourne STRICTEMENT ceci : { "site_web": "", "telephone": "", "email": "", "nom_dirigeant": "", "prenom_dirigeant": "", "qualite_dirigeant": "", "adresse": "", "siren": "" } Règles obligatoires : Ne renvoie que l’objet JSON (pas de content: avant). Toutes les valeurs doivent être non échappées. Aucune autre clé. Si une donnée manque → mets "". Le résultat doit commencer par { et finir par }. Aucun retour à la ligne préfixé par \n. Aucun texte autour.
7️⃣ Nettoyage de la réponse IA – Code in JavaScript1 puis Code in JavaScript2

Ces deux nodes permettent de :
isoler la réponse générée par Perplexity
parser proprement le JSON
éviter les erreurs si l’IA renvoie un format imparfait
standardiser toutes les valeurs dans un objet simple
À la fin, chaque entreprise dispose d’un objet JSON parfaitement exploitable.
8️⃣ Insertion dans Airtable – Create a record
À cette étape, toutes les données sont prêtes : l’entreprise a été récupérée via l’INSEE, nettoyée, enrichie par l’IA, puis standardisée.
Vous avez maintenant vos variables finales, propres, cohérentes et parfaitement exploitables.
Elles peuvent être envoyées directement dans Airtable.
Le node Create a record sert à enregistrer chaque entreprise dans votre base.
Les champs alimentés sont :
nom de l’entreprise
site web
téléphone
email
adresse complète
SIREN
prénom du dirigeant
nom du dirigeant
fonction du dirigeant
Ces informations sont mises en forme automatiquement, sans aucune manipulation manuelle.
Airtable devient alors un véritable tableau de bord pour vos leads.
Tout arrive au bon endroit, prêt à être filtré, trié ou regroupé selon les besoins.
Si une aide est nécessaire pour aller plus loin structurer la base Airtable, automatiser le suivi, préparer une campagne ou optimiser toute la partie prospection notre agence Airtable peut vous accompagner.
Abonnez-vous à
notre
newsletter
Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.
Abonnez-vous à
notre
newsletter
Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.
Générer des leads, c'est souvent un gros budget. Apollo coûte 49€/mois. Clay à partir de 149€/mois. Les outils de prospection sont chers.
Pourtant, les données sont déjà disponibles. Gratuitement. Le gouvernement français met à disposition une API avec toutes les informations des entreprises. SIREN, adresse, dirigeants, secteur d'activité... tout est accessible.
L'API Recherche d'Entreprises permet 400 appels par minute. Zéro limite de quota journalier. Aucun coût. C'est la base Sirene complète, mise à jour en temps réel par l'INSEE.
Au lieu de payer des abonnements, on peut récupérer ces données gratuitement et les enrichir avec l'IA. Le workflow est simple : extraction depuis data.gouv.fr, enrichissement automatique, export dans le CRM.
On va construire ce système avec n8n. Tout est automatique. Les leads arrivent qualifiés dans Airtable, prêts à être contactés.
Pas le temps de lire ?
Base Airtable : BDD DATA GOUV
Workflow n8n : WORKFLOW N8N DATA GOUV
Tout est prêt à utiliser. Importez, connectez, c'est parti.
Ce qu'il faut avant de commencer
Quatre outils à configurer avant de lancer le workflow. Tout est gratuit ou avec un plan free généreux. Le setup prend 30 minutes max.
Outil | À quoi ça sert | Durée |
|---|---|---|
Récupérer les données entreprises depuis data.gouv.fr | 3 min | |
Stocker et organiser les leads | 10 min | |
Enrichir automatiquement avec l'IA | 5 min | |
Créer le workflow d'automatisation | 15 min |
Une fois configuré, le système tourne en autonomie.
Prêt pour la 1ere étape ?
Étape 1 : Récupérer la clé API INSEE
Étape | Détail |
|---|---|
Aller sur portail-api.insee.fr | Ouvrez le lien dans votre navigateur. |
Cliquer sur "Se connecter" | En haut à droite de la page d’accueil. ![]() |
Choisir "CONNEXION-POUR-LES-EXTERNES" | Sur la page suivante, prenez le bouton du bas pour les utilisateurs externes. ![]() |
Créer un compte si besoin | Cliquez sur "Enregistrement", remplissez le formulaire (nom, prénom, email, mot de passe). ![]() |
Activer votre compte | Ouvrez l’email reçu, cliquez sur le lien de vérification et reconnectez-vous. ![]() |
Accéder aux "Applications" | En haut du portail, cliquez sur "Applications" pour voir la liste de vos apps. ![]() |
Créer une application | Cliquez sur "CRÉER UNE APP" (bouton bleu à droite), renseignez les informations : nom, prénom, et "n8n". Mode "Simple". Suivant. ![]() |
Valider la création | Cliquez sur "Créer l’application". ![]() |
Aller dans le "Catalogue" | Retournez en haut, puis cliquez sur "Catalogue", cherchez "API Sirene". ![]() |
Cliquer sur "Souscrire" | En haut à droite du "API Sirene", cliquez sur "Souscrire". ![]() |
Sélectionner votre application | Dans la liste, prenez celle que vous venez de créer. Validez. ![]() |
Récupérer la clé API | Vos clés (consumer key + secret) s’affichent : copiez-les, elles serviront pour votre workflow. ![]() |
Étape 2 : Récupérer sa clé API Perplexity
Maintenant qu’on a notre clé API data.gouv, on passe à l’étape suivante : récupérer la clé API Perplexity. Cette clé nous permettra d’enrichir automatiquement nos leads avec de l’intelligence artificielle.
Rendez-vous sur le site Perplexity (perplexity.ai).
Connectez-vous ou créez un compte (c’est rapide et gratuit).
Cliquez sur “API” dans le menu de gauche.

Sélectionnez “Clés API” dans la section API.
Cliquez sur le bouton pour générer une nouvelle clé.

Copiez la clé qui s’affiche.
L’offre gratuite vous donne 5 $ par mois, largement suffisant pour scraper 10 000 leads gratuitement.
Etape 3 creation de la base airtable
Maintenant que vous avez vos deux clés API (data.gouv et Perplexity), on va créer la base Airtable pour stocker vos leads.
Cliquez sur ce lien pour copier la base directement dans votre espace : https://airtable.com/app8J0wC6WrTYOrKN/shrLIlhgvxEIMmM9u
Une fois la base copiée, récupérez votre token API Airtable :
Allez sur https://airtable.com/create/tokens
Cliquez sur "Create new token"

Nommez-le "Workflow n8n"
Cochez les scopes : data.records:read, data.records:write, schema.bases:read
Dans "Access", cliquez sur "+ Add a base" et sélectionnez votre base

Validez et copiez le token qui s'affiche

Etape 4 Automatiser la récupération de leads avec n8n
Maintenant que tout est en place (clés API, Airtable, Perplexity…), on peut enfin rentrer dans le cœur du système : le workflow.
Il est déjà build, il fonctionne, et on va le décortiquer calmement, partie par partie.
L’objectif :
Générer toutes les pages à scraper
Appeler l’API INSEE pour récupérer les entreprises
Transformer proprement les données
Enrichir automatiquement avec Perplexity
Ranger tout dans Airtable, prêt à être contacté
On y va 👇
1️⃣ Trigger – When clicking Execute workflow

C’est le point de départ.
Lorsque le bouton “Execute workflow” est cliqué dans n8n, tout le système se déclenche.
Aucune configuration particulière n’est nécessaire ici.
2️⃣ Génération des pages – Code in JavaScript (pages)

Ce node génère une liste d’objets correspondant aux pages de l’API INSEE à aller chercher.
Le code utilisé :
const totalPages = 10; // Modifier ici pour récupérer plus ou moins de pages const items = []; for (let i = 1; i <= totalPages; i++) { items.push({ json: { page: i } }); } return items;
🔍 Ce que cela produit :
une page 1
une page 2
une page 3
…
jusqu’à la dernière page souhaitée.
📌 Pourquoi c’est nécessaire ?
Car l’API INSEE renvoie 25 entreprises maximum par page.
Pour récupérer tout un secteur ou tout un département, il faut donc appeler plusieurs pages d’affilée.
3️⃣ Boucle – Loop Over Items

Ce node prend chaque page générée dans l’étape précédente (page 1, 2, 3…) et les exécute une par une.
Chaque passage dans la boucle envoie la valeur page au node HTTP Request.
Aucune configuration supplémentaire n’est à prévoir ici.
4️⃣ Appel INSEE – HTTP Request

C’est ici que n8n interroge l’API officielle :https://recherche-entreprises.api.gouv.fr/search
✔️ Paramètres utilisés
Paramètre | À quoi il sert | Exemple |
|---|---|---|
| Mot-clé général | “immobilier”, “agence”, “sport”, “informatique”… |
| Zone géographique | 75 pour Paris, 13 pour Marseille… |
| Code APE | 68.31Z (agences immobilières), 62 (informatique)… |
| Nombre de résultats par page | 25 (maximum autorisé) |
| Numéro de la page |
|
✔️ Comment choisir les bons filtres ?
1. Le paramètre q (mot-clé)
C’est le filtre le plus large.
Plus il est générique, plus le volume de leads augmente.
Exemples efficaces :
service
agence
conseil
commerce
2. Le paramètre departement
Permet de cibler une zone précise :
75 = Paris
69 = Lyon
13 = Marseille
33 = Bordeaux
Si on souhaite récupérer toute la France :
👉 Il suffit de retirer complètement ce paramètre.
3. Le paramètre activite_principale (code APE)
Très puissant mais aussi très restrictif.
Pour élargir la recherche, il est possible de ne renseigner que les deux premiers chiffres :
68→ tout l’immobilier62→ tout le numérique47→ tout le commerce
Cela permet d’obtenir beaucoup plus de résultats.
4. Le paramètre page
Il est alimenté automatiquement grâce au Code Node.
Chaque passage dans la boucle envoie le numéro de la page.
🔐 Clé API INSEE
Elle est placée dans les headers :
X-INSEE-Api-Key-Integration : votre_clé_API
Obtention : https://api.insee.fr
Dans n8n, elle est directement collée dans le node HTTP Request.
5️⃣ Transformation des données – Code in JavaScript

Ce node nettoie et restructure les données renvoyées par l’API INSEE.
Il extrait notamment :
nom de l’entreprise
SIREN
adresse complète
code postal
commune
géolocalisation
date de création
code APE
informations dirigeant
chiffre d’affaires et résultat lorsqu’ils sont disponibles
effectif
Chaque entreprise devient un item propre, prêt pour enrichissement.
6️⃣ Enrichissement automatique – Message a model (Perplexity)

Ce node interroge Perplexity pour obtenir des informations complémentaires :
site internet
email professionnel
numéro de téléphone
nom complet du dirigeant
fonction exacte
adresse vérifiée
Le prompt est conçu pour forcer Perplexity à renvoyer uniquement du JSON, sans texte autour.
Cela facilite énormément le parsing.
fait des recherches sur internet et trouve moi le lien du site internet de cette entreprise {{ $json.siren }} {{ $json.nom }} {{ $json.adresse }} {{ $json.dirigeant_nom }} {{ $json.dirigeant_prenoms }} {{ $json.dirigeant_qualite }} et le numéro de telephone du diregeant + son adresse email RENVOIE UNIQUEMENT DU JSON. NE RENVOIE PAS DE TEXTE. NE METS PAS DE ```json OU DE COMMENTAIRES. NE METS PAS D’INTRODUCTION NI DE CONCLUSION. RENVOIE UNIQUEMENT DU JSON PUR. PAS DE “content:”, PAS DE “role”, PAS DE formatage texte. PAS D'ÉCHAPPEMENTS \n. PAS DE BACKTICKS. PAS D’INTRODUCTION. PAS DE CONCLUSION. Retourne STRICTEMENT ceci : { "site_web": "", "telephone": "", "email": "", "nom_dirigeant": "", "prenom_dirigeant": "", "qualite_dirigeant": "", "adresse": "", "siren": "" } Règles obligatoires : Ne renvoie que l’objet JSON (pas de content: avant). Toutes les valeurs doivent être non échappées. Aucune autre clé. Si une donnée manque → mets "". Le résultat doit commencer par { et finir par }. Aucun retour à la ligne préfixé par \n. Aucun texte autour.
7️⃣ Nettoyage de la réponse IA – Code in JavaScript1 puis Code in JavaScript2

Ces deux nodes permettent de :
isoler la réponse générée par Perplexity
parser proprement le JSON
éviter les erreurs si l’IA renvoie un format imparfait
standardiser toutes les valeurs dans un objet simple
À la fin, chaque entreprise dispose d’un objet JSON parfaitement exploitable.
8️⃣ Insertion dans Airtable – Create a record
À cette étape, toutes les données sont prêtes : l’entreprise a été récupérée via l’INSEE, nettoyée, enrichie par l’IA, puis standardisée.
Vous avez maintenant vos variables finales, propres, cohérentes et parfaitement exploitables.
Elles peuvent être envoyées directement dans Airtable.
Le node Create a record sert à enregistrer chaque entreprise dans votre base.
Les champs alimentés sont :
nom de l’entreprise
site web
téléphone
email
adresse complète
SIREN
prénom du dirigeant
nom du dirigeant
fonction du dirigeant
Ces informations sont mises en forme automatiquement, sans aucune manipulation manuelle.
Airtable devient alors un véritable tableau de bord pour vos leads.
Tout arrive au bon endroit, prêt à être filtré, trié ou regroupé selon les besoins.
Si une aide est nécessaire pour aller plus loin structurer la base Airtable, automatiser le suivi, préparer une campagne ou optimiser toute la partie prospection notre agence Airtable peut vous accompagner.
Générer des leads, c'est souvent un gros budget. Apollo coûte 49€/mois. Clay à partir de 149€/mois. Les outils de prospection sont chers.
Pourtant, les données sont déjà disponibles. Gratuitement. Le gouvernement français met à disposition une API avec toutes les informations des entreprises. SIREN, adresse, dirigeants, secteur d'activité... tout est accessible.
L'API Recherche d'Entreprises permet 400 appels par minute. Zéro limite de quota journalier. Aucun coût. C'est la base Sirene complète, mise à jour en temps réel par l'INSEE.
Au lieu de payer des abonnements, on peut récupérer ces données gratuitement et les enrichir avec l'IA. Le workflow est simple : extraction depuis data.gouv.fr, enrichissement automatique, export dans le CRM.
On va construire ce système avec n8n. Tout est automatique. Les leads arrivent qualifiés dans Airtable, prêts à être contactés.
Pas le temps de lire ?
Base Airtable : BDD DATA GOUV
Workflow n8n : WORKFLOW N8N DATA GOUV
Tout est prêt à utiliser. Importez, connectez, c'est parti.
Ce qu'il faut avant de commencer
Quatre outils à configurer avant de lancer le workflow. Tout est gratuit ou avec un plan free généreux. Le setup prend 30 minutes max.
Outil | À quoi ça sert | Durée |
|---|---|---|
Récupérer les données entreprises depuis data.gouv.fr | 3 min | |
Stocker et organiser les leads | 10 min | |
Enrichir automatiquement avec l'IA | 5 min | |
Créer le workflow d'automatisation | 15 min |
Une fois configuré, le système tourne en autonomie.
Prêt pour la 1ere étape ?
Étape 1 : Récupérer la clé API INSEE
Étape | Détail |
|---|---|
Aller sur portail-api.insee.fr | Ouvrez le lien dans votre navigateur. |
Cliquer sur "Se connecter" | En haut à droite de la page d’accueil. ![]() |
Choisir "CONNEXION-POUR-LES-EXTERNES" | Sur la page suivante, prenez le bouton du bas pour les utilisateurs externes. ![]() |
Créer un compte si besoin | Cliquez sur "Enregistrement", remplissez le formulaire (nom, prénom, email, mot de passe). ![]() |
Activer votre compte | Ouvrez l’email reçu, cliquez sur le lien de vérification et reconnectez-vous. ![]() |
Accéder aux "Applications" | En haut du portail, cliquez sur "Applications" pour voir la liste de vos apps. ![]() |
Créer une application | Cliquez sur "CRÉER UNE APP" (bouton bleu à droite), renseignez les informations : nom, prénom, et "n8n". Mode "Simple". Suivant. ![]() |
Valider la création | Cliquez sur "Créer l’application". ![]() |
Aller dans le "Catalogue" | Retournez en haut, puis cliquez sur "Catalogue", cherchez "API Sirene". ![]() |
Cliquer sur "Souscrire" | En haut à droite du "API Sirene", cliquez sur "Souscrire". ![]() |
Sélectionner votre application | Dans la liste, prenez celle que vous venez de créer. Validez. ![]() |
Récupérer la clé API | Vos clés (consumer key + secret) s’affichent : copiez-les, elles serviront pour votre workflow. ![]() |
Étape 2 : Récupérer sa clé API Perplexity
Maintenant qu’on a notre clé API data.gouv, on passe à l’étape suivante : récupérer la clé API Perplexity. Cette clé nous permettra d’enrichir automatiquement nos leads avec de l’intelligence artificielle.
Rendez-vous sur le site Perplexity (perplexity.ai).
Connectez-vous ou créez un compte (c’est rapide et gratuit).
Cliquez sur “API” dans le menu de gauche.

Sélectionnez “Clés API” dans la section API.
Cliquez sur le bouton pour générer une nouvelle clé.

Copiez la clé qui s’affiche.
L’offre gratuite vous donne 5 $ par mois, largement suffisant pour scraper 10 000 leads gratuitement.
Etape 3 creation de la base airtable
Maintenant que vous avez vos deux clés API (data.gouv et Perplexity), on va créer la base Airtable pour stocker vos leads.
Cliquez sur ce lien pour copier la base directement dans votre espace : https://airtable.com/app8J0wC6WrTYOrKN/shrLIlhgvxEIMmM9u
Une fois la base copiée, récupérez votre token API Airtable :
Allez sur https://airtable.com/create/tokens
Cliquez sur "Create new token"

Nommez-le "Workflow n8n"
Cochez les scopes : data.records:read, data.records:write, schema.bases:read
Dans "Access", cliquez sur "+ Add a base" et sélectionnez votre base

Validez et copiez le token qui s'affiche

Etape 4 Automatiser la récupération de leads avec n8n
Maintenant que tout est en place (clés API, Airtable, Perplexity…), on peut enfin rentrer dans le cœur du système : le workflow.
Il est déjà build, il fonctionne, et on va le décortiquer calmement, partie par partie.
L’objectif :
Générer toutes les pages à scraper
Appeler l’API INSEE pour récupérer les entreprises
Transformer proprement les données
Enrichir automatiquement avec Perplexity
Ranger tout dans Airtable, prêt à être contacté
On y va 👇
1️⃣ Trigger – When clicking Execute workflow

C’est le point de départ.
Lorsque le bouton “Execute workflow” est cliqué dans n8n, tout le système se déclenche.
Aucune configuration particulière n’est nécessaire ici.
2️⃣ Génération des pages – Code in JavaScript (pages)

Ce node génère une liste d’objets correspondant aux pages de l’API INSEE à aller chercher.
Le code utilisé :
const totalPages = 10; // Modifier ici pour récupérer plus ou moins de pages const items = []; for (let i = 1; i <= totalPages; i++) { items.push({ json: { page: i } }); } return items;
🔍 Ce que cela produit :
une page 1
une page 2
une page 3
…
jusqu’à la dernière page souhaitée.
📌 Pourquoi c’est nécessaire ?
Car l’API INSEE renvoie 25 entreprises maximum par page.
Pour récupérer tout un secteur ou tout un département, il faut donc appeler plusieurs pages d’affilée.
3️⃣ Boucle – Loop Over Items

Ce node prend chaque page générée dans l’étape précédente (page 1, 2, 3…) et les exécute une par une.
Chaque passage dans la boucle envoie la valeur page au node HTTP Request.
Aucune configuration supplémentaire n’est à prévoir ici.
4️⃣ Appel INSEE – HTTP Request

C’est ici que n8n interroge l’API officielle :https://recherche-entreprises.api.gouv.fr/search
✔️ Paramètres utilisés
Paramètre | À quoi il sert | Exemple |
|---|---|---|
| Mot-clé général | “immobilier”, “agence”, “sport”, “informatique”… |
| Zone géographique | 75 pour Paris, 13 pour Marseille… |
| Code APE | 68.31Z (agences immobilières), 62 (informatique)… |
| Nombre de résultats par page | 25 (maximum autorisé) |
| Numéro de la page |
|
✔️ Comment choisir les bons filtres ?
1. Le paramètre q (mot-clé)
C’est le filtre le plus large.
Plus il est générique, plus le volume de leads augmente.
Exemples efficaces :
service
agence
conseil
commerce
2. Le paramètre departement
Permet de cibler une zone précise :
75 = Paris
69 = Lyon
13 = Marseille
33 = Bordeaux
Si on souhaite récupérer toute la France :
👉 Il suffit de retirer complètement ce paramètre.
3. Le paramètre activite_principale (code APE)
Très puissant mais aussi très restrictif.
Pour élargir la recherche, il est possible de ne renseigner que les deux premiers chiffres :
68→ tout l’immobilier62→ tout le numérique47→ tout le commerce
Cela permet d’obtenir beaucoup plus de résultats.
4. Le paramètre page
Il est alimenté automatiquement grâce au Code Node.
Chaque passage dans la boucle envoie le numéro de la page.
🔐 Clé API INSEE
Elle est placée dans les headers :
X-INSEE-Api-Key-Integration : votre_clé_API
Obtention : https://api.insee.fr
Dans n8n, elle est directement collée dans le node HTTP Request.
5️⃣ Transformation des données – Code in JavaScript

Ce node nettoie et restructure les données renvoyées par l’API INSEE.
Il extrait notamment :
nom de l’entreprise
SIREN
adresse complète
code postal
commune
géolocalisation
date de création
code APE
informations dirigeant
chiffre d’affaires et résultat lorsqu’ils sont disponibles
effectif
Chaque entreprise devient un item propre, prêt pour enrichissement.
6️⃣ Enrichissement automatique – Message a model (Perplexity)

Ce node interroge Perplexity pour obtenir des informations complémentaires :
site internet
email professionnel
numéro de téléphone
nom complet du dirigeant
fonction exacte
adresse vérifiée
Le prompt est conçu pour forcer Perplexity à renvoyer uniquement du JSON, sans texte autour.
Cela facilite énormément le parsing.
fait des recherches sur internet et trouve moi le lien du site internet de cette entreprise {{ $json.siren }} {{ $json.nom }} {{ $json.adresse }} {{ $json.dirigeant_nom }} {{ $json.dirigeant_prenoms }} {{ $json.dirigeant_qualite }} et le numéro de telephone du diregeant + son adresse email RENVOIE UNIQUEMENT DU JSON. NE RENVOIE PAS DE TEXTE. NE METS PAS DE ```json OU DE COMMENTAIRES. NE METS PAS D’INTRODUCTION NI DE CONCLUSION. RENVOIE UNIQUEMENT DU JSON PUR. PAS DE “content:”, PAS DE “role”, PAS DE formatage texte. PAS D'ÉCHAPPEMENTS \n. PAS DE BACKTICKS. PAS D’INTRODUCTION. PAS DE CONCLUSION. Retourne STRICTEMENT ceci : { "site_web": "", "telephone": "", "email": "", "nom_dirigeant": "", "prenom_dirigeant": "", "qualite_dirigeant": "", "adresse": "", "siren": "" } Règles obligatoires : Ne renvoie que l’objet JSON (pas de content: avant). Toutes les valeurs doivent être non échappées. Aucune autre clé. Si une donnée manque → mets "". Le résultat doit commencer par { et finir par }. Aucun retour à la ligne préfixé par \n. Aucun texte autour.
7️⃣ Nettoyage de la réponse IA – Code in JavaScript1 puis Code in JavaScript2

Ces deux nodes permettent de :
isoler la réponse générée par Perplexity
parser proprement le JSON
éviter les erreurs si l’IA renvoie un format imparfait
standardiser toutes les valeurs dans un objet simple
À la fin, chaque entreprise dispose d’un objet JSON parfaitement exploitable.
8️⃣ Insertion dans Airtable – Create a record
À cette étape, toutes les données sont prêtes : l’entreprise a été récupérée via l’INSEE, nettoyée, enrichie par l’IA, puis standardisée.
Vous avez maintenant vos variables finales, propres, cohérentes et parfaitement exploitables.
Elles peuvent être envoyées directement dans Airtable.
Le node Create a record sert à enregistrer chaque entreprise dans votre base.
Les champs alimentés sont :
nom de l’entreprise
site web
téléphone
email
adresse complète
SIREN
prénom du dirigeant
nom du dirigeant
fonction du dirigeant
Ces informations sont mises en forme automatiquement, sans aucune manipulation manuelle.
Airtable devient alors un véritable tableau de bord pour vos leads.
Tout arrive au bon endroit, prêt à être filtré, trié ou regroupé selon les besoins.
Si une aide est nécessaire pour aller plus loin structurer la base Airtable, automatiser le suivi, préparer une campagne ou optimiser toute la partie prospection notre agence Airtable peut vous accompagner.

Passionné d'automatisation et d'IA, j'ai fondé Vision IA pour aider les entreprises à gagner du temps dans leurs processus
Abonnez-vous à
notre
newsletter
Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.
Abonnez-vous à
notre
newsletter
Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.
Abonnez-vous à
notre
newsletter
Chaque semaine : 2 articles, 1 outil IA, et des conseils faciles à appliquer.













