Illustration for the post Centraliser vos emails de veille dans Google Drive avec n8n

Stocker vos emails de veille dans Google Drive avec n8n

Par Anne-Cécile Lebrun - Co-fondatrice de LBKE

Publié le 29 octobre 2025

Commençons par un truisme assumé : la veille est essentielle, et ce quelle que soit votre activité. Mais pour un organisme de formation certifié Qualiopi comme LBKE, cette évidence devient une exigence réglementaire. Il ne suffit pas de reconnaître l’importance de la veille : il faut la structurer, l’organiser, et surtout, en produire des preuves concrètes. La démarche doit être formalisée afin de répondre précisément aux trois indicateurs du Référentiel National Qualité : la veille légale et réglementaire (indicateur 23), la veille sur les évolutions des compétences, des métiers et des emplois (indicateur 24), ainsi que la veille sur les innovations pédagogiques et technologiques (indicateur 25).

Dans notre démarche d’automatisation de nos processus, nous nous sommes donc naturellement intéressés à celui de la veille.

Conseils pratiques

Pourquoi concevoir un workflow pour la collecte de données et un workflow pour l’analyse des données ?

Pour automatiser notre veille, nous allons construire deux workflows séparés : un premier (objet de cet article) qui se concentre sur la collecte des données, et un second qui analysera ces données pour produire nos fiches de veille. Le choix de diviser le processus en plusieurs workflows relève essentiellement de deux motivations :

Première approche : enregistrer au format texte les mails de veille reçus sur votre boîte mail dans un dossier sur Google Drive

Chez LBKE, nous avons une boîte mail dédiée à la veille. Bien sûr, en vue de la prochaine étape (analyse des données), vous pourrez également alimenter ce dossier avec des documents que vous déposerez manuellement dans ce dossier.

L’idée est de transformer les mails reçus sur l’adresse email dédiée en fichiers texte dans le dossier Google Drive. Pour cela :

image illustrant le noeud Markdown dans n8n

image illustrant le noeud Google Drive dans n8n

Si vous consultez votre dossier contenant tous les fichiers source de veille, vous constaterez qu’on y trouve désormais les mails imprimés en fichiers texte.

Stocker ses mails au format texte est intéressant, toutefois en général, les informations exploitables figurent rarement dans le corps du mail, mais sont accessibles sur Internet en cliquant sur les liens disponibles dans le mail. On va donc s’intéresser à un second workflow, qui va récupérer les URLs présentes dans les mails et récupérer leur contenu au format HTML.

Deuxième approche : lister les liens présents dans les mails de veille, les filtrer, récupérer le contenu de ces liens sur Internet, et enregistrer ces documents dans votre dossier Google Drive

Tout d’abord, nous allons extraire les liens pertinents présents dans les mails des newsletters et les sauvegarder sous forme de tableau.

Une discussion avec l’IA de n8n nous a permis d’identifier les principales étapes de ce workflow :

  1. Comme pour la première approche, on déclenche le workflow à l’aide d’un nœud Google Gmail « Get many messages ». On décoche « Simplify » afin d’obtenir en sortie le HTML du mail, et notamment le champ « textAsHtml ».

  2. On extrait les liens du contenu à l’aide d’un nœud HTML, avec l’opération « Extract HTML Content ». Cet article publié sur le blog n8n présente un cas d’usage similaire, qu’il est utile de consulter.

  1. On ajoute un nœud « Split out » : en sortie du nœud précédent, les URLs de chaque mail sont regroupées dans un tableau « item ». Il y a donc autant de tableaux « item » que de mails, et chaque tableau contient toutes les URLs figurant dans le mail. On souhaite plutôt obtenir plusieurs items individuels, pour pouvoir ensuite les filtrer et les traiter un par un. Dans « Fields to split out », indiquer : le nom du tableau, item ici, puis dans « Include » : no other fields, afin de ne conserver que les URLs. On a désormais autant d’items individuels qu’il y a d’URLs dans tous les mails que vous avez reçus. Transformer notre tableau d’URLs en items individuels est indispensable avant de pouvoir les filtrer.

  2. Nœud Filter : ce nœud est important car il va vous permettre de « nettoyer » l’ensemble des liens extraits à l’étape précédente, par exemple en retirant les URLs menant aux pages d’accueil, aux liens réseaux sociaux des entreprises/organismes qui vous ont envoyé le mail, ou encore les liens de désinscription. Il y a ainsi potentiellement beaucoup de liens que vous souhaiterez supprimer. Le nombre de conditions dans le nœud « Filter » étant limité (vous ne pouvez ajouter plus de 10 conditions), il s’agit alors d’indiquer dans un tableau, dans le premier champ d’une condition, la liste des liens que vous souhaitez voir supprimés. Vous sélectionnez ensuite la condition : Array => « does not contain ». Dans le second champ de la condition vous indiquez la désignation de chacune des URLs indépendantes, soit {{ $json.item }}. Vous pouvez par ailleurs explorer les différentes conditions existantes pour choisir la plus appropriée.

image illustrant le noeud Filter dans n8n et les différentes conditions

  1. Nœud Remove Duplicates : permet de supprimer les URLs doublons.

image illustrant le noeud Remove Duplicate

  1. Nœud Limit : nous ajoutons un nœud « Limit » afin de limiter le nombre de requêtes HTTP qui seront lancées. En effet, pour l’instant, lorsque nous lançons les requêtes HTTP sur plusieurs centaines d’URLs, le nœud HTTP Request sature et ne répond plus. Nous sommes en train de réfléchir à des solutions pour éviter ce petit problème, nous éditerons cet article lorsque nous aurons mis en place la solution ! Pour le moment donc, nous fixons le nombre maximum d’URLs à 10.
  2. Nœud Markdown : pour mettre en forme le HTML.
  3. Nœud Google Drive Create file from text : il faut indiquer {{ $json.data }} dans le champ « File content ».

Conclusion : pistes de finalisation et d’amélioration

Ce premier essai pose la colonne vertébrale d’un workflow de collecte des données de veille qui va devoir s’enrichir, avant d’envisager ensuite de s’atteler à l’automatisation du processus d’analyse des données de veille. En particulier, voici les pistes d’amélioration sur lesquelles nous allons travailler :

N’hésitez pas à nous suivre sur Linkedin pour connaître la suite !

Commentez cet article sur les réseaux sociaux :

Partager sur Bluesky Partager sur X

À propos de l'auteur

Photo d'Anne-Cécile Lebrun

Anne-Cécile Lebrun est co-fondatrice de LBKE. Elle est ingénieur diplômée de Grenoble INP Génie Industriel, docteur en sciences de gestion de l'Université de Montpellier et agrégée de Sciences Économiques et Sociales.

Retrouvez-la sur LinkedIn

Vous avez apprécié cette ressource ? Découvrez toutes nos formations IA et web.

Formation recommandée :

Abonnez-vous pour recevoir les nouvelles ressources

Flux RSS