Illustration for the postBien se préparer pour rédiger un dossier CIR avec ChatGPT

Bien se préparer pour rédiger un dossier CIR avec ChatGPT

Par Eric Burel - Formateur chez LBKE

Publié le

Vous le savez probablement déjà, il n’est pas possible de rédiger un dossier complexe en utilisant directement ChatGPT ou Mistral.

Vous n’avez certainement pas envie de voir votre dossier Crédit Impôt Recherche refusé lors d’un contrôle à cause d’une erreur de l’IA !

Néanmoins, les dernières fonctionnalités des plateformes LLM, comme la possibilité d’intégrer des documents et des instructions spécifiques permettent d’obtenir de bien meilleurs résultats qu’une simple conversation avec l’IA.

LBKE est à la fois spécialiste de la rédaction technique et de la formation au développement d’agents LLM. Voici nos recommandations pour bien préparer la rédaction d’un dossier CIR ou JEI en s’aidant de ChatGPT.

Définir le niveau de confidentialité pour vos données privées

La première étape est de définir quels documents votre entreprise peut fournir à un LLM et dans quelles conditions.

Par exemple, LBKE mène des travaux de recherche dans le domaine du développement web open source. Les résultats de ces travaux sont publics et destinés à être diffusés au plus grand nombre. Nous pouvons donc utiliser un LLM ou une plateforme dont les conditions de confidentialité sont faibles, par exemple les plateformes OpenAI et Anthropic, y compris si les serveurs sont hébergés hors Europe. Leur avantage réside dans leur facilité d’utilisation, la puissance des modèles et les nombreuses fonctionnalités des plateformes.

La situation de LBKE n’est cependant pas la plus courante. Si vos données sont privées, vous pouvez tout d’abord envisager l’acquisition d’une licence appropriée pour une plateforme IA, voire une installation sur votre propre cloud. A minima, l’utilisation d’une plateforme avec hébergement en Europe, comme Mistral, est à favoriser.

Il est même possible d’héberger un modèle de langage sur le cloud pour créer votre propre plateforme interne, via GCP Vertex AI, AWS Bedrock. Vous aurez ainsi un plus grand contrôle sur la transmission des données.

Enfin, si vos documents sont hautement confidentiels, vous pouvez privilégier l’exécution locale d’un LLM open source. On peut installer un outil sur son propre ordinateur comme LM Studio, ou un serveur avec vLLM ou Ollama. Attention, il existe de nombreux équivalents à ces outils, mais tous n’ont pas le même niveau de fiabilité. Il peut être pertinent d’auditer le code des outils open source que vous installez dans votre infrastructure. Par ailleurs, il vous faudra un ordinateur très puissant, voire disposer de vos propres serveurs ou de votre propre cloud interne.

Ce travail de mise en place, qui peut se faire en coordination avec votre DSI ou une équipe de développeurs, vous aidera beaucoup à mobiliser les grands modèles de langage dans votre entreprise.

Préparer les documents utiles à la rédaction

L’usage le plus efficace d’un LLM pour rédiger un dossier Crédit Impôt Recherche consiste à lui laisser analyser vos documentations ainsi que les publications de référence de l’état de l’art académique ou industriel.

Une étape importante consiste donc à regrouper toutes les documentations pertinentes de votre entreprise, en priorisant les documents les plus synthétiques. En effet, les LLM ne peuvent pas lire des textes infiniment longs ; ils ont un contexte limité. Il faut donc privilégier les documents de synthèse pour leur fournir les grandes lignes de votre projet.

Ensuite, les résultats d’expérimentation ou la liste des expérimentations menées sont des informations très importantes pour justifier les travaux de recherche et développement réalisés durant l’année.

OpenAI propose un système de projets pour stocker des documents et fournir des instructions précises au LLM, par exemple un style d’écriture et les attendus d’un dossier CIR. Les bibliothèques/librairies sont l’équivalent pour Mistral AI.

À ces documents internes doivent s’ajouter les références bibliographiques, par exemple les publications de recherche que vous avez mobilisées durant vos travaux ou les articles de blogs industriels ou techniques d’entreprise. Les LLM peuvent être capables de synthétiser et classer ces documents. Il n’est donc pas nécessaire d’approfondir votre revue de littérature dès cette étape. Vous pouvez commencer par identifier les articles qui semblent les plus pertinents, par exemple selon leur titre.

C’est après cette étape de regroupement de la documentation que l’on peut commencer à mobiliser l’intelligence artificielle pour rédiger le dossier. Il faudra alors découper la tâche de rédaction en plusieurs sous-tâches : identifier les verrous de recherche importants que vos travaux doivent lever, mettre en avant les expérimentations, rédiger la revue de littérature, synthétiser les travaux pour retrouver les objectifs de recherche, etc.

Il n’existe pas, à ce jour, de LLM spécialisé dans la rédaction de dossiers de crédit d’impôt recherche. Cependant, LBKE travaille activement sur cette tâche. Rejoignez notre programme de R&D si vous êtes intéressé pour en savoir plus.

Garder l’humain dans la boucle

Il faut garder l’humain dans la boucle, en particulier pour les tâches en amont et en aval de l’analyse documentaire. Les consultants ont encore du travail devant eux, nous sommes loin d’une automatisation complète par l’IA !

Une étape clé avant de rédiger un dossier CIR consiste à définir les sujets éligibles au Crédit Impôt Recherche. Certains travaux, qui ont par exemple donné lieu à des publications de recherche ou des brevets, sont relativement faciles à intégrer au dispositif.

Cependant, il existe aussi des travaux de développement expérimental qui sont éligibles au CIR mais peuvent être plus difficiles à justifier d’un point de vue de la recherche et du développement. Les LLM n’ont pas une connaissance suffisamment fine du dispositif de crédit impôt recherche pour qualifier l’éligibilité des sujets de développement expérimental.

Une fois les documents collectés et l’éligibilité des projets confirmée, il reste la rédaction du dossier. Les LLM même les plus avancés n’ont pas encore un style d’écriture satisfaisant. Plusieurs étapes d’affinage sont nécessaires pour obtenir des résultats acceptables. N’oubliez pas que le dossier sera relu par un expert technique et des contrôleurs : ils ne souhaitent certainement pas être confrontés à des pans de texte écrits dans le style verbeux de ChatGPT !

Il est plus efficace de demander au LLM de produire une synthèse documentaire sur laquelle un consultant pourra s’appuyer, plutôt que d’essayer de rédiger directement le dossier de crédit impôt recherche par l’IA.

Conclusion

L’automatisation par l’IA offre des opportunités significatives pour la préparation des dossiers techniques CIR. Cependant, il est crucial de bien gérer la confidentialité des données, de préparer soigneusement les documents utiles à la rédaction et de garder l’humain dans la boucle tout au long du processus.

En suivant ces étapes, les entreprises peuvent tirer pleinement parti des LLM pour générer des dossiers CIR, JEI ou CII de qualité, tout en évitant le risque de rejet lors d’un contrôle.

LBKE s’efforce d’être à la pointe d’une nouvelle génération de sociétés de conseil AI-first. Si vous souhaitez contribuer à l’automatisation des dossiers de financement, nous vous invitons à rejoindre notre programme de R&D.

Vous avez apprécié cette ressource ?

Découvrez toutes nos formations Next.js, Astro.js et LangChain en présentiel ou en distanciel

Voir toutes les ressources

À propos de l'auteur

Photo d'Eric Burel

Eric Burel est ingénieur diplômé de l'ENSIMAG. Il est co-fondateur de LBKE et formateur web et IA.

Il partage régulièrement ses connaissances à travers des articles publiés sur Smashing Magazine et sur son blog. Vous le croiserez sûrement au détour d'un meetup sur Montpellier !

En savoir plus sur Eric Burel

Partager sur Bluesky Partager sur X
Flux RSS