Sophie Gonzalez
Par Sophie 11 sept. 2023

3 notions clés à maîtriser pour bien mener vos projets en IA

L’intelligence artificielle (IA), c’est le développement de systèmes informatiques capables d’exécuter des tâches généralement associées à l’intelligence humaine. Vous avez tous entendu parler de ChatGPT? C’est un exemple bien connu en IA parmi tant d’autres.

Concrètement, l’intelligence artificielle va métamorphoser les machines en assistants intelligents du quotidien, ce qui ouvre ainsi la porte à d’innombrables possibilités pour les entreprises. Les projets d’IA en affaires, qu’ils soient axés sur la recherche, le développement de produits ou l’automatisation des processus, sont monnaie courante dans bon nombre d’industries.

Comme pour tout projet, les clés du succès d’un projet en IA reposent sur de nombreux facteurs (planification rigoureuse, communication efficace…) dont certains sont spécifiques au domaine d’application du projet (travailler sur la sécurité d’une centrale électrique n’est pas la même choque que travailler sur les recommandations d’un site de vente en ligne par exemple.).

De même, pour Sophie, notre conceptrice en intelligence artificielle, pour tout projet d’IA il y a également quelques notions clés à mettre dans les mains de tous les acteurs du projet (PO, chargée de projet, analyste, développeur …) afin de maximiser les avantages de l’IA tout en maîtrisant ses risques.

1) La viabilité technologique: l’aléa de la performance

Lorsqu’on parle de projets en intelligence artificielle, il est crucial de comprendre que l’on s’aventure dans un domaine intrinsèquement non déterministe. Un projet d’intelligence artificielle se compose généralement d’un modèle ou d’un ensemble de modèles encapsulés dans un logiciel. Cette structure se divise en deux parties:

  • Une partie non déterministe (le modèle ou les modèles)
  • Une partie déterministe (pipeline de données, UI/tableaux de bord, back end)

Le plus grand déterminant de la «rentabilité» ou de la viabilité d’un projet en IA est, ce que nous appelons communément, l’aléa de performance. Étant donné que l’IA opère dans un environnement probabiliste, il est inévitable que des incertitudes relatives à la performance surgissent.

En gros, l’idée principale réside dans le fait que, même si votre modèle de prédiction est excellent, il est impossible de garantir qu’il produira des résultats corrects à 100 % du temps. Les prévisions météorologiques en sont un parfait exemple!

C’est donc important que le client comprenne qu’un modèle n’aura pas toujours raison et qu’il faut donc s’assurer que son projet est viable en dépit de cet aléa, et ce, avant même de le commencer! De plus, le marketing parfois agressif de certains fournisseurs ne permet pas de se faire une idée juste de la performance sur ses propres données.

Viabilité technologique - exemple

Conseils de pro:
Dans nos projets clients, on recommande souvent de dissocier les composantes logicielles des composantes IA. Cette séparation pourrait faire l’objet d’une petite enveloppe budgétaire initiale dédiée à une preuve de concept et serait préliminaire à l’engagement de budget sur les parties déterministes.

La séparation permet deux avantages principaux:

  • Évaluer la performance possible sur vos données et sur votre problématique.
  • Déterminer si une IA out of shelves peut être employée ou si on devrait plutôt réentraîner un modèle open source ou encore opter pour un modèle sur mesure.

Avant la signature de contrat et le démarrage de tout nouveau projet en intelligence artificielle chez Uzinakod, notre équipe pose impérativement au client des questions concernant le coût de l’erreur. Celles-ci permettent souvent à nos experts de s’assurer que le client comprend bien la dimension non déterministe de son projet.

Par exemple, nos experts en IA cherchent à savoir : «quel est le coût financier, humain ou juridique d’une prédiction erronée?» ou «qui, comment et dans quels buts seront utilisés les résultats?». Les réponses permettent souvent de faire réaliser au client qu’il ne se trouve pas dans un contexte déterministe.

De manière pragmatique, la rentabilité d’un projet en IA s’évalue souvent sur le compromis entre le coût de l’erreur + le coût d’opportunité d’un côté (= coût à ne pas réaliser le projet) et le gain permis par les prédictions correctes de l’autre. Cette évaluation aide également à déterminer le budget d’un projet.

Voici un exemple concret: afin de fournir des informations X à une autorité publique, vous devez extraire des informations personnelles identifiables d’une centaine de contrats en format PDF. Deux choix s’offrent à vous:

1. Vous demandez à un humain de le faire tout seul.

2. Vous le faites réaliser par une IA.

  • Coût d’opportunité = Montant de l’amende que vous risquez à ne rien faire
  • Coût de l’erreur = Risque encouru si l’autorité publique se rend compte que vous avez fourni par erreur des renseignements erronés
  • Gain permis par les prédictions correctes = salaire(s) du ou des employés que vous n’avez pas à mobiliser sur cette tâche fastidieuse.

Lorsqu’un projet est en cours, il est important de bien garder l’aspect ci-dessus en tête d’un point de vue stratégie de pilotage. Contrairement à la plupart des tâches de développement logiciel où l’évaluation de l’avancement de chaque fonctionnalité se base souvent sur une note positive (ça fonctionne) ou négative (ça ne fonctionne pas), les tâches en science des données sont souvent infinies. Il s’agit de se demander régulièrement si on continue pour peut-être 1% de performance supplémentaire ou si on s’arrête là.

2) Pas de data, pas de science

Il est essentiel d’obtenir des échantillons de données dès le début d’un projet, même pendant la phase de découverte des besoins du client. Un premier coup d’œil aux données aide à la prise de décisions cruciales comme le choix des modèles d’IA, la bonne compréhension des besoins et des problématiques, la détection des biais, etc.

Access & Availability

Ça peut paraître évident, dans «science de données», on retrouve le mot «données». Faire un projet en IA sans avoir accès aux données, ce ne serait pas de la science, mais plus de la magie. Bref, les données ne sont pas simplement une composante d’un projet, elles en sont le fondement.

Pas de data, pas de science

Conseils pratiques:

  • Bien indiquer dans la proposition d’échelle du temps d’un projet que les tâches relatives à l’IA ne commencent pas à la signature du contrat, mais bien lorsque les équipes ont accès aux données. Un retard dans les accès implique un retard de livraison.
  • En pratique, il est parfois compliqué d’obtenir des accès ou de faire de la mise à disposition de données quand la volumétrie est énorme. Une bonne pratique dans ce cas-là réside dans la demande d’un échantillon dès le début des discussions.

Qualité

Tous les projets en IA impliquent une phase de collecte, de nettoyage et de mise en forme des données. Cette étape est souvent sous-estimée, mais elle est pourtant cruciale.

Une façon simple de décrire la qualité des données, c’est que par essence, les données et les modèles qui sont bâtis dessus sont toujours une représentation plus ou moins bonne de la réalité. Afin que votre modèle permette de répondre à votre besoin une fois en production, il faut que la data sur laquelle il est bâti et évalué soit représentative au maximum de la réalité. Par exemple, on utilise souvent le QI comme proxy pour représenter l’intelligence des personnes, mais cette mesure est un reflet imparfait de ce qu’est l’intelligence.

Par exemple, si vous cherchez à prédire le prix de vente de votre maison, le traitement des données sera différent selon le dataset officiel des transactions mis à disposition et l’extrait de données de la section immobilière du site Kijiji. De même, il n’est pas avisé d’entraîner une IA à détecter le fonctionnement anormal d’une machine en utilisant seulement les données d’une période où vous auriez changé le nombre de pièces.

Meme modèle de données

Astuces de pro:

  • L’acquisition et/ou la collecte de données peuvent faire partie intégrante d’un projet d’IA. Par exemple, on peut venir structurer des données à partir de données non structurées, telles que les pieds carrés, le prix et le nombre de chambres dans des centaines de contrats de vente immobilière. On peut également conseiller à un client des données open source gratuites ou non, qui pourraient servir à une étude de cas.
  • Dans tous les cas, vous devez absolument prévoir les problématiques data dans votre budget.

Volumétrie

En dehors de la qualité du dataset, la volumétrie des données a un impact sur l’architecture du projet. Par exemple, appeler un modèle prédictif toutes les minutes, sur les données collectées de capteurs IoT, n’implique pas le même effort de traitement ni la même complexité d’architecture qu’une analyse sur une grande quantité de fichiers CSV mis à jour une fois par an.
Par ailleurs, souvent la taille «utile» des données disponibles est surestimée.

Par exemple, dans un projet IoT avec des données de capteurs collectées chaque seconde, on peut rapidement accumuler des giga-octets de données. Cependant, si le but est de réaliser un modèle prédictif avec la probabilité que votre machine tombe en panne demain, vous aurez quand même une seule observation d’évaluation par jour.

Conseil pratique:

  • Tenez compte très tôt des nécessités technologiques et des capacités associées qui s’imposent par des projets de streaming big data. Un ingénieur de données sera fort probablement nécessaire pour les pipelines de manipulation de données.

3) Inférence vs Prédiction

C’est une vérité générale, plus un modèle est complexe, moins il est interprétable, mais plus son potentiel pouvoir prédictif est fort!
D’un point de vue modélisation, cette distinction Inférence/Prédiction détermine si l’équipe va plutôt devoir travailler avec des méthodes de machine learning (prédiction) ou avec des méthodes de modélisation statistiques «classiques» (inférence).

En effet, le machine learning cherche toujours à obtenir la meilleure prédiction alors que la modélisation statistique est davantage tournée vers les relations entre les variables et la cible, ou entre les variables entre elles.

Par exemple, si vous avez le projet de rénover votre maison, vous allez vouloir connaître la valeur de votre bien à la revente. Si votre but est juste d’obtenir un prêt hypothéqué pour financer vos travaux, alors ce que vous cherchez, c’est la meilleure prédiction possible. En revanche, si vous cherchez à savoir si ça vaut la peine de dépenser 5000$ pour faire une salle d’eau supplémentaire, et la plus-value que ça pourrait vous faire gagner à la revente, alors là on est plutôt sur de l’inférence.

Autre exemple avec la maintenance prédictive: admettons que vous ayez une chaîne de production automatisée avec plusieurs capteurs par machine/poste le long de la chaîne. Vous pourriez vouloir un modèle permettant de déterminer avec exactitude si votre chaîne risque de tomber en panne dans les prochaines 24 heures.

Un tel modèle pourrait permettre en avance de planifier des activités de maintenance, ou d’enclencher une procédure d’arrêt d’urgence permettant de limiter les impacts d’un arrêt imprévu de la chaîne de production. En revanche, ne comptez pas sur un modèle prédictif pour connaître la nature du problème (une pièce usée ou un paramétrage mal réglé) ou pour vous indiquer de quelle machine précisément vient le problème.

De même, un modèle prédictif ne pourra pas non plus permettre de savoir de quel pourcentage vous pouvez augmenter la cadence d’une machine avant d’augmenter sensiblement son pourcentage de panne… Toutes ces considérations relèvent plutôt de l’inférence.

Conseils pratiques:

  • De manière générale, un client va toujours commencer par dire que ce qu’il désire, c’est un modèle au plus fort pouvoir prédictif possible. Par expérience, c’est rarement ce dont il a besoin, les modèles au fort pouvoir explicatif sont en général beaucoup plus utiles. Cela demande un fort lien avec les utilisateurs finaux du modèle et de leur business.
  • Dans un monde parfait, on voudrait toujours faire de l’inférence et de la prédiction. Mais il est capital de comprendre que chaque type de modèle représente vraiment un projet différent du traitement de la data, jusqu’au cycle de vie du modèle et son utilisation.
Meme inference AI

Conclusion

Naviguer dans le domaine complexe de l’IA peut être intimidant. C’est pourquoi il est crucial d’avoir un partenaire fiable et expert dans le domaine.

Chez Uzinakod, nous vous guidons à chaque étape, de la planification initiale à la mise en œuvre, en posant les questions critiques qui garantiront le succès de votre projet.

Si vous cherchez à maximiser les avantages de l’IA tout en maîtrisant ses risques, n’hésitez pas à consulter nos experts en IA pour assurer la réussite de votre projet.

Articles recommandés
Publié le 21 août 2023

Actualité Techno - 4 intelligences artificielles pour maximiser votre productivité et celle de vos collègues

On a concocté une liste d’outils précieux en IA qui permettront d’accroître votre productivité au travail et qui deviendront sans nul doute, vos nouveaux alliés.

En lire plus
Publié le 5 juin 2023

Comment exploiter le plein potentiel de ses données avec l’intelligence d’affaires

À l’ère de la transformation numérique, la mise en place d’une stratégie d’intelligence d’affaires réussie confère aux entreprises un avantage concurrentiel indéniable.

En lire plus
Partager sur