Par Adrien 18 juin 2021

L’intelligence artificielle appliquée aux données temporelles – Partie 2/2

L’utilisation de modèles d’intelligence artificielle pour la prédiction de données temporelles

Depuis plusieurs années, il existe de nombreuses techniques de prévision de données temporelles, dont certaines sont très simples et d’autres beaucoup plus complexes, comme les réseaux de neurones. Pour appliquer efficacement ces modèles d’intelligence artificielle, les séries de données utilisées doivent être bien nettoyées et préparées en amont afin de fournir aux modèles les données les plus qualitatives possibles.

En effet, la plupart des modèles IA ne sont pas conçus pour traiter les valeurs manquantes ou mal structurées. Découvrez dans la première partie de cet article les différentes méthodes de préparation des données à utiliser pour optimiser la performance des futurs modèles.

Concernant la modélisation, il est possible de regrouper les méthodes de prévision en quatre grandes catégories. Dans chacune d’elles, il existe de nombreuses variantes:

  1. Moyenne mobile simple (SMA)
  2. Lissage exponentiel simple (SES)
  3. Moyenne mobile d’intégration autorégressive (ARIMA)
  4. Méthodes basées sur les réseaux de neurones (NN) telles que LSTM

Moyenne mobile simple (SMA)

La moyenne mobile simple est la méthode la plus simple de prévision. Il s’agit d’une moyenne d’un sous-ensemble de périodes dans une série chronologique. Les moyennes mobiles sont généralement représentées sous forme de graphique linéaire pour donner une idée de la tendance générale de la série. Ils peuvent être utiles pour confirmer la direction d’une tendance ou avoir un visuel de son ampleur.

SMA est facile à comprendre et souvent préférée à des méthodes statistiques plus rigoureuses. Elle donne une bonne vision de la tendance et adoucit les fluctuations à court terme. Elle réduit également les effets des valeurs extrêmes. En revanche, SMA ne dispose pas de méthodologie statistique pour déterminer la période de prévision.

Lissage exponentiel simple (SES)

Il s’agit d’une autre technique populaire pour lisser les données temporelles. La moyenne mobile est une moyenne simple où toutes les observations sont appliquées avec un poids égal. La moyenne exponentielle attribue des pondérations décroissantes au fil du temps. Par exemple, l’observation la plus récente devrait avoir un peu plus de poids que la deuxième plus récente et ainsi de suite.

SES est généralement utilisé pour faire des prévisions à court terme. Il est plus efficace que SMA, car il donne un poids plus élevé aux points de données plus récents que le poids égal donné par SMA.

Cependant, le SES ne peut pas faire de prévisions à plus long terme de manière fiable, principalement parce que cette méthode ne tient compte d’aucune tendance dans les données. Par conséquent, il faudra examiner les extensions du modèle SES telles que le double lissage de Holt et le triple lissage de Holt et Winter.

Moyenne mobile d’intégration autorégressive (ARIMA)

Le modèle ARIMA est une technique de prévision qui projette les valeurs futures d’une série en se basant entièrement sur sa propre inertie ou des valeurs décalées. Sa principale application est dans le domaine de la prévision à court terme et nécessite au moins quelques centaines de points de données historiques. Cela fonctionne mieux lorsque les données présentent un modèle cohérent au fil du temps avec un minimum de valeurs aberrantes. ARIMA est généralement supérieur aux techniques de lissage exponentiel lorsque les données sont raisonnablement longues et que la corrélation entre les observations passées est stable.

ARIMA est depuis longtemps une méthode standard de prévision des données temporelles. Même si les modèles ARIMA sont très répandus dans la modélisation de données temporelles économiques et financières, ils présentent des limites majeures. Par exemple, dans un modèle ARIMA simple, il est difficile de modéliser les relations non-linéaires entre les variables.

Réseaux de neurones récurrents – La mémoire longue à court terme (LSTM)

Les modèles précédents nous conduisent à de nouvelles techniques de prévision utilisant des réseaux de neurones afin de surmonter certains des problèmes liés aux méthodes plus classiques.

Les modèles LSTM sont basés sur les réseaux de neurones récurrents, une sous-famille de l’intelligence artificielle appelée Deep Learning. Ils peuvent être utilisés pour prévoir des données temporelles (ainsi que d’autres réseaux de neurones récurrents). LSTM est un acronyme qui signifie Long-Short Term Memories. L’état d’un réseau LSTM est représenté par un vecteur d’espace d’états. Cette technique permet de garder des traces de dépendances des nouvelles observations avec les précédentes (même très éloignées).

De manière générale, les modèles LSTM sont complexes et sont rarement utilisés pour prédire une seule série chronologique, car ils nécessitent une grande quantité de données pour être estimée. Cependant, ils sont couramment utilisés lorsque des prédictions sont nécessaires pour un grand nombre de données temporelles et offrent des performances remarquables.

Les défis lors de la prévision des séries chronologiques

Nous aimerions partager l’expérience que nous avons acquise dans la réalisation de projets de prévision de séries chronologiques et identifier les défis auxquels l’équipe de développement pourrait être confrontée.

Manque de données

Plus les ensembles de données sont volumineux, plus le système peut accéder à des données d’entraînement, ce qui conduit à une plus grande précision des prédictions. Cependant, il existe certaines limites à prendre en considération liées à un manque de données historiques ou saisonnières pour une variable cible. Par conséquent, en fonction du modèle utilisé, un manque de données pourrait entraîner une diminution globale de la précision des prévisions. Nous parlerons alors de sous-ajustement.

Manque de connaissance du domaine cible

La connaissance du domaine étudié peut aider à améliorer la qualité des modèles dans n’importe quel projet. Pour éviter le problème du manque de connaissance du domaine, l’implication et l’expertise des spécialistes de niche d’affaires est requise.

Mauvaise utilisation des modèles

Il est primordial d’utiliser un modèle adapté aux données, à la volumétrie ainsi qu’au type et à la durée de prévision, court, moyen ou long terme. En effet, l’utilisation d’un modèle trop complexe pourrait entrainer un sous-ajustement des données. En revanche, un modèle plus simple comme SMA ou SES ne donnera vraisemblablement aucun résultat sur des données avec des variations saisonnières ou cycliques.

En résumé

Dans ces deux articles, nous avons exploré ce qu’est exactement la prévision des séries chronologiques et quels sont les composants importants de la prévision de ces séries, c’est-à-dire les composants constitutifs en lesquels une série chronologique peut être décomposée lors de l’exécution d’une analyse (tendance, saisonnalité etc..).

Nous avons également examiné différents types de prévisions et nous nous sommes penchés sur les moyennes mobiles, ARIMA et les réseaux de neurones.

La complexité de la mise en œuvre d’un projet de prévision de séries chronologiques exige la plus haute qualité de développement, ce que nos experts peuvent fournir.

Grâce aux connaissances qu’Uzinakod a accumulées dans des projets similaires, nous répondons certainement aux exigences de votre projet en ce qui concerne la prise en compte approfondie des spécificités du domaine, des objectifs commerciaux jusqu’à la conception des différents modèles de prévision. N’hésitez pas à communiquer avec nous pour discuter de votre projet!

Articles recommandés
Publié le 8 juin 2021

L’intelligence artificielle appliquée aux données temporelles – Partie 1/2

Nous rencontrons tous les jours des données temporelles dans nos environnements. Ce sont tout simplement des relevés, des mesures d’un même phénomène au cours du temps. Vous les observez au quotidien, et les rencontrerez sans nul doute dans votre environnement professionnel. Quelles sont leur

En lire plus
Publié le 6 septembre 2022

L’impact des nouvelles technologies sur les soins de santé

Lors des deux dernières années, notre société a subi un véritable électrochoc. Parmi les effets ressentis: une nouvelle vision face au télétravail, une pénurie de main-d'œuvre qui s'est accentuée, une coupure au niveau de l'approvisionnement (qui peine toujours à reprendre le dessus) et

En lire plus
Rechercher sur le site
Partager sur