On a recours aux modèles prédictifs pour faire des prédictions sur le futur. Les entreprises misent de plus en plus sur ces éléments de prédiction pour avoir une idée des évènements à venir et ainsi savoir quels actes poser afin de les anticiper. En s’appuyant sur des connaissances établies, ces modèles leur donnent la possibilité de prévoir l’évolution future.
Obtention d’un modèle prédictif
Un modèle prédictif est utilisé pour traduire une réalité sous une forme mathématique. Son obtention peut se faire de diverses façons.
Utilisation des observations : c’est une méthode qui est couramment utilisée dans le machine learning du fait de la disponibilité d’une quantité importante de données grâce au Big Data. Par exemple, l’analyse des cookies permet de se faire une idée de la durée de présence d’un internaute sur un site web. À ce propos, sachez que lorsqu’un utilisateur passe plus de 1 mn sur la page d’accueil du site, il a tendance à y rester pendant plus de 5 minutes. C’est quasiment une certitude dans 7 cas sur 10.
Définition d’un modèle théorique : il est question de mettre en avant certaines réalités sur lesquelles on s’appuiera pour mettre au point le modèle prédictif. En mécanique par exemple, pour faire la description du mouvement d’un objet, on réalise la description des forces s’appliquant sur l’objet concerné afin de définir un modèle théorique du mouvement.
Il suffit d’un clic pour en savoir plus sur un modèle prédictif et sa véritable utilité. Vous saurez notamment qu’il peut donner des indications sur la façon dont un internaute utilisera un site web dans le futur. Ayant une bonne connaissance du site en question et le temps que l’utilisateur y a passé, le modèle prédictif est capable de faire des prédictions sur le parcours futur de l’utilisateur, en situant notamment sur les pages qu’il visitera et le temps qu’il va y passer.
Cas d’usage des modèles prédictifs
En général, les modèles prédictifs sont utilisés pour 2 principaux cas d’usage : la prédiction d’un évènement (modèles de classification) et la prédiction d’une quantité (modèles de régression).
Pour le premier cas, le but est de répondre à la question fondamentale suivante : est-ce qu’un évènement donné va arriver ? Un exemple concret peut être pris dans le domaine de la météorologie pour faciliter la compréhension. La question qu’on pourrait se poser est la suivante : est-ce qu’il va pleuvoir aujourd’hui ? En se fiant aux données rassemblées, le modèle prédictif est capable de donner une probabilité pour l’évènement. Un tel modèle est dénommé modèle de classification. Il est bon de noter qu’une notion de risque est à considérer. Car le modèle ne fait pas de prédiction totalement certaine. Dans le cas de l’exemple sur la météorologie, sachez qu’un modèle ne peut pas prédire un risque de précipitation à 100 %. Il n’y a donc pas de certitude absolue. Sur ce principe de classification, des modèles similaires existent, mais sont plutôt utilisés pour répondre à un objectif d’efficacité opérationnelle, et non pour faire de la prédiction. C’est le cas par exemple de la détection de fraudes. Le modèle créé peut répondre à la question suivante : S’agit-il d’une opération frauduleuse ? Et sur l’opération, il pourra prédire 75 % de risque de fraude.
Concernant le deuxième cas d’usage, la prédiction d’une quantité, on parle de modèle de régression. Le modèle mis en place permettra de répondre à deux questions. La première est relative à l’observation et peut être formulée de la façon suivante : quelle quantité va être observée ? Comme exemple, on peut se demander quel est le nombre de personnes qui assisteront à un festival de cinéma. En tenant compte de la popularité des acteurs présents et du succès des films dans l’année, il est possible de faire une prédiction de ce nombre. La deuxième question concerne l’évolution et peut être énoncée comme suit : quelle sera l’évolution de la quantité dans le temps ? Par exemple, on peut se demander combien de Vélib’ seront utilisés heure par heure au cours des mois à venir ? Pour apporter une réponse à cette question, le modèle prédictif considérera notamment l’historique d’utilisation des Vélib’.
Il est bon de comprendre que quel que soit le cas d’usage, il y a toujours une notion d’incertitude qui est présente lorsqu’on fait une prédiction à partir d’un modèle prédictif. Cela est particulièrement évident quand la prédiction concerne un évènement. Il y a toujours une part d’aléatoire à ne pas perdre de vue. Par exemple avec l’exemple des Vélib’, il n’est pas possible de prédire avec exactitude le nombre de Vélib’ qu’on utilisera à une certaine heure. Aussi, même quand il s’agit de modèles prédictifs « exacts », tels que des modèles physiques, l’observation n’échappe pas à des incertitudes de mesure.