Ne manquez pas Inspire 2024, qui aura lieu du 13 au 16 mai 2024 au Venetian de Las Vegas. Inscrivez-vous !

 

Pourquoi tant d'entreprises se trompent à propos de l'IA et du machine learning

Si vous voulez rentabiliser votre investissement en Data Science, vous devez comprendre ce qu'elle peut (ou ne pas) faire. Sinon, vous allez perdre votre temps et votre argent.

Technologie   |   David Sweenor   |   24 janvier 2022

L'intelligence artificielle (IA) était censée être la panacée à une grande variété de problématiques, mais les résultats ne sont pas toujours à la hauteur.

Pourquoi ? Aujourd'hui, de plus en plus d'entreprises exploitent l'IA, le machine learning (ML) ou l'analyse de données dans leurs opérations, mais la valeur métier n'est tout simplement pas au rendez-vous.

L'IA progresse plus lentement qu'on aurait pu l'espérer pour différentes raisons.

Beaucoup ont du mal à comprendre ce que fait réellement l'IA et quelles sont ses limites. Les médias sont souvent la cause de cette incompréhension, par leurs couvertures sensationnalistes ou trop simplistes. Cependant, les mythes qui entourent la data science sont également véhiculés par de nombreuses personnes qui prétendent savoir de quoi elles parlent.

8 mythes sur l'IA

1. L'IA va résoudre tous vos problèmes comme par magie

L'IA est porteuse de grandes promesses : augmentation du chiffre d'affaires, réduction des coûts, détection des fraudes avant qu'elles ne se produisent, élimination des tâches répétitives et monotones. Pourtant, les entreprises qui se lancent dans l'IA et le ML avec de grandes ambitions découvrent souvent que la réalité est tout autre.

L'IA doit être un processus graduel et progressif.Les entreprises doivent commencer par des projets tels que l'amélioration des processus et de la satisfaction client ou l'automatisation des processus métier. Ensuite, à mesure que l'IA est mieux comprise et exploitée, elle peut être utilisée pour relever des défis financiers majeurs.

N'oubliez pas le principe de Pareto : 80 % des effets sont le résultat de 20 % des causes. Il est inutile de se focaliser sur des détails et des problèmes qui ne produiront pas de résultats mesurables. C'est simplement contre-productif, pour le système et vos équipes.

2. Le machine learning, c'est « penser comme un humain »

Les êtres humains sont des créatures complexes dotées d'un cerveau incroyablement compliqué. Nous recourrons sans cesse à l'heuristique, autrement dit aux lois empiriques que nous avons apprises avec des années d'expérience. Nous assimilons des stéréotypes qui nous poussent à faire des jugements hâtifs, pas forcément pertinents.Nous ne voulons pas que les ordinateurs pensent comme des êtres humains, parce que ceux-ci ont un raisonnement biaisé.

En réalité, le machine learning consiste à faire des prédictions à partir de données. Si ces données sont de mauvaise qualité, les résultats ne seront pas objectifs.

Mauvaise qualité en entrée = mauvaise qualité en sortie (effet GIGO)

Le machine learning apprend simplement les biais présents dans les données et les hypothèses que formule l'équipe.En quoi est-ce important ? Les biais des algorithmes, des données et de l'équipe peuvent entraîner des pertes quantifiables pour l'entreprise.

Prenons l'exemple des banques qui utilisent l'IA pour décider à qui accorder un prêt. Qui représente un risque ? Qui sera le plus susceptible de rembourser son prêt en temps voulu ?Nous savons que de nombreuses données sont biaisées. Par conséquent, le machine learning basé sur ces données sera lui aussi imparfait.

Avant, c'étaient les hommes qui empruntaient. Les prêts étaient systématiquement refusés aux femmes, pour des raisons qui n'avaient rien à voir avec leurs moyens financiers ou leur capacité à rembourser. Si l'IA devait examiner ces données, elle ne dirait pas « Oh, je vois que le système bancaire était patriarcal », mais plutôt « Les prêts sont plus souvent refusés aux femmes, donc il faut rejeter leurs demandes de prêt ».Vous souvenez-vous du fiasco de l'Apple Card, qui avait accordé à un homme une limite de crédit 20 fois supérieure à celle de sa femme ?

En réalité, les femmes représentent un risque de crédit plus faible que les hommes, à tous les niveaux. Les femmes remboursent leurs prêts à temps et comptent moins de défauts de paiement. Par conséquent, si une banque implémente un ML défectueux, non seulement elle prête de l'argent à des hommes à haut risque, mais elle passe également à côté des recettes que les femmes peuvent procurer.

D'autre part, la loi condamne toute discrimination fondée sur le genre : il est illégal de tenir compte du genre d'une personne pour déterminer sa solvabilité. Mais les crédits, pour lesquels le genre n'entre pas en considération, sont discriminants à l'égard des femmes.

Le machine learning consiste à apprendre à partir de données, qui sont souvent imparfaites, biaisées et loin d'être objectives. La plupart du temps ce n'est pas flagrant. Mais le jeu de données d'entraînement comporte des subtilités et des indications indirectes.

3. L'IA est prête à l'emploi

Avec tous les programmes SAAS et les grandes promesses des éditeurs de logiciels, vous pensez que l'IA est facile, qu'il suffit de fournir des données pour que les machines ingurgitent les informations et produisent ce que vous voulez savoir.Inutile de s'y connaître en codage !

Mais même si les équipes comprennent le programme, la quantité de travail à fournir en amont est considérable.

D'abord, le nettoyage des données : des données, et des données de bonne qualité. Il est inutile d'ajouter d'énormes quantités de données si ces dernières sont erronées, incomplètes, insuffisantes, ou si elles véhiculent de mauvaises informations.

Ensuite, il faut comprendre le résultat attendu : quand un collègue ou un client dit vouloir une perceuse, un bon data scientist sait que ce qu'il veut en réalité, c'est-à-dire un trou.Il sait également si les données seront en mesure de fournir la bonne information.

La connaissance du domaine : la réalité de la data science, c'est que le secteur manque de talents. Il n'y a tout simplement pas assez d'analystes de données et de data scientists qualifiés. Le manque de personnel formé et expérimenté ralentit l'efficacité de l'IA et son implantation sur le marché.Les entreprises ne disposent pas (ou ne trouvent pas) de data scientists ayant les compétences requises parmi leur personnel et font donc appel à des prestataires tiers. S'appuyer sur des fournisseurs externes n'est qu'une solution à court terme : avoir une connaissance du domaine est essentiel pour produire les résultats escomptés.

4. Le machine learning prédit l'avenir

C'est vrai, si l'avenir est exactement comme le passé.Le ML s'entraîne sur des données qui appartiennent au passé. Ses prédictions sont donc basées sur l'hypothèse qu'il se produira exactement la même chose.

Mais le ML ne fait pas que des prédictions.Vous pouvez également l'utiliser pour produire des insights métier, simplifier les processus et ajouter de nouveaux produits ou fonctionnalités.Si vous n'utilisez pas le ML pour changer la façon de prendre les décisions, quel est l'intérêt ?

5. Les prédictions s'améliorent automatiquement au fil du temps

Le ML utilise différents algorithmes, appelés modèles, pour créer ses prédictions.Dès que vous lancez un modèle en production, il commence à se dégrader. En effet, les données peuvent changer, tout comme l'environnement et les personnes. Mais le modèle ne changera pas. C'est pourquoi les modèles doivent être réentraînés complètement, ou bien de nouveaux modèles doivent être utilisés s'ils sont plus adaptés.

Les modèles se dégradent à cause de la dérive des données,c'est-à-dire lorsque tout ce que le modèle tente de prédire est affecté par des variables imprévues. Par exemple, si vous prédisez les ventes d'une boutique, d'autres facteurs doivent être pris en compte, comme la météo, les prochains jours fériés et les activités de vos concurrents.

Exemple de dérive conceptuelle : un dispositif de diagnostic de cancer de la peau peut passer à côté de certains cas à cause de variables ignorées. La machine sait rechercher les contours en relief, les formes irrégulières et les évolutions au fil du temps. Ce sont les signes qui alertent le médecin. Cependant, si la machine ne prend pas en compte la couleur de la peau (due à l'exposition au soleil ou à l'origine ethnique), elle produira de faux négatifs.

La généralisation, ou les changements de covariables, sont un autre problème pour les modèles. Si les données utilisées pour entraîner un modèle proviennent d'une seule population, par exemple celle d'un pays occidental riche, alors il est trop adapté à ce groupe de données. Les autres groupes et les données invisibles entraîneront des prédictions inexactes, car elles ne se généraliseront pas bien.

Des mesures doivent être prises pour empêcher la dégradation du modèle. Les performances du ML doivent être surveillées après son déploiement. Si le modèle se dégrade, restructurez-le ou essayez-en un autre qui soit mieux adapté. Il peut être nécessaire d'ajouter de nouvelles caractéristiques ou de modifier des paramètres. C'est ce que l'on appelle l'apprentissage continu : pour que les prédictions soient fiables, elles doivent être vérifiées et ajustées.

6. Le machine learning permet une plus grande précision

La précision, c'est une bonne chose, mais elle n'est pas représentative de la performance. Un modèle avec une précision de 51 % peut prédire correctement les numéros de la loterie et vous faire gagner dix millions d'euros. Un modèle avec une précision de 99 % peut donner un faux négatif au moment de prédire une demande de prêt frauduleuse, ce qui entraînerait des pertes considérables.

Le ML repose sur des probabilités, pas sur des certitudes.

Tout comme la réévaluation constante des modèles, les résultats doivent être vérifiés pour garantir leur précision. Combien de faux négatifs et de faux positifs ? Quelle est la valeur métier de ces erreurs ? Quelle part de recettes potentielles avez-vous perdue ?Le système fait-il trop peu de discrimination, surchargeant ainsi de leads votre équipe commerciale ? Ou est-elle au contraire un peu désœuvrée parce que le système est trop pointilleux et rejette trop de leads ?

7. L'IA et le ML remplacent les gens

Oui, et le ciel va nous tomber sur la tête.Dès qu'un grand changement fait peur, tout le monde craint la suppression d'emplois.Chacun se sent menacé, ce qui freine l'adoption de l'IA.Une étude a montré que 38 % des personnes employées s'attendent à ce que la technologie supprime des emplois sur leur lieu de travail au cours des trois prochaines années.D'après les prévisions, d'ici 2030, jusqu'à 20 millions de personnes seront remplacés par des robots dans le secteur de la fabrication. Ces chiffres sont effrayants.
En réalité, l'IA et le ML augmentent l'humain.

Ces outils s'occupent des tâches ennuyeuses et répétitives, et permettent aux employés de se concentrer sur des tâches créatives, imprévisibles et plus complexes.L'IA doit travailler main dans la main avec les humains pour apporter des changements bénéfiques sur le lieu de travail.

Pour mieux comprendre ce que la révolution de l'IA nous réserve, intéressons-nous à la révolution industrielle. Cette refonte importante de presque tout ce qui concernait le travail aux XVIIIe et XIXe siècles n'a pas causé une vague de pertes d'emplois ni de détresse sur le long terme.On retrouve toujours un nouvel emploi (souvent après une période d'adaptation pénible) et la peur du chômage de masse est infondée.

L'IA va entraîner des pertes d'emplois, qui devraient être compensées par de nouveaux emplois créés dans une économie plus forte et plus prospère.

L'automatisation et l'IA vont révolutionner le monde du travail et la vie en général, c'est incontestable.Mais ces changements seront plutôt bénéfiques.

8. Plus il y a de données, mieux c'est pour le machine learning

La mauvaise qualité ne peut produire que de la mauvaise qualité.Si vous alimentez la machine avec des informations non pertinentes, des données qui n'ont pas été nettoyées ou qui sont erronées, vous obtiendrez des résultats du même acabit. Les data scientists estiment qu'environ 50 % de leur travail consiste à nettoyer les données, et il y a une raison à cela.

Même la machine la plus intelligente ne peut pas créer d'insights à partir de données erronées.

Les avantages de la data science peuvent être considérables

Ce n'est pas un mythe : les retombées de la data science, si elle est efficace, peuvent être à la hauteur des promesses. Plus haut, plus vite, plus loin : le Superman des entreprises.

Mais pour exploiter l'IA dans l'entreprise, il faut bien comprendre ce qu'elle peut faire et ce qu'elle ne peut pas faire. Sinon, votre projet de data science rejoindra les 80 % de projets de data science qui ne voient jamais le jour.Pour rentabiliser votre investissement dans la data science, soyez réaliste quant aux possibilités de l'IA et utilisez-la à bon escient pour des projets bien définis, avec des données de grande qualité.Bien que ce soit moins attrayant (et facile) qu'un système de prédiction du futur prêt à l'emploi, ce sera une stratégie bien plus efficace pour obtenir les résultats que l'IA peut procurer.

À lire également

Si vous souhaitez en savoir plus, lisez Les sept mythes à briser sur le machine learning.

Balises