You are currently viewing IA : La précision est la principale raison de l’échec

IA : La précision est la principale raison de l’échec

La précision est l’une des principales raisons pour lesquelles l’IA ne parvient pas à reconnaître des objets. En effet, l’IA ne reconnaît que ce qu’elle connaît déjà. L’abstraction et la variation ne sont pas ses points forts. C’est l’une des conclusions du mémoire de maîtrise intitulé « Interpreting YOLO : A Study on Explainability in Multi-Class Object Detection Models » (Interpréter YOLO : une étude sur l’explicabilité dans les modèles de détection d’objets multi-classes) de Gideon Antwi, étudiant en cours de formation chez innomatik AG. Dans son mémoire, Antwi étudie comment la reconnaissance d’objets se déroule dans l’intelligence artificielle et quelle procédure permet d’améliorer durablement la qualité des résultats.

Que se passe-t-il dans une IA ? Et comment faire la lumière sur la boîte noire qu’est l’IA pour la plupart des gens ? Antwi a voulu répondre à ces questions dans son mémoire de maîtrise et a choisi le thème de la reconnaissance d’images. Pour son étude, il a utilisé environ 10 000 images comme ensemble de données pour l’entraînement du modèle (YOLO), chacune montrant une variation de 12 objets différents. Les objets provenaient d’un jeu de 81 cartes à jouer présentant des motifs différents, ce qui a également permis de définir 81 classes pour la reconnaissance et la classification des résultats.

Dans un premier temps, Antwi a disposé les cartes en une grille régulière de quatre cartes en largeur et de trois cartes en longueur sur un fond sombre. Il a ensuite utilisé un fond de couleur claire. Antwi a également effectué un test sur une table en bois. Le chercheur a également fait varier l’éclairage, ainsi que l’ordre des cartes, qui ont ensuite été placées en partie les unes sur les autres ou en diagonale.

Essentiellement, les variations proposées dans les images de l’ensemble de données devraient être aussi larges que possible afin que, dans le meilleur des cas, toutes les éventualités soient déjà prises en compte lors de la formation et que l’IA fonctionne de manière fiable dans la vie de tous les jours », explique M. Antwi. En effet, une IA ne peut reconnaître que ce qu’elle connaît déjà. Cela vaut non seulement pour l’objet lui-même, mais aussi pour tous les facteurs qui l’accompagnent. Contrairement à l’homme, l’IA ne peut pas faire abstraction des connaissances de base, mais doit apprendre chaque élément de connaissance séparément.

 

Eine Heatmap zeigt, welche Bereiche die KI in ihrer Trainingssession wie intensiv beachtet hat

 

En fait, il faut essayer de se mettre à la place de l’IA et se demander à quoi je pense lorsque je reconnais l’objet et pourquoi je peux échouer », explique M. Antwi à propos de son approche, qui a permis d’améliorer progressivement les performances de reconnaissance. L’essentiel était d’analyser quels objets n’étaient pas reconnus et pourquoi. Parmi les causes, citons les reflets de lumière, les faibles contrastes, les limites à peine visibles entre les cartes individuelles ou un arrière-plan à motif dense qui a été reconnu comme une autre carte. Antwi a identifié ces sources d’erreur et les a systématiquement réentraînées pour que l’algorithme puisse les éliminer.

Afin de comprendre exactement ce que l’IA a reconnu dans chaque cycle et où il y avait des lacunes dans ses performances de reconnaissance, Antwi a utilisé un programme développé par ses soins qui affichait les activités de l’IA sous la forme d’une carte thermique. Il en ressort que, même au cours d’une même session de formation, l’IA a traité des images identiques avec une intensité très différente, par exemple uniquement la zone centrale au cours d’une session et l’ensemble de l’image au cours d’une session ultérieure.

L’étude montre qu’une IA apprend pas à pas et que chaque cause d’erreur doit être identifiée et comprise afin de réentraîner systématiquement le modèle avec un contenu correspondant. Un entraînement intensif est le seul moyen de garantir une détection fiable dans la pratique », conseille Antwi à la suite de son observation. Le temps nécessaire à l’analyse détaillée des erreurs et à l’entraînement ciblé de détails spécifiques est rapidement rentabilisé par une utilisation productive grâce à la haute qualité des résultats.

 

Jede Iteration verbessert die Erkennungsrate der KI.

 

Image: innomatik AG/Gideon Antwi