Un cerveau artificiel inventé par un jeune de Mbujimayi. Voici ses avantages.

Un cerveau artificiel inventé par un jeune de Mbujimayi. Voici ses avantages.
Listen to this article

Hugues Mbuyi Kolela est un jeune concepteur informatique. Il évolue dans l’innovation technologique. Ce ressortissant de l’Université de Mbujimayi travaille pour Digital bridge, une startup spécialisée dans l’innovation technologique à Mbujimayi. Il nous parle de la conception d’un cerveau artificiel capable de reconnaitre les objets sur une image numérique, mais aussi de décrire le plus fidèlement possible le contenu de cette image par la génération automatique d’un texte. L’architecture du modèle final est capable de visualiser une image et de générer une description raisonnable, en fonction des mots de son dictionnaire générés sur la base des jetons dans les légendes des images d’entrainement.


Comment cela fonctionne ?
Depuis quelques mois, Hugues Mbuyi travaille sur cette innovation qui présente beaucoup d’avantages. Il commence :
« Cette innovation permettra aux aveugles de capturer l’environnement dans lequel ils se trouvent grâce à son simple téléphone et de le leur décrire par un message audio. »


« Pour les internautes qui suivent les commentaires du match de football en ligne, vous pensez peut être qu’il y a une personne au clavier qui écrit tous ces commentaires à la minute même, et bien je vous dis que non, cela se fait automatiquement grâce à ce système qui comprend les images de football et génère un commentaire automatiquement. », déclare le jeune ingénieur.
« En médecine, ce problème peut aider les médecins à interpréter automatiquement des clichés radiographiques des os fracturés, ou encore d’interpréter les images échographiques pour décrire l’évolution du fœtus.
Ce système peut aussi jouer le rôle d’un filtre, pour bloquer les images pornographiques sur internet. Et bien plus encore. », ajoute-t-il.

Qu’en est-il de sa construction ?
« Nous allons recourir au Réseau de neurones à convolution (CNN) pour résoudre le premier problème, et le Réseau de neurones Récurent (RNN), précisément le Long Short-Term Memory (LSTM) pour résoudre le deuxième problème. Il est donc naturel d’utiliser un CNN pour reconnaitre un objet sur l’image, en le pré-entraînant d’abord pour une tâche de classification d’image et en utilisant la dernière couche cachée comme une entrée du décodeur RNN qui génère des phrases. », fait-il remarquer.
« Et à la fin nous allons combiner les deux modèles pour en former un seul capable de prendre une image I comme entrée, et qui est entrainée pour maximiser la probabilité de produire une séquence cible de mots », explique Hugues Mbuyi.


« En partant de cette image, notre système d’intelligence artificielle sera capable de détecter les personnes, les légumes, les bananes…; et décrire le plus fidèlement possible les contenus de cette image. », déclare-t-il.
La mise au point de cette innovation est attendue pour bientôt.

Coulisses.net

Rédaction

Rédaction

Coulisses.net, la géante machine de l’actualité RD Congolaise.