Aristide Bandaogo est un jeune développeur Burkinabè. Il a conçu une intelligence artificielle de traduction du mooré, langue majoritairement parlée au Burkina. Son projet tech en cours concerne une intelligence artificielle en mooré intégrée à la messagerie WhatsApp. Dans cette interview, il nous donne plus de détails sur son outil et ses projets futurs dans le domaine de l’intelligence artificielle.
Studio Yafa : Pouvez-vous nous donner un aperçu de l’IA en cours de conception ?
Aristide Bandaogo : C’est une IA de traduction en langues locales burkinabè en commençant par la langue mooré. L’IA permet de traduire du français vers le mooré et vice-versa. Elle peut également parler le mooré. Il y a deux voix qui ont été entraînées, dont une masculine et une féminine. Vous pouvez lui demander de vous lire un texte en mooré. Et enfin du speech to text qui est la voix vers le texte. Là, vous soumettez du texte, ça peut être un chant ou n’importe quel audio en mooré , et le modèle va vous donner la traduction.
Donc ça permet notamment d’aboutir sur la suite du projet qui est la mise en place d’un assistant mooré 100 %. Un assistant intelligent 100 % mobile directement disponible sur WhatsApp. Vous prenez votre téléphone, vous allez sur WhatsApp, vous ouvrez les discussions avec l’assistant et vous lui envoyez un vocal, que ce soit en mooré ou en français, en lui posant la question que vous voulez (par exemple l’actualité du pays) et le modèle peut vous répondre avec un audio.
D’où vous est venue cette idée ?
Nous avons eu cette idée avec la décision du gouvernement depuis peu, sur le projet de loi selon lequel le mooré, le dioula et le fulfuldé sont désormais des langues officielles du Burkina Faso. Malheureusement, quand nous regardons la plupart des publications sur les réseaux sociaux, très peu de médias offrent des contenus en langue locale. Donc, dans cette logique d’accompagner le gouvernement et de permettre aussi la vulgarisation de nos langues locales qui ont été pendant longtemps délaissées au profit de langues occidentales, nous avons décidé de mettre en place cette IA qui va faciliter tout.
Avec cette IA, plus besoin de la traduction manuelle ou des experts linguistes pour faire la traduction. Et lorsque l’État-major a un communiqué à passer, il peut utiliser l’IA et automatiquement, nous avons la traduction en moins de 15-20 secondes. Et tous les médias peuvent l’utiliser pour leurs activités de traduction et peuvent aussi publier du contenu en vocal au cas où les auditeurs ne savent pas lire le mooré.
Pourquoi spécialement le Mooré ?
Le mooré par ce que c’est la langue la plus parlée à Ouagadougou, donc en termes de prévalence, c’est beaucoup plus pour cette raison que l’on a commencé par cette langue. Ce n’est pas uniquement le mooré, les autres langues vont venir, mais il fallait bien commencer par quelque chose. Prendre une première langue expérimentée, voir comment l’IA performe et on passe aux autres langues. Aussi, le mooré fait désormais partie des langues officielles du pays.
Vu que la langue Mooré a plusieurs dialectes, c’est le Mooré de quelle région que vous avez utilisé pour la conception de votre IA ? Et comment avez-vous procédé à la sélection ?
C’est le mooré de Ouagadougou, pour entraîner une IA à parler, il faut avoir un dataset. Le dataset, ici, est une constitution. Nous avons embauché des traducteurs, des experts linguistes et des validateurs, des gens qui ont été chargés des phrases en mooré et de donner leur voix. Dans ce dataset, on avait 50 à 60 mille phrases et audios. Donc ils ont lu et ont donné la traduction texte et audio via une application que nous avons développée.
Lire aussi: Intelligence artificielle: outil prisé par des élèves dérangeant selon des enseignants
Ainsi, nous utilisons ce data7 pour faire l’entraînement de l’intelligence artificielle. C’est comme si vous voulez apprendre à quelqu’un à parler une nouvelle langue. Nous donnons 50 mille phases à l’IA qui doit être capable de généraliser sur une infinité de phrases et même sur des phrases qu’elle n’a pas encore vues. Et donc, sur ce dataset, la majeure partie des linguistes étaient de Ouaga et avaient l’accent mooré de Ouaga. C’était même un critère de sélection.
Pourquoi le mooré de cette région principalement ?
Non seulement les experts que nous avons embauchés étaient ouagalais et avaient tous l’accent de Ouaga, mais aussi, nous nous sommes dit que l’accent de Ouaga est plus prédominant. Enfin, pour un étranger qui vient au Burkina Faso, les majeures parties seront dans la capitale, donc il va beaucoup se frotter à des gens qui parlent et comprennent l’accent de Ouaga.
Quelle technique avez-vous utilisée pour développer votre IA ?
Il y a beaucoup de techniques d’algorithme qui ont été utilisées. D’abord, nous avons embauché les traducteurs qui ont été chargés de traduire les phrases. Après, il y a eu les validateurs qui ont été chargés de valider les traductions. Et une fois les données obtenues, il fallait entraîner l’IA. Pour l’entraînement de l’IA, il y a ce que l’on appelle un apprentissage supervisé basé sur un finetuning sur les modèles pré-entrainés.
Donc vous choisissez le modèle et sur ce modèle vous faites le finetuning pour vous spécialiser dans une tâche plus spécifique qui est de comprendre et de parler le moore. Et l’idée, c’est que l’IA puisse, sur la base des données qu’elle a déjà vues, performer sur des données qu’elle n’a jamais vues. Pour le texte to speech qui est du texte vers la voix et speech to text qui est de la voix vers le texte, nous avons développé notre propre modèle à 600 millions de paramètres.
Quelles sont les principales fonctionnalités de votre IA ?
Pour le moment, la version qui est déjà déployée, c’est que ça peut traduire le français vers le mooré ou du mooré vers le français. Ça peut également lire le mooré avec une voix féminine et masculine et ça peut recevoir du contenu en mooré en vous sortant la traduction. Il y a la transcription et la traduction. Par exemple, si vous avez un chant en mooré et que vous voulez les lyrics, vous passez, ça vous sort le contenu en mooré ou bien, si vous voulez la traduction en français, vous soumettez et ça vous traduit. Bientôt, on aura la possibilité de cloner votre voix, c’est une fonctionnalité qui est en cours de travail.
Quelles sont les difficultés que vous avez rencontrées dans la conception de votre IA ?
L’un des problèmes principaux que nous rencontrons est que beaucoup de traducteurs le faisaient sur le téléphone, qui n’était pas forcément de meilleure qualité, et donc la qualité de certains audios était dénaturée, il y avait beaucoup de bruits de fond et le micro du téléphone aussi n’était pas adapté.
Combien de temps avez-vous mis pour la conception de votre IA ?
Nous avons démarré en mars 2024 avec la collecte de données Dataset et l’application. L’entraînement du modèle a commencé en mai et nous avons déployé les premières versions en août. Maintenant, nous sommes dans la prochaine phase, qui est donc l’amélioration de ce qui existe, l’ajout des autres langues et aussi nous continuons avec le développement de l’assistant 100 % mooré. Pour le moment, nous sommes au 6e mois et c’est un projet à long terme.
Envisagez-vous la conception de l’IA en d’autres langues dans le futur ?
Bien sûr, déjà pour les langues officielles du Burkina Faso, on envisage le fulfuldé. Aussi, nous avons des partenariats avec des structures qui sont internationales qui auront besoin de notre IA pour se spécialiser en d’autres langues hors du Burkina Faso.
À quand la sortie de votre IA ?
La version mooré de l’IA est déjà sortie et est disponible. Nous continuons de l’améliorer, mais il y a une version qui est disponible sur un site Web. Nous n’avons pas encore fait le lancement, il se fera une fois que nous aurons l’assistant. Le projet continue, mais la plateforme du site Web est déjà disponible pour faire les tests et les essais. Nous allons bientôt communiquer le lien sur nos réseaux sociaux pour le public.
Lire aussi: « L’intelligence artificielle est venue démocratiser le savoir », Dian Diallo, formateur digital
Entretien réalisé par Sarah Dumas Kaboré