Impliquez-

vous

Quoi?

 Nous voulons utiliser le traitement de langage naturel et l'apprentissage automatique pour :

1-Former un modèle pour comprendre les mots et les phrases et reproduire la structure des phrases de diverses langues africaines disposant de peu de ressources, comme le ghɔmálá et d'autres langues camerounaises.

2-Former un modèle pour reconnaître les mots et les phrases dans ces langues et être capable de les traduire.

Comment?

Le programme Impliquer l'Afrique est une initiative qui vise à améliorer la présence et l'utilisation des langues africaines disposant de peu de ressources, comme le ghɔmálá et les autres langues camerounaises, dans les domaines du traitement du langage naturel et de l'apprentissage automatique. Ce programme est conçu autour de trois projets clés (projet Afficher l'Afrique, projet Adopter l'Afrique et projet Inclure l'Afrique), chacun avec une orientation et un ensemble d'objectifs propre. Nous travaillons présentement sur la première version du projet Afficher l'Afrique.

Le projet Afficher l'Afrique est présentement en cours pour le ghɔmálá et d'autres langues camerounaises, et comprend trois activités principales :

Création d'un corpus

            – Objectif : compiler une base de données complète comprenant du contenu audio et textuel. Ce corpus est essentiel pour comprendre, préserver et promouvoir les subtilités et la variabilité des langues. C'est la première étape avant toutes les autres activités.

            – Activités : collecte, numérisation et validation des textes écrits et des enregistrements audio, et la transcription des traditions orales publiques. Cela implique de collaborer avec les collectivités, les linguistes et les expertes et experts en culture pour s'assurer que le corpus est représentatif, complet et précis.

Conception d'outils langagiers utilisant l'IA

            – Objectif : en partant du corpus ainsi créé, créer des outils utilisant l'IA. Ces outils sont conçus pour être conviviaux et accessibles afin de promouvoir l'utilisation des langues sur les espaces numériques.

            – Activités : développer un assistant virtuel pour les tâches langagières interactives, la traduction instantanée et les systèmes de reconnaissance de la parole et les technologies de texte-parole. Ces outils sont conçus pour les locutrices natives et locuteurs natifs, et pour les personnes qui souhaitent apprendre ou utiliser ces langues.

Création d'un modèle de traduction automatique Building

            – Objectif : développer un modèle de traduction automatique. Ce modèle vise à fournir des traductions exactes et sensibles aux questions culturelles afin de combler les lacunes entre les langues pauvres en ressources et toutes les autres.

            – Activités : utiliser le corpus pour former les algorithmes d'IA afin qu'ils puissent traiter les nuances et les subtilités contextuelles des langues. Le développement implique également des tests et une amélioration continus pour améliorer la précision.

Chacune de ces tâches est intimement liée : le corpus sert d'élément de base qui propulse le développement d'outils utilisant l'IA et le modèle de traduction automatique.

 

Quand?

Il s'agit d'un projet à long terme. Voici un échéancier provisoire pour chaque langue :

Recherche initiale (mois)

Formation pour l'engagement de la collectivité et le partenariat (mois)

Évaluation du budget et préparation des ressources (mois)

Numérisation, documentation et collecte de données (en cours)

Développement de la technologie et itérations (mois)

Évaluation et expansion (années)

Qui?

Le programme Engager l'Afrique engage une collaboration avec des intervenantes et intervenants de la collectivité, des linguistes, des expertes et experts en technologie et en culture, des archivistes, des spécialistes de la localisation et de la mondialisation et des défenseuses et défenseurs de la préservation de la langue, ainsi qu'avec toutes les parties prenantes et intéressées pour s'assurer que le corpus est représentatif, complet et exact, et que les meilleurs outils et personnes peuvent atteindre nos objectifs.

Le point principal est de s'assurer que ces avancées technologiques sont fondées sur le contexte culturel et linguistique des collectivités, ce qui mènerait à la préservation et à la modernisation de la langue tout en conservant son riche héritage.

Aimeriez-vous aider?

Comment aimeriez-vous aider?

Nouvelles

Recevoir les nouvelles