InstaDeep et iCompass ont annoncé, le 22 juin 2021, la mise en open source du premier modèle de langage d’IA en dialecte tunisien, TunBERT, ceci afin d’encourager l’innovation.
InstaDeep et iCompass ont créé TunBERT. Il s’agit du premier modèle de traitement du langage naturel (NLP) au monde pour le dialecte tunisien. Les deux startup ont décidé d’accorder un accès gratuit et en open source. Et ce, « pour stimuler davantage l’innovation dans un écosystème de technologie AI Tunisien en pleine croissance ». C’est ce qu’on peut lire dans un communiqué de presse.
Ainsi, le modèle linguistique TunBERT applique les dernières avancées en matière d’intelligence artificielle (IA) et d’apprentissage automatique (ML). Il a la capacité d’évaluer plusieurs tâches telles que l’analyse des sentiments. Il a, aussi, la capacité de classer des dialectes.
« Nous sommes ravis de dévoiler TunBERT, un projet de recherche né d’une collaboration étroite entre iCompass et InstaDeep. Il offre au dialecte tunisien une technologie de pointe. Ce travail illustre également le niveau d’excellence auquel peut aspirer l’écosystème technologique tunisien grâce à des collaborations entre les startup leaders en IA ». C’est qu’a déclaré Karim Beguir, PDG et cofondateur d’InstaDeep.
Les Startup ont exprimé leur joie de mettre à disposition de la communauté TunBERT. « Très peu de recherches ont eu lieu concernant les langues sous-représentées dans le passé. Notamment, la mauvaise interprétation des variations dialectales représente un grand défi aujourd’hui puisque l’arabe parlé compte une large variété de dialectes régionaux. Ce qui rend la NLP pour les dialectes particulièrement difficile. Et il en va de même pour la langue tunisienne », explique le Dr Hatem Haddad, CTO et Cofondateur d’iCompass.
La présentation de TunBERt, fruit de cette collaboration, a eu lieu lors d’une session co-présentée par Hatem Haddad, co-fondateur et CTO d’iCompass, et Nourchene Ferchichi, ingénieur IA chez InstaDeep. Et ce, lors de la GPU Technology Conference (GTC) de NVIDIA en avril.