Les modèles de langage sont généralement conçus par les géants des nouvelles technologies à l’instar de GPT-3 d’Open AI ou Gopher de Deepmind. Récemment nous avons consacré un article à BLOOM, le plus grand modèle de langage multilingue open-source entraîné à ce jour impliquant un millier de chercheurs. LightOn, start-up française ayant développé un modèle de langage à destination des entreprises européennes, vient d’annoncer que son application LightOn Muse était désormais disponible en Français.
Créée en 2016 par Igor Carron, Laurent Daudet, Florent Krzakala et Sylvain GiganCo, LightOn compte 20 collaborateurs parmi les meilleurs ingénieurs et chercheurs européens en ML. Après avoir lancé en 2020 son tout premier co-processeur photonique, la start-up s’est attaquée à un nouveau défi dans le domaine émergent de l’IA : créer les premiers grands modèles de langage pour les langues européennes, en particulier le français.
Au départ, l’entraînement des grands modèles de langage faisait partie des applications possibles pour le processeur photonique de LightOn. Très vite, l’équipe se passionne pour cette nouvelle génération d’IA, encore méconnue en France, élabore et entraîne ses propres modèles. En 2020, elle met en accès libre son premier modèle français à travers une interface simple de génération de texte : PAGnol. En 2022, après une année et demi de travail intensif, elle a mis au point VLM-4, une suite de grands modèles de langage en 5 langues européennes : anglais, allemand, espagnol, français et italien.
La plupart des modèles de langage, du fait de leur complexité et de leurs coûts, sont l’apanage de grandes sociétés à l’instar des GAFAM, et ne sont disponibles qu’en anglais,  en chinois et en coréen. L’utilisation de ces grands modèles pour d’autres langues ne peut se faire qu’en passant par un outil de traduction, ce qui implique une baisse de qualité et une augmentation des coûts, des modèles comme BLOOM ou LightOn Muse changent la donne.
La question essentielle, posée par le relativement faible développement de ces technologies en Europe, est celle de la souveraineté : ces technologies sont indispensables à la transformation numérique des entreprises, qui leur procure un avantage compétitif décisif par rapport à leurs concurrents. Les entreprises européennes se retrouvent impuissantes face à la récupération et l’utilisation gratuites de leurs données, qui vont être utilisées pour améliorer des produits et services non-européens.
LightOn est la première entreprise à entraîner de grands modèles de langages directement en quatre langues européennes autres que l’anglais.
L’API Muse s’adresse à tous les acteurs européens, quels que soient leur taille ou leur secteur d’activité (marketing, media, industrie du loisir, entreprises technologiques, voire même les administrations), qui ont besoin de s’adresser à leur public dans leur propre langue. Elle leur donne accès aux grands modèles de langages VLM-4 en cinq langues (Français, Anglais, Allemand, Espagnol, Italien), ainsi qu’à des fonctionnalités de customisation (skills) permettant de « spécialiser » le modèle pour des tâches particulières.
Le but est de permettre à tous ces acteurs de pouvoir bâtir facilement :
Muse ouvre les modèles à grande échelle à un large panel de langues : le français, l’anglais, l’italien, l’espagnol, l’allemand, de nombreuses autres sont prévues (40 langues d’ici fin 2023).
L’API Muse est conçue pour être flexible, facile à intégrer dans tous les systèmes, et utilisable par tous, partout. Il suffit simplement de donner des instructions et des exemples en langage naturel, comme si on interagissait avec un humain.
Les tâches chronophages, pourtant indispensables pour le fonctionnement d’une entreprise comme répondre aux e-mails et aux avis clients, écrire des posts pour remonter dans les recherches en ligne pourront être prises en charge par l’API Muse.
L’API Muse utilise VLM-4, des grands modèles de langages parmi les plus performants du marché. Les ingénieurs de LightOn innovent constamment pour augmenter la taille de leurs modèles et la qualité des données avec lesquelles ils sont entraînés (deux paramètres essentiels en matière de génération de texte). Les VLM-4 ont ainsi la capacité de répondre en contexte, d’apprendre à exécuter une tâche à partir de seulement quelques exemples (modèles few-shot) ou même sans aucun exemple (modèles zero-shot).
En rendant les modèles très performants pour exécuter des tâches spécifiques (skills), les ingénieurs de LightOn peuvent les adapter aux besoins et particularités de chaque entreprise.
Concernant L’e-marketing, par exemple, l’api Muse fournit :
La satisfaction des clients augmente puisqu’ils bénéficient d’une assistance en temps réel via des chatbots plus efficaces. En parallèle, la mise en place de moteurs de recherche personnalisés facilite l’analyse des données de tous types.
La fonctionnalité « Sentiment Analysis » livre une synthèse fiable des retours clients afin de simplifier la prise de décision. Les différents avis et évaluations sont analysés et classifiés. La base de données clients est structurée, ce qui permet une gestion plus efficace.
Muse peut résumer des documents et des e-mails pour extraire les informations essentielles afin de gagner du temps. De plus, en créant un outil de recherche ou de classification personnalisé, il est possible de traiter efficacement de grandes quantités de données de tous types.
Depuis mars 2022, dynacentrix est partenaire intégrateur de la solution de développement low-code visuel, à base de modèles assistés par une ia de la …

source

Catégorisé: