2024-11-13 14:24:00
« La langue a été le moteur de l’évolution humaine, nous permettant de nous comprendre, de collaborer pour un avenir meilleur et de nous développer plus rapidement que toute autre espèce. En combinant notre expérience de 25 ans de recherche en intelligence artificielle avec la capacité de calcul gérée par Cineca, nous créerons une IA qui aura un impact très fort sur la vie de millions de personnes. » Marco parlant TrompettesPDG de Translated, une startup mondiale de solutions linguistiques d’intelligence artificielle (IA), qui annonce aujourd’hui l’accord avec Cinémal’un des plus grands centres informatiques au monde.
Plus précisément, il s’agit d’un projet de recherche pour créer une intelligence artificielle capable de traduire comme les meilleurs traducteurs professionnels. Le projet, qui représente une avancée dans l’évolution des technologies de traduction et l’accessibilité mondiale des langues, vise à former le modèle linguistique le plus avancé développé par Translated sur un ensemble de données de traduction unique au monde, en utilisant Léonard, le septième supercalculateur le plus puissant au monde (troisième en Europe), géré par Cineca au Tecnopolo de Bologne.
Le résultat sera le modèle linguistique le plus avancé au monde, qui sera publié “open-source” et “openweights” dans la combinaison linguistique italien-anglais et anglais-italien, marquant ainsi une nouvelle étape significative vers la création d’un traducteur universel.
Le rôle de Cineca et du supercalculateur Leonardo
Cineca prendra en charge la formation du modèle de langage de Translated avec dix millions d’heures de formation GPU. Cette énorme capacité de calcul permettra une accélération significative de la formation des modèles, garantissant ainsi des progrès rapides. L’ensemble de données fourni par Translated est le résultat de 15 années de collecte méticuleuse et se distingue clairement des ensembles de données couramment utilisés car il comprend des documents entiers avec un contexte étendu, c’est-à-dire des erreurs de traduction, des révisions et le raisonnement des traducteurs et des relecteurs en cas de désaccord. C’est précisément cette richesse de données riches et sophistiquées qui permet aujourd’hui à Translated, avec l’aide de Cineca, de former un modèle d’intelligence artificielle capable d’une compréhension approfondie des langues.
Par Francesco Ubertiniprésident de Cineca « Cette collaboration est un exemple de la manière dont le calcul intensif peut stimuler l’innovation et avoir un impact social important et bénéficier aux populations du monde entier. Nous sommes ravis de participer à un projet qui franchit une étape aussi importante dans la recherche sur l’IA appliquée au langage, pour le bénéfice de la communauté nationale et mondiale.
Le modèle linguistique
Le modèle linguistique qui sera entraîné par le supercalculateur Leonardo a été développé par Translated en utilisant une technique innovante Chaîne de pensée et déjà testé auprès d’un petit groupe d’entreprises dans des contextes de production réels courant 2024, il a démontré la capacité de traduire des données conversationnelles avec un taux d’erreur (moins de trois pour mille mots) inférieur à ceux réalisés par des traducteurs professionnels sur le même contenu, et quatre fois inférieur à celui des systèmes de traduction automatique les plus avancés.
Grâce à La puissance de calcul de LéonardTranslated et Cineca prévoient de réduire la marge d’erreur à une erreur pour mille mots, obtenant ainsi une précision comparable au premier centile des meilleurs traducteurs professionnels.
Après la version initiale pour les combinaisons italien-anglais et anglais-italien, Translated prévoit d’étendre le nouveau modèle aux 200 langues prises en charge par son IA actuelle, élargissant ainsi l’impact mondial du développement technologique.
Le projet de recherche, présenté à Rome la semaine dernière lors d’un événement intitulé Le pouvoir des langues – Vers le traducteur universelfait partie du parcours des collaborations public-privé avec des universités et des centres de recherche soutenus par des subventions de l’Union européenne auxquelles Translated participe depuis le début des années 2000 et qui ont permis le développement de technologies de plus en plus avancées pour soutenir la traduction, et les rendre à la disposition de la société.
#projet #Translated #Cineca #pour #créer #modèle #traduction #avancé #monde
1731526868