Site icon Top Geek Blog

Ces LLM made in Italy se font humilier au test de langue – vous n’allez pas croire les résultats !

Quand les LLM « made in Italy » peinent face au benchmark Italic

Un récent test baptisé Italic a livré un verdict sans appel : les modèles linguistiques développés en Italie se classent en queue de peloton dès qu’il s’agit de répondre à un ensemble de 10 000 questions à choix multiples couvrant la langue et la culture italienne. Alors que les géants étrangers comme Claude 3.5 Sonnet trustent les premières places, leurs concurrents locaux semblent souffrir d’un déficit de ressources et de technique. Mais qu’est-ce qu’Italic, et pourquoi ces résultats sont-ils si révélateurs pour l’écosystème LLM italien ?

Italic : un benchmark exhaustif en 12 domaines

Conçu par le réseau de recherche Crisp, Italic s’appuie sur un jeu de données unique :

Cette méthodologie offre un panorama complet des compétences linguistiques et culturelles, bien au-delà d’un simple test de vocabulaire.

Classement et commentaires des développeurs

Sans surprise, Claude 3.5 Sonnet domine la compétition, démontrant sa maîtrise du contexte italien malgré son origine étrangère. En revanche, les « vrais » LLM italiens ferment la marche. Face à ces résultats, les auteurs des modèles locaux expriment des réactions variées :

Ces observations invitent à nuancer le verdict d’Italic et à considérer d’autres formes d’évaluation, notamment en libre expression.

Portraits de cinq LLM italiens en lice

LLaMAntino 3 – Le fine-tuning hospitalier

Développé par le groupe Swap de l’Université de Bari, LLaMAntino 3 repose sur un fine-tuning de Llama 2 et 3 exporté sur le supercalculateur Leonardo. À seulement 7 milliards de paramètres, il vise :

Llama 3.1 8B Italiano – Le projet solo de Montebovi

Conçu par un chercheur indépendant, ce modèle de 8 milliards de paramètres se concentre sur une langue italienne précise :

Maestrale – La tempête open source

Né début 2024 sans financements externes, Maestrale (7 milliards de paramètres) est un dérivé de Mistral ajusté sur un jeu de données multilingue centré sur l’italien :

Modello Italia – L’ambition industrielle d’iGenius

Lancé en juin 2024, Modello Italia a bénéficié d’un entraînement sur les supercalculateurs de Cineca et d’une base de données 100 % italienne :

Minerva – La sagesse académique

Fruit de l’Université La Sapienza à Rome, Minerva évolue sous la direction de Roberto Navigli :

Quelle route pour un LLM 100 % italien ?

Si Italic souligne un retard des LLM « natifs », les acteurs locaux rappellent l’importance de :

À l’heure où l’Union européenne planche également sur OpenEuroLLM, le défi reste d’allier rapidité d’exécution et qualité scientifique. Car l’excellence linguistique ne se décrète pas : elle se construit, qu’il s’agisse de bits ou de belle langue italienne.

Quitter la version mobile