IA

LongCat 2.0 de Meituan dépasse GPT-5.5 en codage avec des puces chinoises sans Nvidia

Susan Hill

LongCat 2.0 compte 1 600 milliards de paramètres, traite une fenêtre de contexte d’un million de tokens et vient de surpasser GPT-5.5 d’OpenAI sur le benchmark de référence pour l’ingénierie logicielle réelle. Il a été conçu par Meituan, une entreprise que la plupart des gens hors de Chine connaissent, quand ils la connaissent, comme une application de livraison de repas.

Le modèle a obtenu 59,5 sur SWE-bench Pro contre 58,6 pour GPT-5.5. L’écart peut paraître mince. Ce qui ne l’est pas, en revanche, c’est le contexte de fabrication : Meituan a entraîné LongCat 2.0 sur plus de 50 000 accélérateurs IA domestiques, sans matériel Nvidia, que la Chine ne peut plus importer en quantité depuis 2022. Le fabricant des puces n’a pas été officiellement confirmé, mais la communauté technique penche pour l’Ascend 910B de Huawei. Si cette hypothèse s’avère exacte, ce serait la première fois qu’un modèle entraîné sur des puces Huawei atteint des performances de frontière dans des benchmarks publics transparents.

L’architecture retenue est le Mixture-of-Experts : seule une fraction du réseau s’active pour chaque requête, entre 33 et 56 milliards de paramètres selon la tâche. Cette approche maintient la vitesse d’inférence sans exiger un matériel hors de portée pour la plupart des développeurs. La fenêtre de contexte d’un million de tokens permet de charger une base de code entière en une seule session. Sur SWE-bench Multilingual, le modèle a obtenu 77,3 ; sur Terminal-Bench, qui évalue la capacité à naviguer dans un vrai environnement Unix, il a atteint 70,8.

Avant l’annonce officielle, le modèle fonctionnait discrètement sur OpenRouter sous le nom de code « Owl Alpha » pendant environ deux mois. Les développeurs qui l’avaient utilisé avaient noté ses capacités inhabituelles en codage sans en connaître l’origine. Meituan a confirmé après le lancement que Owl Alpha était bien LongCat 2.0 en phase d’évaluation anticipée.

La licence MIT ne raconte qu’une partie de l’histoire. Malgré son caractère très ouvert et commercialement permissif, les poids du modèle n’ont pas encore été publiés. Le dépôt GitHub et la fiche Hugging Face indiquent tous deux « à venir ». Pour l’instant, les développeurs y accèdent via une API hébergée : téléchargement, fine-tuning et déploiement local restent impossibles.

Ce que Meituan a accompli mérite l’attention. L’entreprise traite plus de 50 millions de commandes alimentaires par jour et avait déjà construit en interne un modèle de langage baptisé Zhichi avant de se tourner vers le développement externe. LongCat 2.0 est son premier modèle public et, à en juger par ses performances sur les benchmarks, l’un des systèmes de codage les plus capables disponibles sous licence libre.

Lorsque les poids seront publiés, LongCat 2.0 entrera en concurrence directe avec Llama 4.1 de Meta et DeepSeek-V4 Pro pour le titre de modèle de codage ouvert le plus puissant téléchargeable. La question des puces domestiques qui ont rendu cela possible aura des répercussions bien au-delà du monde de l’IA.

Étiquettes: , , , , ,

Discussion

Il y a 0 commentaire.