Microsoft négocie avec Anthropic le premier déploiement externe de Maia 200

Microsoft discute avec Anthropic de la fourniture de sa puce d’intelligence artificielle Maia 200, ce qui serait la première fois que ce silicium quitte les centres de données du groupe. Les négociations, révélées par The Information et confirmées par CNBC, traduisent en opérations la conséquence d’une relation financière qui se limitait jusqu’à présent au tableur.

L’accord en discussion est étroit mais lourd de sens. Anthropic louerait des serveurs Azure équipés de puces Maia 200 pour gérer l’inférence, la phase coûteuse durant laquelle Claude répond aux utilisateurs, distincte du travail plus visible d’entraînement de nouveaux modèles. L’inférence est l’endroit où chaque laboratoire de pointe perd actuellement de l’argent. L’économie unitaire d’une requête, multipliée par des centaines de millions d’utilisateurs, est aujourd’hui le chiffre déterminant du business de l’IA.

Pour Microsoft, faire passer Anthropic sur Maia 200 serait la meilleure validation commerciale envisageable d’un programme qui a vécu jusqu’ici comme un projet de R&D interne. Trainium et Inferentia d’Amazon sont entre les mains de clients externes depuis des années. Le TPU de Google sert d’épine dorsale silencieuse à une bonne partie de la révolution des grands modèles de langage. Maia, en revanche, n’a été déployé que dans les propres installations de Microsoft en Arizona et en Iowa, exécutant des charges internes d’IA que l’entreprise n’a pas détaillées publiquement. Décrocher le deuxième laboratoire de pointe le plus surveillé au monde ferait passer la puce d’infrastructure interne à produit commercial du jour au lendemain.

La logique financière est déjà posée. Microsoft détient une participation de cinq milliards de dollars au capital d’Anthropic ; Anthropic, en retour, s’est engagé sur environ trente milliards de dollars de dépenses Azure à long terme. Cet argent allait passer par une forme de silicium. La question ouverte, et celle qu’un tel accord trancherait, était de savoir si Anthropic brûlerait cette somme dans des GPU Nvidia loués à Microsoft ou si Microsoft parviendrait à en rediriger une part vers ses propres puces.

Maia 200 est l’accélérateur d’inférence de deuxième génération de Microsoft. La pièce est gravée par TSMC en 3 nanomètres et utilise quatre accélérateurs liés par boîtier, le groupe la positionnant comme silicium centré inférence, optimisé pour la tâche de répondre plutôt que pour celle d’apprendre. Le PDG Satya Nadella a dit aux investisseurs que la puce délivre « plus de 30 pour cent de tokens par dollar supplémentaires » face au silicium GPU le plus récent déjà présent dans la flotte Azure. C’est un argument de coût, pas de capacité, et en inférence c’est le coût qui décide qu’une puce vit assez longtemps pour compter.

Pour Anthropic, les discussions Maia 200 s’inscrivent dans un schéma. Le laboratoire a passé la dernière année à bâtir une pile de calcul délibérément hétérodoxe : GPU Nvidia via plusieurs nuages, puces AWS Trainium dans le cadre d’un engagement pluriannuel avec Amazon évalué à plus de cent milliards de dollars, et TPU de Google pour des pans de son entraînement. Ajouter le silicium Microsoft compléterait l’ensemble. Anthropic disposerait, en pratique, de l’architecture de calcul la plus diversifiée par fournisseur parmi les laboratoires de pointe. C’est l’expression opérationnelle d’une stratégie que Dario Amodei communique depuis des mois : le calcul, et non le talent, est la contrainte qui lie le laboratoire à mesure qu’il atteint l’échelle où chaque choix d’architecture pèse en neuf chiffres.

Rien n’est tranché. Les deux parties qualifient les discussions de précoces, et Maia 200 n’a été mis à disposition d’aucun client Azure externe sous une forme commerciale. Le chiffre de 30 pour cent cité par Microsoft est une métrique fournisseur sur une charge que le fournisseur contrôle de bout en bout. Les benchmarks indépendants face aux générations Hopper ou Blackwell actuelles de Nvidia n’existent pas dans le domaine public. L’optique stratégique est par ailleurs inconfortable dans au moins une direction : Microsoft est le principal soutien individuel d’OpenAI, le rival le plus direct d’Anthropic. Vendre de la capacité Maia simultanément aux deux laboratoires est une configuration que Microsoft n’a jamais testée, et la partition contractuelle nécessaire pour qu’elle tienne n’a rien de trivial.

La suite est procédurale. Aucun terme commercial n’a filtré, aucune date de disponibilité générale pour Maia 200 hors des sites Microsoft n’a été publiée, et aucune des deux entreprises n’a confirmé de calendrier. Le prochain signal concret arrivera lors de la prochaine présentation des résultats trimestriels de Microsoft, où tout client externe engagé d’importance devrait être mentionné. D’ici là, la chorégraphie financière entre Redmond et San Francisco court devant le silicium lui-même.

Étiquettes: tech-en1, Anthropic, Claude, nvidia, Dario Amodei, microsoft