Affaires et finances

Liang Wenfeng et la démonstration par DeepSeek que l’IA n’exige pas des milliards

Penelope H. Fritz
Liang Wenfeng
Liang Wenfeng
Naissance1 janvier 1985
Zhanjiang
ProfessionEntrepreneur technologique et chercheur en IA
RécompensesTime 100 u00b7 Nature's 10

La question que Silicon Valley n’a jamais tout à fait su répondre, dans les mois qui ont suivi l’irruption de DeepSeek, n’était pas technique. Elle était philosophique. Si une équipe de moins de deux cents ingénieurs, travaillant à Hangzhou sur du matériel que les contrôles américains à l’exportation étaient censés limiter, pouvait produire un modèle compétitif avec les meilleurs du monde à une fraction du coût, à quoi servait tout cet argent ? Liang Wenfeng a posé cette question. Il n’est pas resté pour entendre le débat.

Wuchuan, la ville côtière de la province du Guangdong où il a grandi, n’apparaît pas dans les récits habituels sur l’origine de l’intelligence artificielle. Ses parents étaient instituteurs. Il apprit le calcul avancé de lui-même au collège, obtint le meilleur résultat de la région de Zhanjiang à l’examen d’entrée à l’université et intégra l’Université du Zhejiang à dix-sept ans. Il étudia le génie de l’information électronique, puis compléta un master en génie de l’information et des communications, avec une thèse sur les algorithmes de suivi d’objets par caméra. Les sujets de recherche paraissaient modestes, mais la sensibilité — des mathématiques appliquées pour résoudre des problèmes concrets sous contraintes — allait définir tout ce qui suivrait.

Lorsque la crise financière de 2008 fit s’effondrer les marchés, il commença à explorer l’apprentissage automatique appliqué au trading. Après Chengdu et plusieurs projets intermédiaires, il cofonda en 2016 High-Flyer Capital Management (幻方量化) à Hangzhou avec deux camarades de l’Université du Zhejiang. La société allait devenir l’un des fonds quantitatifs les plus performants de Chine, avec plus de soixante-dix milliards de yuans sous gestion et des rendements moyens supérieurs à cinquante pour cent en 2025. L’avantage était algorithmique : des modèles d’apprentissage profond fonctionnant sur une infrastructure GPU que Liang avait commencé à constituer à grande échelle. En 2021, il achetait des puces Nvidia A100 en quantités qui laissaient pressentir des ambitions bien plus larges qu’une simple opération de trading.

Cette infrastructure devint le fondement de DeepSeek, que Liang créa comme filiale en juillet 2023. L’objectif déclaré de l’entreprise n’était pas de construire un chatbot ou un produit commercial, mais de conduire ce qu’il décrivait comme de la recherche fondamentale en intelligence artificielle — le type de travail qui n’a pas de feuille de route produit ni d’objectif trimestriel. DeepSeek employait environ cent soixante personnes, recrutées dans des disciplines délibérément variées, et fonctionnait avec un budget qui aurait à peine figuré dans les comptes d’OpenAI ou de Google DeepMind. Lorsque DeepSeek-V3 fut publié fin 2024, le coût d’entraînement fut estimé à environ six millions de dollars. Lorsque DeepSeek-R1 suivit en janvier 2025 et se retrouva en tête de l’App Store d’iOS aux États-Unis, détrônant ChatGPT, le chiffre qui circula était de cinq virgule six millions de dollars.

Il convient toutefois de ne pas confondre deux affirmations distinctes. Ce que les marchés financiers retinrent — que DeepSeek avait prouvé que les dépenses américaines en IA étaient du gaspillage, que la stratégie de contrôle à l’exportation avait échoué — supposait que ce que l’équipe de Liang avait accompli était reproductible n’importe où, par n’importe qui, avec un budget serré. Cette supposition mérite examen. L’infrastructure GPU de High-Flyer avait été constituée avant l’entrée en vigueur des restrictions à l’exportation les plus sévères. Les choix d’ingénierie qui permirent de produire des modèles efficaces à faible coût d’entraînement nécessitaient une expertise d’une profondeur peu commune. Ce que DeepSeek démontra, ce n’est pas que les grands modèles d’IA sont bon marché à construire ; c’est que l’innovation architecturale peut comprimer le coût marginal d’entraînement d’un niveau de capacité donné. La distance entre ces deux affirmations est considérable, et la plupart des commentaires publics les ont confondues.

En février 2025, Liang participa à un symposium avec le président Xi Jinping, aux côtés de certains des dirigeants technologiques les plus en vue de Chine. Ce fut son moment public le plus visible. Il n’est plus apparu en public depuis. DeepSeek a publié un aperçu de V4 en avril 2026 et chercherait, selon les informations disponibles, trois cents millions de dollars de nouveaux investissements à une valorisation de dix milliards. Sa participation — environ quatre-vingt-quatre pour cent en détention directe et indirecte — lui confère à la fois le contrôle et, de toute évidence, la liberté d’être ailleurs que devant un micro.

Il ne conserve presque rien dans le registre public de sa vie privée. Aucune information vérifiée ne concerne un conjoint ou des enfants. Il ne disposait d’aucune présence sur les réseaux sociaux avant que DeepSeek ne devienne une actualité mondiale, et n’en a acquis aucune par la suite.

DeepSeek publiera d’autres modèles. La trajectoire de l’entreprise depuis le moment R1 ne montre aucun signe de ralentissement. Ce qui demeure véritablement incertain, c’est de savoir si Liang Wenfeng émergera un jour pour dire quoi que ce soit à ce sujet, ou si le travail continuera de parler là où il a choisi de se taire.

Étiquettes: , , , , ,

Discussion

Il y a 0 commentaire.