IA

DeepSeek a rendu l’IA bon marché, la bulle américaine pariait l’inverse

Susan Hill

DeepSeek, un laboratoire chinois né d’un fonds spéculatif quantitatif, persiste à faire ce que l’industrie américaine de l’IA jugeait impossible. Il construit des modèles proches de la pointe technologique, les entraîne pour une fraction de ce que dépensent ses rivaux américains, puis publie les poids pour que n’importe qui les télécharge et les fasse tourner. Chaque sortie rouvre le même débat : la valorisation de tout le secteur américain de l’IA repose sur une hypothèse que DeepSeek démonte peu à peu, celle voulant que l’intelligence doive rester chère.

Cette hypothèse n’a rien d’abstrait. Elle soutient des centaines de milliards de dollars de centres de données en construction, le cours des fabricants de puces et des fournisseurs de cloud présents dans presque chaque fonds indiciel, et l’abonnement mensuel que beaucoup de lecteurs paient déjà pour un agent conversationnel. Si un concurrent livre des résultats comparables pour bien moins cher et offre le logiciel, la prime liée à une puissance de calcul rare et coûteuse ressemble moins à une douve qu’à un pari.

L’argument de DeepSeek tient à l’efficacité, pas à la magie. Ses ingénieurs ont misé sur une architecture à mélange d’experts qui n’active qu’une partie du modèle à chaque requête, sur un recours massif aux calculs en précision réduite et sur des chaînes d’entraînement réglées pour tourner avec moins de puces, en partie soumises aux restrictions d’exportation. Le chiffre le plus répété pour l’un de ses entraînements principaux restait sous les six millions de dollars. Les entraînements américains comparables coûtent plusieurs fois cette somme une fois la facture complète additionnée.

La manière de publier le modèle compte autant que son coût. DeepSeek diffuse des poids ouverts : un développeur à São Paulo, un laboratoire universitaire à Varsovie ou une jeune entreprise à Séoul peuvent récupérer le modèle et le faire tourner sur leurs propres machines, sans payer un fournisseur américain à chaque requête ni envoyer leurs données à l’étranger. L’ironie est là : les contrôles à l’exportation censés freiner l’IA chinoise en la privant des puces les plus puissantes semblent avoir poussé DeepSeek à tirer davantage de moins, et ces méthodes économes circulent désormais partout où vont les poids ouverts.

Pour qui se contente d’utiliser ces outils, l’effet immédiat est le choix. Des modèles moins chers tirent les prix des abonnements vers le bas, font tenir des assistants plus performants sur des ordinateurs et des téléphones ordinaires et affaiblissent l’intérêt de se lier à un seul fournisseur. Ce qui ressemblait à un service que l’on loue commence à ressembler à un logiciel que l’on possède.

Le discours sur la bulle appelle d’énormes réserves. Ce chiffre sous les six millions de dollars couvre un seul entraînement final, pas la recherche, les impasses, les salaires ni le matériel qui l’ont rendu possible : le comparer aux dépenses totales d’un laboratoire américain revient à comparer deux choses différentes. Des poids ouverts ne sont pas non plus du code ouvert ; les données d’entraînement et la méthode complète restent privées. Et l’argument de l’efficacité tranche dans les deux sens. Interrogée sur DeepSeek, la direction de Microsoft a invoqué le paradoxe de Jevons, cette vieille observation selon laquelle une ressource moins chère à utiliser voit sa consommation totale grimper plutôt que baisser. Une intelligence moins chère peut simplement signifier que le monde en achète bien davantage, une bonne nouvelle pour ceux qui vendent du calcul, pas une mauvaise.

Ce n’est pas non plus la première fois qu’on déclare la bulle morte. Ce même laboratoire a déjà provoqué la plus forte perte de valeur boursière en une seule journée de l’histoire américaine, effaçant près de six cents milliards de dollars chez un fabricant de puces en un après-midi, avant de voir le titre en regagner presque tout en quelques semaines. Les grandes entreprises américaines de l’IA n’ont pas répondu en dépensant moins. Elles ont levé davantage et bâti plus grand. Toute affirmation selon laquelle la bulle aurait enfin éclaté doit survivre au fait que ceux qui ont le plus d’argent en jeu redoublent leur mise.

Ce que DeepSeek a réellement fait est plus difficile à dramatiser qu’une bulle qui éclate. Il a retiré le confort de croire que les laboratoires américains de tête sont protégés par un mur de capital infranchissable. Si une capacité de pointe peut être approchée à bas coût et distribuée gratuitement, la valeur cesse de résider dans la possession du modèle. Elle se déplace vers la distribution, vers les produits bâtis autour du modèle et vers celui qui tient le client. Le prochain test est déjà au calendrier, même sans date affichée : chaque nouvelle sortie de DeepSeek rouvre la même question et tombe dans un marché qui s’est engagé à dépenser plus, pas moins, convaincu que l’échelle l’emporte encore. Cela se tranchera dans les résultats trimestriels et les prévisions d’investissement des prochains mois, pas dans un fil de forum qui donne déjà le combat pour terminé.

Discussion

Il y a 0 commentaire.