Deep Seek … ou Deep Shit ?
Il y a quelques années de cela, dans les premiers temps de Twitter, l’apparition d’une baleine à l’écran était un mauvais présage. Cela signifiait que les serveurs de Twitter étaient submergés, et que nous serions privés de discussion pendant quelques minutes, voire quelques heures. Cela signifiait également que si nous voulions continuer à alimenter le café du commerce électronique, il faudrait se rabattre sur un autre outil, comme Facebook.
Ces derniers jours, une nouvelle baleine est apparue sur nos écrans. Une baleine bleue, avec une gueule énorme, qui n’a qu’une envie : engloutit un autre acteur de l’internet…
Vous avez bien évidemment reconnu cette nouvelle baleine. Il s’agit du logo de DeepSeek, l’IA générative venue de Chine. Et tout comme le Covid et l’histoire du Pangolin, elle fait des ravages un peu partout sur la planète.
Canada Dry
On a beaucoup parlé de Canada et de Groenland, ces jours-ci, après les déclarations tonitruantes de Donald Trump. Et bien DeepSeek me fait penser lui aussi au Canada, mais pas au pays, à la boisson qui porte le même nom : Canada Dry. « Il a la couleur de ChatGPT, son nom sonne comme DeepMind, mais ce n’est ni l’un ni l’autre ». C’est DeepSeek. Et il va vous foutre dans la m…
Cela ressemble fichtrement à ChatGPT, ça c’est sûr. Même interface, même logique de fils de discussion, même fluidité, même qualité du texte, même capacité à répondre dans plusieurs langues, à une différence près : en termes de disponibilité, ce n’est pas tout à fait la même histoire. En le testant à plusieurs reprises, j’ai souvent eu le même message :
Alors, des ravages, vraiment ?
It’s the economy, stupid
Des ravages, Deep Seek en fait, et d’abord du côté des bourses qui s’affolent. L’annonce de DeepSeek est en effet arrivée avec quelques propos subversifs, sur le coût supposé du développement de ce nouvel outil qui aidera nos chères têtes blondes à faire leurs devoirs, et à des millions d’internautes de reformuler leur cv, écrire des articles de blog ou traduire un texte dans une autre langue mal maîtrisée. Résultat, l’effondrement du cours NVidia qui perd près de 16% en une séance, avant de se redresser peu à peu.
Un coût que DeepSeek annonce ne s’élever qu’à 6 millions de dollars. Une bagatelle, face à la valorisation de NVidia, dont les puces propulsent les moteurs IA de presque tous les LLM de la planète, ou face aux 500 milliards de dollars d’investissement annoncés il y a quelques jours par Donald Trump, en présence des patrons de Soft Bank, d’Oracle et d’OpenAI.
6 millions contre 500 milliards, on ne parle évidemment pas de la même chose. Mais dans la tête creuse de pas mal de terriens, cela sonne évidemment comme une immense claque à la face du président américain. « Regardez, nous on fait aussi bien que vous, avec des moyens 100 millions de fois inférieurs« . Un ration stratosphérique, encore plus sidérant que le ratio entre le prix d’une robe d’un grand couturier français, et sa copie vendue à 20 euros sur Aliexpress.
Mais parle-t-on réellement de la même chose ?
L’important, c’est ce qu’il y a dans la boîte
Évidemment non, mais ça, le commun des mortels ne le sait pas, ne le comprend pas. Le coût annoncé par DeepSeek ne représente pas le coût du développement, mais le coût de l’entraînement du modèle. Un coût bien inférieur aux investissements réalisés par ses concurrents américains, du fait que DeepSeek a profité des apprentissages réalisés précédemment par d’autres modèles.
De plus, DeepSeek s’est appuyé sur des projets en open source pour gagner en temps de développement, et fournit même un accès open source à ses modèles, permettant à tout développeur de les utiliser, de modifier les paramètres, bref de jouer avec, sans pour autant dévoiler la sauce secrète qui se cache derrière. Pour y accéder, c’est un projet GitHub comme un autre, par ici.
Qu’en conclure ?
Que conclure de tout cela ? Sans être un expert de l’IA, je tire quelques conclusions rapides de cette histoire; D’abord, il faut se demander à qui profite le crime (quelques milliards de dollars de capitalisation boursière disparus en une journée). Le propriétaire de DeepSeek, Liang Wenfeng, est le propriétaire d’un hedge fund chinois, High Flyer, dont la page d’accueil annonce la couleur :
En investissant quelques millions (ou plus) dans un LLM concurrent d’OpenAI, en utilisant des GPU NVidia d’anciennes générations, il a pu démontrer qu’il n’est pas nécessaire de rouler avec le dernier modèle pour aller plus vite ou plus loin. Les propriétaires de vieilles Porsche 911 le savent déjà….
Accessoirement, le débat sur l’explosion de la bulle de l’IA et des LLM n’est pas encore clos. En réduisant (supposément) les coûts d’apprentissage, et en baissant les coûts d’accès à ce type de technologie, DeepSeek ne fait que démocratiser un peu plus cette dernière, donnant en réalité un nouveau coup d’accélérateur. Le besoin en puces NVIdia et autres GPU ne baissera pas, en réalité, aussi paradoxal que cela puisse paraître.
Enfin, tout comme les Russes avaient envoyé un signal fort aux Américains en balançant Gagarine dans l’espace avant tout autre astronaute, DeepSeek envoie un autre signal fort à l’Amérique de Donald Trump. Un signal qui dit simplement : « Eh toi, le grand blond avec la mèche, tu peux rouler des mécaniques autant que tu veux, tu ne nous fais pas peur. On peut te plier toi et technologie en un rien de temps. Tu crois que l’Amérique est grande ? N’oublie pas à qui tu as affaire…«
Le signal a-t-il été entendu ?…
Découvrez d'autres articles sur ce thème...
Hervé Kabla, ancien patron d’agence de comm’, consultant très digital et cofondateur de la série des livres expliqués à mon boss.
Crédits photo : Yann Gourvennec