Le monde de la technologie et la concurrence entre les États-Unis et la Chine ont été bouleversés lorsqu’une entreprise technologique chinoise relativement inconnue a récemment mis sur le marché un modèle open-source qui a rapidement surpassé ses concurrents américains les plus importants, tant en termes de qualité que d’efficacité des ressources.
Ce résultat en a choqué plus d’un et a provoqué ce que certains appellent le « moment Sputnik » de l’Amérique : la prise de conscience que la Chine représente un concurrent redoutable. Toutefois, avant de céder au battage médiatique, analysons et comprenons ce qui s’est vraiment passé.
À ce stade de l’histoire, la plupart des gens connaissent des modèles d’intelligence artificielle (IA) ou des entreprises telles que ChatGPT, le produit omniprésent d’OpenAI, CoPilot de Microsoft ou Gemini de Google. Même si vous n’utilisez pas ces produits spécifiques, vous pouvez les solliciter sans le savoir à travers d’autres entreprises qui utilisent leurs modèles fondamentaux. La création et la « formation » de ces modèles nécessitent une énorme énergie intellectuelle et, plus fondamentalement, de l’énergie informatique.
Au fond, ces modèles informatiques ne sont rien d’autre que d’énormes modèles statistiques. Ils ne sont pas à proprement parler intelligents, mais ce sont des modèles statistiques qui déterminent quelle doit être la lettre ou le mot suivant dans une séquence et quelle est la réponse que vous cherchez à donner à votre question.
Permettez-moi de vous donner un exemple simple. Si je vous donne la phrase « Mon chien est malade et je vais l’emmener chercher des médicaments chez le … », vous pourriez probablement déduire, en vous basant sur le contexte, le mot manquant dans la séquence. Ces modèles statistiques sont entraînés sur des quantités massives de texte en utilisant des modèles statistiques en couches pour déduire que le mot manquant est « vétérinaire ».
Les modèles statistiques utilisés sont énormes et nécessitent des ressources considérables. Les besoins en calcul et en électricité sont si importants que le gouvernement américain estime que d’ici 2030, soit dans moins de cinq ans, 10 à 15 % de la demande d’électricité aux États-Unis pourraient être consacrés aux centres de données exécutant des modèles d’IA. On estime qu’OpenAI, le propriétaire de ChatGPT, a dépensé plus de 100 millions de dollars rien que pour entraîner son modèle.
La principale avancée réalisée par l’entreprise chinoise DeepSeek repose sur la création d’un modèle de pointe qui surpasse les modèles comme ChatGPT, mais à un prix bien inférieur. Selon DeepSeek, la formation de ce modèle a coûté entre 5 et 6 millions de dollars, contre 100 millions de dollars pour la formation du modèle ChatGPT. Il faut souligner que cette volonté d’accroître l’efficacité concerne l’ensemble du secteur et n’est pas propre à DeepSeek ou aux entreprises chinoises. Cependant, ce qui devient intéressant, c’est de regarder comment DeepSeek y est parvenu, et de connaître son histoire.
Techniquement, l’approche de DeepSeek permettant de gagner en efficacité n’est ni nouvelle, ni inédite. Ce qui est nouveau, c’est qu’elle combine plusieurs techniques que d’autres entreprises et chercheurs ont utilisées pour améliorer l’efficacité en un seul modèle. Chacune de ces techniques a permis d’améliorer l’efficacité, mais DeepSeek a combiné toutes les techniques bien connues et établies en un seul modèle.
Les techniques individuelles sont toutefois bien connues. Par exemple, une technique appelée quantification prend simplement un nombre dans le modèle statistique qui peut avoir 32 décimales et le réduit à, disons, 4 à 8 décimales.
Une autre technique est appelée le modèle du mélange d’experts. Ce modèle est comparable aux sections d’une bibliothèque ou aux engrenages d’une voiture. Lorsqu’un utilisateur pose une question sur un modèle d’IA, plutôt que d’utiliser le modèle dans son intégralité, il peut envoyer certaines questions à un expert spécifique et développer plusieurs modèles plus petits pour répondre à des questions spécifiques, qui fonctionnent également en tant que partie du modèle plus vaste dans son ensemble lorsque cela est nécessaire.
Toutes les techniques mentionnées ici et d’autres utilisées par DeepSeek sont des techniques bien établies qui permettent d’accroître l’efficacité de la modélisation, mais elles n’avaient jamais été utilisées auparavant dans le cadre d’un modèle unique.
L’histoire de DeepSeek prend une tournure différente en raison de la campagne de relations publiques qu’elle a menée. L’entreprise a d’abord prétendu avoir formé son modèle de base avec des ressources limitées, tout en affirmant avoir accès à 50.000 des processeurs les plus avancés au monde. Elle a affirmé n’avoir dépensé que 5 millions de dollars pour la formation, alors qu’elle avait à sa disposition près de 2 milliards de dollars, ce qui représenterait au total 4 milliards de dollars, en tenant compte des autres coûts connexes. La version présentée par l’entreprise ne tient pas la route.
L’histoire de DeepSeek s’est révélée encore plus confuse lorsque l’entreprise a fait savoir que ce projet n’était qu’une activité secondaire. Étant donné la nature politique de l’accès à un nombre limité de processeurs de pointe en Chine – dont l’exportation vers la Chine est officiellement bloquée – il semble peu probable qu’une start-up inconnue ait la priorité sur des piliers technologiques établis tels qu’Alibaba, Tencent et Baidu sans une influence significative. Il est clair qu’il ne s’agit pas d’une activité secondaire et que, venant de l’un des plus grands fonds spéculatifs chinois, qui compte 200 employés, il est probable qu’elle bénéficie d’un soutien et d’une influence significatifs, même si on ne connaît pas encore exactement l’origine de son financement.
Il y a de multiples leçons à tirer de ce que l’on sait aujourd’hui.
Tout d’abord, la percée technologique est, certes, une percée importante au niveau de la production en assemblant toutes ces techniques, mais fondamentalement, il n’y a pas eu de percée technique novatrice.
Deuxièmement, l’ensemble du secteur de l’IA évolue rapidement, et ce qui est à la pointe du progrès aujourd’hui peut facilement devenir obsolète et dépassé dans un mois ou deux. Ce n’est qu’au cours de l’année écoulée que le dirigeant chinois Xi Jinping s’est ouvertement inquiété du retard de la Chine sur les entreprises américaines spécialisées dans l’IA. Toutefois, les prouesses chinoises dans le domaine de l’intelligence artificielle et des secteurs connexes, qui sont si étroitement liés et si bien financés par l’appareil de sécurité du Parti communiste chinois, devraient constituer une source d’inquiétude à long terme.
Troisièmement, alors que le président Donald Trump a émis un décret pour tenter de trouver un acheteur pour TikTok, DeepSeek semblerait tomber sous le coup de la même loi. Puisque DeepSeek affirme envoyer les données en Chine et mener une grande variété d’activités, telles que l’enregistrement des frappes au clavier, les activités de collecte de données de toutes les entreprises chinoises ayant un lien avec l’électronique devraient préoccuper de plus en plus l’administration Trump.
Quatrièmement, malgré toutes les informations fournies, de nombreux Américains ont vécu une sorte de moment Sputnik en prenant conscience de l’adversaire redoutable que représente l’État autoritaire du Parti communiste chinois. L’administration Trump aurait tout intérêt à ne pas se contenter de critiquer la Chine, mais à mettre en place des politiques et à inciter les entreprises les plus compétitives et les plus innovantes du monde à relever le défi chinois et à développer des technologies dirigées et contrôlées par les Américains.
Espérons que ce sera le moment Sputnik qui nous permettra de définir une nouvelle orientation quant aux défis auxquels nous sommes confrontés face à un concurrent sérieux et à la manière dont nous devons relever ce défi pour protéger la liberté et le leadership des États-Unis.
Les opinions exprimées dans cet article sont celles de l’auteur et ne reflètent pas nécessairement celles d’Epoch Times.
Comment pouvez-vous nous aider à vous tenir informés ?
Epoch Times est un média libre et indépendant, ne recevant aucune aide publique et n’appartenant à aucun parti politique ou groupe financier. Depuis notre création, nous faisons face à des attaques déloyales pour faire taire nos informations portant notamment sur les questions de droits de l'homme en Chine. C'est pourquoi, nous comptons sur votre soutien pour défendre notre journalisme indépendant et pour continuer, grâce à vous, à faire connaître la vérité.