DeepSeek : La Startup d’IA Chinoise qui Révolutionne le Secteur

L’intelligence artificielle (IA) est en pleine effervescence, et une startup chinoise nommée DeepSeek est en train de bousculer l’industrie avec ses modèles d’IA révolutionnaires. Fondée en 2023 par le passionné d’IA Liang Wenfeng, DeepSeek a rapidement gagné en notoriété grâce à ses prouesses technologiques et son approche disruptive du marché.

Les Origines de DeepSeek

DeepSeek trouve ses racines dans High-Flyer Capital Management, un fonds spéculatif quantitatif chinois qui utilise l’IA pour éclairer ses décisions de trading. Liang Wenfeng, cofondateur de High-Flyer en 2015, a lancé le laboratoire DeepSeek en 2023 pour se consacrer à la recherche sur les outils d’IA, indépendamment de l’activité financière de High-Flyer.

Dès le début, DeepSeek a construit ses propres clusters de centres de données pour l’entraînement de modèles. Cependant, comme d’autres entreprises d’IA en Chine, DeepSeek a été impacté par les interdictions d’exportation de matériel imposées par les États-Unis. Pour former l’un de ses modèles récents, l’entreprise a dû utiliser des puces Nvidia H800, une version moins puissante d’une puce, la H100, disponible pour les entreprises américaines.

Des Modèles d’IA Puissants et Abordables

En novembre 2023, DeepSeek a dévoilé sa première série de modèles : DeepSeek Coder, DeepSeek LLM et DeepSeek Chat. Mais c’est au printemps dernier, lorsque la startup a lancé sa famille de modèles de nouvelle génération DeepSeek-V2, que l’industrie de l’IA a commencé à prendre note.

DeepSeek-V2, un système d’analyse de texte et d’images à usage général, a obtenu de bonnes performances dans divers benchmarks d’IA, tout en étant beaucoup moins cher à exploiter que les modèles comparables de l’époque. Cela a contraint les concurrents nationaux de DeepSeek, comme ByteDance et Alibaba, à réduire les prix d’utilisation de certains de leurs modèles, et à en rendre d’autres complètement gratuits.

En décembre 2024, DeepSeek-V3 n’a fait qu’ajouter à la notoriété de DeepSeek. Selon les tests de référence internes de DeepSeek, DeepSeek V3 surpasse à la fois les modèles téléchargeables et disponibles publiquement comme Llama de Meta, et les modèles « fermés » auxquels on ne peut accéder que par une API, comme GPT-4 d’OpenAI.

Tout aussi impressionnant est le modèle de « raisonnement » R1 de DeepSeek. Lancé en janvier, DeepSeek affirme que R1 est aussi performant que le modèle o1 d’OpenAI sur les principaux benchmarks. En tant que modèle de raisonnement, R1 vérifie efficacement ses propres faits, ce qui l’aide à éviter certains des pièges qui trompent normalement les modèles.

Une Approche Disruptive du Marché

Le modèle économique de DeepSeek n’est pas clair, car l’entreprise fixe les prix de ses produits et services bien en dessous de la valeur du marché, et en offre d’autres gratuitement. DeepSeek affirme que des percées en matière d’efficacité lui ont permis de maintenir une compétitivité extrême en termes de coûts. Certains experts contestent cependant les chiffres fournis par l’entreprise.

Quoi qu’il en soit, les développeurs se sont emparés des modèles de DeepSeek, qui ne sont pas open source au sens commun du terme, mais sont disponibles sous des licences permissives qui autorisent une utilisation commerciale. Selon Clem Delangue, PDG de Hugging Face, l’une des plateformes hébergeant les modèles de DeepSeek, les développeurs sur Hugging Face ont créé plus de 500 modèles « dérivés » de R1 qui ont totalisé 2,5 millions de téléchargements.

L’Impact de DeepSeek sur l’Industrie de l’IA

Le succès de DeepSeek face à des rivaux plus grands et plus établis a été qualifié de « bouleversement de l’IA » et de « sur-médiatisé ». Le succès de l’entreprise a été en partie responsable de la chute de 18 % du cours de l’action de Nvidia lundi, et a suscité une réponse publique de Sam Altman, PDG d’OpenAI.

Microsoft a annoncé que DeepSeek est disponible sur son service Azure AI Foundry, la plateforme de Microsoft qui regroupe les services d’IA pour les entreprises sous une seule bannière. Interrogé sur l’impact de DeepSeek sur les dépenses d’IA de Meta lors de son appel sur les résultats du premier trimestre, le PDG Mark Zuckerberg a déclaré que les dépenses dans les infrastructures d’IA continueront d’être un « avantage stratégique » pour Meta.

Dans le même temps, certaines entreprises bannissent DeepSeek, tout comme des pays et des gouvernements entiers. Quant à ce que l’avenir de DeepSeek pourrait réserver, ce n’est pas clair. L’amélioration des modèles est une certitude. Mais le gouvernement américain semble se méfier de plus en plus de ce qu’il perçoit comme une influence étrangère néfaste.

DeepSeek prouve que l’innovation en IA ne se limite pas à la Silicon Valley. Avec ses modèles performants et abordables, la startup chinoise force l’industrie à repenser ses stratégies et ses business models.

En résumé, DeepSeek est en train de secouer le monde de l’IA avec son approche audacieuse et ses percées technologiques. Bien que son avenir soit incertain face aux défis géopolitiques, une chose est sûre : l’entreprise a déjà laissé une marque indélébile sur l’industrie et a poussé les géants de la tech à revoir leurs positions. Les prochaines années s’annoncent passionnantes pour le secteur de l’IA, avec DeepSeek en acteur majeur à suivre de près.

À lire également