G
GEO Toolbox
cest-quoi-deepseekdeepseekdeepseek-r1open-weightschinese-aillmguide

Qu’est-ce que DeepSeek ? L’IA chinoise à poids ouverts

Qu’est-ce que DeepSeek ? Le laboratoire chinois derrière R1, V3 et V4 : le mythe des 6 millions de dollars, poids ouverts vs open source, la CNIL et les prix.

Samy Ben SadokSamy Ben Sadok21 min de lecture
Dans cet article13 sections

DeepSeek est le laboratoire chinois d’IA dont les modèles à poids ouverts et bon marché ont brièvement effacé un montant record de la valorisation de Nvidia et mis le reste du secteur à cran. Si vous vous souvenez de la panique de janvier 2025 et voulez la version claire de ce qu’est réellement DeepSeek, qui le développe, s’il est sûr et où il en est aujourd’hui, voici l’essentiel, à jour en juillet 2026 et jusqu’à la version V4, que la plupart des articles explicatifs n’ont toujours pas intégrée.

Ce dernier point compte. Presque tous les articles « qu’est-ce que DeepSeek » que vous trouverez ont été écrits pendant la frénésie autour de R1 début 2025, et s’arrêtent là. C’est vrai aussi côté français : les principales explications en français (Tenable, BFMTV, Le Temps) datent toutes de cette même semaine de janvier 2025 et n’ont jamais été mises à jour depuis. Nous couvrons ici ce qu’elles omettent ou déforment : la gamme de modèles actuelle, la véritable histoire derrière les fameux « 6 millions de dollars », la distinction entre poids ouverts et open source, la réalité des enjeux de sécurité et de la question chinoise, ce que dit précisément la CNIL, et ce qu’un modèle ouvert chinois puissant signifie pour la présence de votre marque dans les outils d’IA.

Ce qu’il faut retenir

  • DeepSeek est un laboratoire chinois d’IA basé à Hangzhou et financé par le hedge fund High-Flyer, connu pour ses modèles à poids ouverts R1, V3 et V4, gratuits en version chat et nettement moins chers que les modèles fermés américains sur l’API.
  • Le fameux chiffre de « 6 millions de dollars » ne couvre qu’une seule session d’entraînement final pour V3, pas le coût réel de l’entreprise, estimé à plus d’un milliard de dollars et environ 50 000 GPU Nvidia.
  • DeepSeek est à poids ouverts, pas open source : les modèles se téléchargent et s’utilisent librement sous licence MIT, mais les données d’entraînement ne sont jamais publiées, une nuance qu’aucune source française grand public ne fait correctement à ce jour.
  • En France, la CNIL n’a pas interdit DeepSeek mais a ouvert une analyse du service dès janvier 2025, une posture d’enquête plus mesurée que le blocage prononcé par l’Italie.
  • Un modèle plus puissant et plus utilisé, y compris via des applications tierces qui l’intègrent, élargit le nombre d’endroits où l’IA peut citer ou déformer votre marque.

Qu’est-ce que DeepSeek ?

DeepSeek est un laboratoire chinois d’intelligence artificielle basé à Hangzhou, qui développe des grands modèles de langage (LLM) à poids ouverts (« open weights »), ainsi que le chatbot qui s’appuie dessus. Ses modèles les plus connus sont DeepSeek-R1, un modèle de raisonnement, et les familles DeepSeek-V3 et V4 destinées à un usage généraliste. La société a été fondée, et reste principalement financée, par High-Flyer, un fonds spéculatif quantitatif.

Comme Kimi, DeepSeek recouvre en réalité deux choses, et bien les distinguer dissipe l’essentiel de la confusion. Il y a d’un côté le produit hébergé : le chatbot gratuit sur chat.deepseek.com et l’API payante, que DeepSeek fait tourner sur ses propres serveurs. Et il y a de l’autre les modèles à poids ouverts sous-jacents, que DeepSeek publie pour que tout le monde puisse les télécharger, les exécuter et les adapter. Le modèle est ouvert ; le service qui l’entoure appartient à DeepSeek.

Cette distinction est la clé de presque toutes les questions qu’on se pose sur DeepSeek, car les réponses diffèrent souvent selon qu’il s’agit de l’application hébergée ou des poids ouverts qu’on exécute soi-même. DeepSeek a bâti sa réputation en proposant des performances de pointe en raisonnement et en code pour une fraction du coût des modèles américains fermés, ce qui explique pourquoi son arrivée a bouleversé le marché. Le qualifier de « ChatGPT chinois bon marché » ne rend justice ni à ce qu’il a accompli, ni aux vraies questions qu’il pose.

Qui est à l’origine de DeepSeek ? High-Flyer et Liang Wenfeng

DeepSeek a une origine inattendue : un fonds spéculatif. L’entreprise a été fondée en juillet 2023 par Liang Wenfeng, qui avait déjà cofondé High-Flyer, un fonds quantitatif chinois qui réalisait des opérations de trading à l’aide de l’IA et avait accumulé des GPU Nvidia pendant des années avant le durcissement des contrôles américains à l’exportation. High-Flyer a scindé son laboratoire de recherche en IA pour créer DeepSeek, et Liang dirige les deux entités. Basé à Hangzhou, le laboratoire est resté volontairement de petite taille, avec environ 160 collaborateurs, recrutant des chercheurs tout juste sortis des meilleures universités chinoises plutôt que des experts chevronnés et coûteux.

Cette origine explique en grande partie le fonctionnement de DeepSeek. L’entreprise se définit comme axée sur la recherche et ne s’est pas précipitée pour monétiser ses produits, d’où, en partie, la gratuité d’une si large part de ses services. Le financement a suivi la notoriété : selon des informations d’avril 2026, une nouvelle levée de fonds aurait valorisé la société à près de 10 milliards de dollars, des rapports plus récents évoquant des chiffres plus élevés. DeepSeek ne confirme pas ces montants ; traitez-les comme des estimations rapportées, pas comme des chiffres officiels.

Donc oui, DeepSeek est une entreprise chinoise, et ce fait sous-tend les questions de sécurité et de données abordées plus bas. Mais il faut être précis sur son actionnariat : DeepSeek appartient à High-Flyer et est dirigée par Liang, pas par l’État chinois, même si, comme toute entreprise chinoise, elle est soumise à la législation chinoise.

La gamme DeepSeek : R1, V3 et V4

DeepSeek fait tourner deux gammes de modèles. La série V (V3, V4) regroupe des modèles généralistes. La série R (R1) regroupe des modèles de raisonnement, qui traitent un problème étape par étape avant de répondre. La percée a eu lieu en janvier 2025 avec DeepSeek-R1, qui a égalé les performances d’o1 d’OpenAI sur des benchmarks clés de raisonnement et de maths, pour une fraction du prix. Depuis, la gamme a évolué vite, et c’est précisément là que les explications obsolètes montrent leurs limites. La suite montre où en sont les choses.

Modèle (juillet 2026)SortieDescription
DeepSeek-V3Décembre 2024Modèle généraliste : 671 milliards de paramètres au total / 37 milliards actifs (mixture-of-experts, ou mélange d’experts), contexte de 128 000 tokens
DeepSeek-R1Janvier 2025Le modèle de raisonnement à l’origine de la panique ; a égalé les performances d’OpenAI o1 sur des benchmarks clés, pour un coût bien inférieur
DeepSeek-V3.1Août 2025Modèle hybride combinant un mode « réflexion » et un mode rapide sans réflexion
DeepSeek-V3.2Décembre 2025Attention plus efficace sur les contextes longs
DeepSeek-V4 (aperçu)Avril 2026V4-Pro (1 600 milliards de paramètres au total / 49 milliards actifs) et V4-Flash (284 milliards / 13 milliards actifs), tous deux avec un contexte de 1 million de tokens

Quelques points à retenir. La plupart de ces modèles sont de type « mélange d’experts » (mixture-of-experts, ou MoE) : ils comportent un nombre considérable de paramètres, mais n’en activent qu’une petite partie pour chaque token, ce qui explique leur faible coût d’exécution. Le grand saut d’avril 2026 a été l'aperçu de V4, qui a porté la fenêtre de contexte à un million de tokens et donné naissance à deux modèles distincts : un modèle Flash rapide et un modèle Pro plus lourd, tous deux publiés en poids ouverts sous licence MIT.

Il manque toujours un modèle qu’on nous demande sans cesse : DeepSeek-R2. Attendu en 2025, il n’a toujours pas été publié à ce jour. Certaines informations suggèrent que Liang Wenfeng n’était pas satisfait des performances du modèle, et pointent aussi vers des difficultés matérielles liées à une volonté d’entraînement sur des puces Huawei fabriquées en Chine. La gamme évoluant tous les deux mois environ, considérez ce tableau comme un instantané de juillet 2026 et vérifiez la fiche du modèle que vous utilisez réellement. (DeepSeek a par ailleurs annoncé le passage de V4 en version stable, hors aperçu, pour la mi-juillet 2026 ; vérifiez si c’est déjà le cas au moment de votre lecture.)

Pourquoi DeepSeek a bouleversé le marché, et le mythe des 6 millions de dollars

Quand l’application DeepSeek s’est hissée en tête de l’App Store américain fin janvier 2025, la réaction ne portait pas vraiment sur le chatbot. Elle portait sur le coût. DeepSeek affirmait avoir entraîné un modèle de pointe pour quelques millions de dollars, ce qui, si c’était vrai, remettait en cause l’idée que seules les entreprises dépensant des milliards pouvaient rivaliser. Les marchés l’ont pris au pied de la lettre : Nvidia a chuté d’environ 17 % en une journée et perdu de l’ordre de 600 milliards de dollars de valorisation, tandis que les commentateurs parlaient d’un « moment Spoutnik » pour l’IA.

L’efficacité est bien réelle. DeepSeek s’est fortement appuyé sur une architecture en mélange d’experts, des calculs en faible précision et une ingénierie ingénieuse pour entraîner des modèles compétitifs sur les puces, moins performantes, qu’il pouvait encore acheter légalement. Mais le chiffre mythique mérite une nuance. Le « 6 millions de dollars » (plus précisément 5,576 millions) correspondait au coût d’une seule session d’entraînement final pour V3, pas au coût de développement de DeepSeek. Il exclut la recherche, les essais infructueux, le personnel et le matériel. Selon l’estimation de SemiAnalysis, DeepSeek repose sur environ 50 000 GPU Nvidia et une infrastructure représentant bien plus d’un milliard de dollars. La percée était réelle ; le chiffre repris en une était le plus petit chiffre véridique disponible, pas la facture réelle.

Il y a un second bémol sur la façon dont DeepSeek est devenu aussi performant pour un coût aussi bas. Le rapport R1 de DeepSeek décrit lui-même un entraînement sur des données de raisonnement générées par d’autres modèles, et OpenAI a accusé DeepSeek d’avoir « distillé » à partir d’o1. En février 2026, Anthropic a affirmé que DeepSeek, aux côtés d’autres laboratoires chinois dont Moonshot et MiniMax, avait utilisé environ 24 000 faux comptes pour collecter, dans le même but, plus de 16 millions d’échanges de conversations avec Claude. La part attribuée spécifiquement à DeepSeek serait d’environ 150 000 échanges, selon les chiffres avancés par Anthropic. Rien de tout cela n’a été prouvé devant un tribunal pour l’instant, et la distillation est une pratique courante dans le secteur, mais cela fait partie du tableau : une partie de ce qui a rendu DeepSeek si peu coûteux, c’est d’avoir pu apprendre de modèles que d’autres avaient déjà payé pour les construire.

DeepSeek est-il open source ? Poids ouverts vs open source

DeepSeek est présenté comme open source à peu près partout, y compris par des gens censés être mieux informés, et cette qualification n’est qu’à moitié exacte. Les modèles de DeepSeek sont à poids ouverts, pas open source. Depuis R1, DeepSeek publie ses modèles phares sous licence MIT, l’une des licences les plus permissives qui soient, avec très peu de contraintes. C’est réellement plus ouvert que Kimi, dont la licence modifiée ajoute une obligation d’attribution. Vous pouvez télécharger un modèle DeepSeek, l’exécuter, l’ajuster et le commercialiser.

Ce que vous ne pouvez pas faire, c’est le reconstruire. Les poids ouverts, cela veut dire que les fichiers finaux du modèle sont publics. L’open source, au sens strict, impliquerait aussi de publier les données d’entraînement et suffisamment de détails sur la méthode pour reproduire le modèle à partir de zéro. DeepSeek publie des articles détaillés, plus que la plupart des autres, mais ne divulgue pas ses données d’entraînement : vous pouvez donc utiliser le modèle librement sans pouvoir en auditer ou en recréer intégralement la fabrication.

Cette distinction n’est pas que théorique, car elle change ce à quoi vous pouvez vraiment vous fier et ce que vous pouvez réellement contrôler. C’est aussi une nuance qu’aucune des principales sources françaises sur le sujet, y compris certaines qui devraient le savoir, ne fait correctement à ce jour : la plupart parlent d'« open source » sans distinction, y compris quand elles citent la licence MIT et l’absence de données d’entraînement publiées dans le même paragraphe. La même vague de modèles à poids ouverts, DeepSeek, Kimi, le GLM de Zhipu, Qwen, Llama, Mistral, redéfinit le marché précisément parce que les poids sont libres de circuler, même si aucun d’entre eux n’est ouvert au sens strict du terme. Si vous comparez DeepSeek au reste, notre guide comparatif des principaux modèles chinois les met dans un même tableau. Et cela met en évidence le point le plus pratique sur la sécurité de DeepSeek : puisque les poids sont publics et sous licence MIT, vous n’êtes pas obligé d’utiliser les serveurs de DeepSeek, ce qui change complètement la donne côté confidentialité.

DeepSeek est-il sûr ? Confidentialité, interdictions et la question chinoise

C’est la question qu’on pose le plus souvent à propos de DeepSeek, et elle a plusieurs réponses honnêtes selon l’usage qu’on en fait. Commençons par le contenu. Comme tout modèle important, DeepSeek a des garde-fous et peut quand même se tromper avec assurance, donc vérifiez ce qui compte vraiment. Il suit aussi les règles chinoises en matière de contenu : demandez au chatbot hébergé son avis sur la place Tiananmen ou Taïwan, et il refusera ou reprendra la ligne officielle ; la mise à jour R1-0528 s’est d’ailleurs fait remarquer pour avoir encore durci ce filtrage. Cette censure est plus forte dans l’application hébergée et plus légère dans les poids bruts que vous exécutez vous-même.

Le vrai enjeu pour les entreprises, ce sont les données. Quand vous utilisez l’application gratuite ou l’API, vos prompts partent vers les serveurs de DeepSeek en Chine, ce qui les place sous juridiction chinoise et sous les lois d’accès aux données qui vont avec. Ce n’est pas une inquiétude théorique : en janvier 2025, la société de sécurité Wiz a découvert une base de données DeepSeek exposée publiquement, non authentifiée et accessible depuis Internet, qui exposait plus d’un million de lignes de logs, dont des historiques de conversations et des clés API. DeepSeek a sécurisé la base après la divulgation, mais c’était une négligence élémentaire pour un service qui traite des prompts sensibles.

C’est pourquoi DeepSeek a été restreint par de nombreuses institutions et autorités, et il faut être précis sur ce que « interdit » veut dire ici. La plupart des mesures visent l’application hébergée sur des appareils officiels, pas une interdiction générale pour les particuliers : la marine américaine, le Pentagone, la NASA et le Congrès, ainsi qu’une liste croissante d’États américains (le Texas en premier, suivi depuis par une quinzaine d’autres), et des organismes gouvernementaux dans des pays comme l’Australie, Taïwan, la Corée du Sud et l’Inde l’ont bloqué sur leurs propres systèmes. L’Italie est allée plus loin : dès janvier 2025, son autorité de protection des données (le Garante) a ordonné le blocage de DeepSeek et fait retirer l’application des boutiques italiennes, une mesure toujours en vigueur mi-2026. Une procédure distincte, menée par l’autorité de la concurrence italienne (AGCM) sur des questions de protection des consommateurs, s’est refermée fin avril 2026 sans lever ce blocage. L’Allemagne, elle, a demandé à Apple et Google de faire de même, pour des raisons de transfert de données. Pour la plupart des gens dans la plupart des pays, DeepSeek reste librement accessible ; les restrictions se concentrent sur les gouvernements, les postes sensibles, et les pays aux règles de données plus strictes comme ceux de l’UE.

La principale solution, c’est celle que permettent les poids ouverts. Si la localisation des données ou la censure sont rédhibitoires, vous n’êtes pas obligé de passer par les serveurs de DeepSeek : une équipe peut exécuter les poids ouverts sous licence MIT sur sa propre infrastructure, de sorte que les prompts ne quittent jamais les locaux et que le comportement de l’application hébergée ne s’applique plus. La charge d’un hébergement bien fait vous revient alors, mais c’est la réponse la plus claire à la question chinoise pour les usages sensibles : auto-héberger plutôt qu’envoyer.

Et en France : la CNIL, l’AI Act et l’alternative Mistral

La CNIL n’a pas interdit DeepSeek, contrairement à l’Italie : dès le 30 janvier 2025, elle a ouvert une analyse du service et interrogé l’entreprise sur son fonctionnement et les risques pour la protection des données. C’est une posture d’enquête, pas une sanction ni une interdiction. Ses préoccupations portent spécifiquement sur la collecte des adresses e-mail et de l’historique complet des conversations, et sur la question de savoir si ces données sont accessibles aux autorités chinoises en vertu du droit chinois. La CNIL n’a publié depuis ni avis ni sanction sur ce dossier précis ; seules ses recommandations générales pour les fournisseurs de modèles d’IA existent à ce jour.

Un conflit réglementaire inédit : l'AI Act européen contre le secret industriel chinois

Depuis le 1er juin 2026, la réglementation chinoise (SAMR) classe les données d’entraînement, les algorithmes de recommandation et les modèles de contrôle des risques comme des secrets industriels protégés, au moment même où l’article 53 de l’AI Act européen impose aux fournisseurs de modèles à usage général de publier un résumé suffisamment détaillé de leurs données d’entraînement. DeepSeek, comme son compatriote Qwen, se retrouve pris entre deux obligations contradictoires : trop en dire expose à des sanctions administratives chinoises, ne pas en dire assez viole les règles de transparence européennes. Aucun précédent d’application n’existe encore ; le premier litige fera jurisprudence.

Pour les entreprises françaises, la question la plus concrète n’est pas celle d’une interdiction administrative, mais celle de la gouvernance interne. Tester DeepSeek sur des tâches non sensibles ne pose pas de problème particulier ; l’utiliser sans cadre pour des données clients, des dossiers RH ou des exports comptables en pose un. Depuis le début de l’application progressive de l’AI Act, les organisations qui déploient de l’IA ont tout intérêt à documenter une politique d’usage interne, une « charte IA » ; la plupart des PME françaises n’en ont pas encore, ou ne la font pas respecter, ce qui laisse un vrai vide de gouvernance pendant que l’usage de DeepSeek se répand.

C’est ce contexte, bien plus qu’un simple réflexe patriotique, qui pousse les entreprises françaises sensibles à la localisation des données vers Vibe (ex-Le Chat) de Mistral : hébergement dans l’UE, un abonnement Pro facturé nativement en euros (14,99 € HT, soit environ 18 € TTC, par mois), et aucune des questions de transfert de données vers la Chine que soulève DeepSeek. Ce n’est pas un choix dicté par les benchmarks : Mistral ne revendique pas d’égaler DeepSeek sur le raisonnement pur. C’est une option crédible pour qui traite des données personnelles européennes et veut limiter son exposition le temps que le dossier CNIL se clarifie.

DeepSeek face à ChatGPT, Claude et Kimi

La même erreur de catégorie fausse la plupart des comparaisons, autant la corriger d’entrée : DeepSeek et Kimi sont des modèles qu’on télécharge et qu’on exécute, tandis que ChatGPT et Claude sont surtout des produits qui donnent accès à des modèles fermés qu’on loue (les modèles gpt-oss d’OpenAI mis à part). Ceci posé, place au paysage concret.

OutilCe que c’estPoints fortsPoids ouverts ?Coût approximatif
DeepSeek (High-Flyer)Modèle à poids ouverts + applicationRaisonnement, code, maths, coût très faibleOui (MIT)Très faible ; auto-hébergement gratuit possible
ChatGPT (OpenAI)Produit s’appuyant sur les modèles GPTUsage général, images, voix, l’écosystème le plus largeNon (modèle phare) ; modèles gpt-oss séparés, ouiFormule gratuite ; payante à partir de 20 $ (env. 24 € TTC en France) par mois
Claude (Anthropic)Produit s’appuyant sur les modèles ClaudeRédaction, raisonnement soigné, documents longsNonFormule gratuite ; payante à partir de 20 $ (env. 21-22 € TTC) par mois
Kimi (Moonshot)Modèle à poids ouverts + application (également en Chine)Tâches agentiques multi-étapes, code, contexte longOui (licence MIT modifiée)Faible ; auto-hébergement gratuit possible

Un même prix de 20 $ aboutit à deux montants légèrement différents en France : cela vient de l’entité qui facture, du taux de change appliqué au moment du prélèvement et du traitement de la TVA propre à chaque éditeur, pas d’une erreur de conversion.

Côté capacités, en toute franchise, c’est sur le raisonnement, le code et le prix que DeepSeek rivalise le mieux, là où les modèles de la classe R1 font un travail comparable à des modèles américains bien plus chers. Là où les produits fermés gardent l’avantage, c’est sur la finition générale, l’étendue multimodale (images, voix), la fiabilité sur des tâches variées et la profondeur de l’écosystème. Des évaluateurs indépendants pointent aussi des garde-fous de sécurité plus faibles sur DeepSeek, ce qui le rend plus facile à pousser vers des réponses que les modèles fermés refusent. Face à ChatGPT et Claude, le compromis oppose coût et ouverture d’un côté, finition et support de l’autre ; face à Kimi, DeepSeek est le spécialiste du raisonnement et du coût, tandis que Kimi est davantage orienté vers les usages agentiques, et les deux partagent les mêmes réserves sur l’hébergement chinois. Les questions de distillation vues plus haut s’appliquent ici aussi : une partie de la valeur de DeepSeek tient à ce qu’il a rattrapé son retard vite et à bas coût, avec l’aide, voulue ou non, des modèles qu’il concurrence.

DeepSeek est-il gratuit ? Tarifs et modalités d’accès

Oui, DeepSeek est gratuit via l’application web et les applications mobiles, sans paiement requis. C’est surtout l’API qui se démarque, avec des tarifs nettement inférieurs à ceux des laboratoires américains. Les chiffres ci-dessous sont les tarifs actuels de l’API V4 ; ils évoluent, et les anciens alias de modèles (deepseek-chat, deepseek-reasoner) seront retirés le 24 juillet 2026, donc vérifiez avant de développer dessus.

UsagePrix (juillet 2026)Ce que vous obtenez
Chat gratuitGratuitAccès web et mobile, aucune configuration
API (V4-Flash)Environ 0,14 $ en entrée / 0,28 $ en sortie par million de tokensLe modèle rapide et économique ; contexte de 1 million de tokens
API (V4-Pro)Environ 0,44 $ en entrée / 0,87 $ en sortie par million de tokensLe modèle DeepSeek le plus puissant pour le raisonnement et les agents ; contexte de 1 million de tokens
Auto-hébergementLicence gratuite ; coût matériel importantFaites tourner les poids ouverts vous-même ; vos données restent sur vos serveurs

DeepSeek facture en dollars ; il n’existe à ce jour aucune offre officielle en euros, contrairement à Mistral qui facture Vibe nativement en euros. Il s’agit d’une API destinée aux professionnels : pour une entreprise française assujettie à la TVA, celle-ci s’autoliquide en principe et n’est donc généralement pas ajoutée sur la facture par DeepSeek. Ces tarifs d’API ne représentent qu’une infime fraction de ce que facturent les modèles fermés haut de gamme, ce qui explique pourquoi les développeurs se tournent vers DeepSeek pour les tâches à fort volume où le coût compte. L’accès se décline en plusieurs formules : le web et l’application gratuits, l’API compatible OpenAI pour développer, et l’auto-hébergement des poids ouverts pour qui veut un contrôle total. L’auto-hébergement n’est vraiment réaliste que pour les entreprises disposant d’un matériel GPU sérieux, les modèles phares étant volumineux, mais c’est la voie qui évite complètement la question de l’hébergement chinois. Pour tous les autres, l’application gratuite ou un fournisseur tiers hébergeant DeepSeek hors de Chine reste le compromis pratique.

Ce que DeepSeek apporte à la visibilité dans l’IA

Au-delà des spécifications techniques, l’histoire de DeepSeek cache un angle marketing plus pointu qu’il n’y paraît. Chaque nouveau modèle performant est un endroit de plus où un client peut demander « quel est le meilleur outil pour X » ou « [votre entreprise] est-elle fiable » et agir en fonction de la réponse. DeepSeek en fait partie, et le côté poids ouverts amplifie l’effet : comme les poids sont publics, DeepSeek ne répond pas seulement dans sa propre application. Il est hébergé, ajusté et intégré dans une longue traîne de produits en aval que vous n’auditerez jamais un par un.

Nos recherches pour cet article ont mis en lumière une leçon plus nette encore. Demandez à un modèle d’IA actuel « qu’est-ce que DeepSeek », et plusieurs le décrivent encore comme une histoire limitée à V3 et R1, sans avoir la moindre idée que V4 existe. Les modèles peuvent être obsolètes, même sur leurs propres concurrents. C’est tout le jeu en miniature : les réponses de l’IA ne valent que ce que valent les sources qu’elle trouve, donc une page claire et à jour est ce qui vous vaut d’être représenté correctement, plutôt que par la bouillie obsolète qu’un modèle a en mémoire. C’est le fondement du generative engine optimization.

Concrètement, cela se joue en deux temps. D’abord, l’accessibilité : chacun de ces modèles, et les robots d’exploration qui les alimentent, doit pouvoir accéder à votre site, sinon vous êtes invisible pour la moitié vivante du système. Ensuite, la cohérence : les marques bien décrites sont celles dont les faits concordent sur l’ensemble des pages qu’un modèle est susceptible de lire. D’après notre expérience chez geotoolbox, les entreprises qui apparaissent bien dans les réponses d’IA sont rarement celles qui ont la plus belle page d’accueil ; ce sont celles qu’un modèle peut trouver, analyser et juger fiables, sans buter sur des contradictions. Nos guides sur ce qu’est le GEO et le suivi de votre visibilité IA creusent les deux sujets.

La vague des modèles ouverts ne change pas tant le jeu qu’elle n’élargit le terrain : il y a simplement plus de moteurs capables de citer, ou de déformer, ce que vous avez construit. Le premier réflexe, c’est de vérifier s’ils peuvent seulement vous lire. Lancez gratuitement notre score de préparation IA pour voir si les robots d’IA peuvent accéder à votre site et l’analyser, et où se situent les lacunes, avant que le prochain modèle ne sorte et que la question ne se repose.

Foire aux questions

L’utilisation de DeepSeek est-elle sans danger ?

Cela dépend de l’usage. Les modèles ont des garde-fous comme n’importe quel assistant, mais DeepSeek suit les règles chinoises en matière de contenu et censure les sujets politiquement sensibles, et ses filtres de sécurité sont globalement plus faibles que ceux des leaders fermés. Côté données, l’application hébergée et l’API envoient vos prompts vers des serveurs en Chine, et DeepSeek a connu un vrai incident d’exposition de base de données début 2025 ; pour un usage sensible, mieux vaut auto-héberger les poids ouverts plutôt qu’utiliser l’application.

DeepSeek est-il gratuit ?

Oui. Les applications web et mobile sont gratuites, et l’API figure parmi les moins chères de tous les modèles majeurs, environ 0,14 $ par million de tokens en entrée pour V4-Flash en juillet 2026. Les poids ouverts sont aussi gratuits à télécharger et exécuter sous licence MIT si vous avez le matériel. Les prix évoluent, vérifiez la page officielle des tarifs.

DeepSeek est-il interdit aux États-Unis ?

Pas pour les particuliers ordinaires. Les mesures américaines sont ciblées : la marine, le Pentagone, la NASA, le Congrès et une liste croissante d’États américains (le Texas en premier) ont bloqué l’application hébergée sur leurs appareils officiels, et d’autres gouvernements à l’étranger ont fait de même. L’Italie est allée plus loin en retirant l’application de ses boutiques d’applications. Mais il n’y a pas d’interdiction générale aux États-Unis, et la plupart des gens peuvent toujours l’utiliser librement.

DeepSeek est-il interdit en France ?

Non. La CNIL a ouvert une analyse du service dès janvier 2025 et interrogé DeepSeek sur son fonctionnement, mais elle n’a ni sanctionné ni interdit l’application, contrairement à l’Italie, qui a bloqué DeepSeek et retiré l’application de ses boutiques. Pour un usage professionnel impliquant des données clients, RH ou personnelles, mieux vaut s’en tenir à l’auto-hébergement des poids ouverts ou à une alternative comme Vibe (ex-Le Chat) de Mistral, hébergée dans l’UE.

DeepSeek est-il vraiment open source ?

Pas au sens strict. DeepSeek publie ses modèles en poids ouverts sous la licence MIT, très permissive, donc vous pouvez les télécharger, les exécuter et les adapter librement, ce qui est réellement ouvert. Mais l’entreprise ne publie ni ses données d’entraînement ni sa recette complète, donc vous ne pouvez pas reproduire ou auditer intégralement la façon dont les modèles ont été construits. « Poids ouverts » est le terme exact.

DeepSeek a-t-il vraiment coûté 6 millions de dollars à construire ?

Non. Le chiffre de 6 millions de dollars (5,576 millions précisément) correspond au coût d’une seule session d’entraînement final pour le modèle V3, pas au coût de l’entreprise. Il exclut la recherche, les essais infructueux, le personnel et le matériel. Une analyse indépendante estime l’infrastructure réelle de DeepSeek à environ 50 000 GPU et bien plus d’un milliard de dollars. L’efficacité était réelle, mais le chiffre repris en une était le plus petit chiffre véridique disponible.

DeepSeek est-il meilleur que ChatGPT ?

Cela dépend de la tâche. DeepSeek est apprécié pour le raisonnement, le code et un coût très faible, et rivalise de près avec les meilleurs modèles sur ce terrain. ChatGPT est plus large et plus abouti, avec images, voix et un écosystème plus étendu, et des garde-fous de sécurité plus stricts. Beaucoup de gens utilisent les deux et choisissent selon la tâche.

Sources

Keep reading