Newsletter Newsletters Events Évènements Podcasts Vidéos Africanews
Loader
Suivez-nous
Publicité

DeepSeek lance son nouveau modèle d’IA V4 alors que la course mondiale s’accélère

La page de l'application DeepSeek pour smartphone est affichée sur l'écran d'un téléphone à Pékin, le 28 janvier 2025. (Photo AP/Andy Wong, archive)
La page de l'application DeepSeek est affichée sur l'écran d'un smartphone à Pékin, le 28 janvier 2025. (AP Photo/Andy Wong, archives) Tous droits réservés  AP Photo
Tous droits réservés AP Photo
Par Roselyne Min
Publié le
Partager Discussion
Partager Close Button

Chine : la start-up d’IA revient un an après avoir secoué le secteur avec une puissance de calcul « de niveau mondial » à moindre coût

L’entreprise chinoise d’intelligence artificielle DeepSeek a dévoilé une version préliminaire de son nouveau grand modèle de langage, V4, alors que la course mondiale à l’IA s’accélère.

PUBLICITÉ
PUBLICITÉ

DeepSeek est devenue l’une des entreprises d’IA les plus scrutées l’an dernier après avoir lancé en janvier 2025 des modèles qui semblaient offrir de très bonnes performances pour un coût inférieur à celui de nombreux concurrents américains.

La start-up basée à Hangzhou a décliné le modèle en DeepSeek V4-Pro et DeepSeek V4-Flash. V4-Pro est un modèle de plus grande taille destiné aux tâches les plus exigeantes, tandis que V4-Flash est une version plus compacte, conçue pour répondre plus vite et coûter moins cher à l’usage.

« Sur les indicateurs de référence portant sur les connaissances générales, DeepSeek V4-Pro devance nettement les autres modèles open source et n’est que légèrement dépassé par le modèle propriétaire haut de gamme Gemini-3.1-Pro », a indiqué DeepSeek.

L’entreprise précise que le nouveau modèle d’IA prend en charge un « contexte d’un million de tokens », ce qui signifie qu’il peut traiter des requêtes bien plus longues, comme de volumineux documents ou du code, avant de produire une réponse.

En IA, la longueur de contexte désigne la quantité de texte, mesurée en tokens, qu’un modèle peut prendre en compte en une seule fois. Une fenêtre de contexte plus large permet à un modèle d’IA de traiter des entrées plus longues et d’intégrer davantage d’informations dans chaque réponse, selon IBM (source en anglais).

« Bienvenue dans l’ère du contexte 1M à coût optimisé », a déclaré la société dans une annonce publiée sur Hugging Face, une plateforme open source d’IA.

DeepSeek affirme également que V4 offre un « contexte long de niveau mondial avec des coûts de calcul et de mémoire drastiquement réduits ».

DeepSeek a comparé V4-Pro à des modèles concurrents d’OpenAI, d’Anthropic et de Google, même si le Gemini-3.1-Pro de Google a obtenu de meilleurs scores dans certains tests.

Le nouveau modèle est compatible avec des agents d’IA populaires comme Claude Code, OpenClaw et OpenCode, ce qui permet aux développeurs de l’utiliser pour des tâches logicielles en dehors du chatbot maison de DeepSeek.

Réputée pour son approche plus ouverte que celle de ses rivaux aux modèles fermés, DeepSeek a également mis V4 en téléchargement libre sur Hugging Face, où il peut être testé et adapté librement.

La jeune pousse chinoise s’était déjà fait remarquer fin 2024 avec son modèle open source V3, qui avait surpris le secteur de l’IA par ses bonnes performances pour un coût réduit, tout en s’appuyant sur des puces moins puissantes que celles de nombreux concurrents américains, dont OpenAI et Google.

La course mondiale à l’IA

L’entreprise a attiré l’attention mondiale en janvier 2025 lorsqu’elle a lancé R1, un modèle d’IA spécialisé dans le raisonnement que la société présente comme moins coûteux et aussi performant que les grands modèles de langage qui font tourner ChatGPT d’OpenAI.

Toutefois, plusieurs pays ont interdit à leurs administrations l’an dernier d’utiliser DeepSeek, notamment l’Italie, les États-Unis et la Corée du Sud, invoquant des préoccupations de sécurité nationale.

L’Allemagne a également fait retirer DeepSeek des boutiques d’applications d’Apple et de Google en 2025, l’accusant de transférer illégalement des données d’utilisateurs vers la Chine.

La sortie de V4 intervient au lendemain du lancement par le géant américain de l’IA OpenAI de son dernier modèle, GPT-5.5, présenté comme le « plus intelligent et le plus intuitif » à ce jour.

Cette annonce survient aussi au lendemain des accusations de la Maison-Blanche, qui reproche à la Chine de voler, à une échelle industrielle, la propriété intellectuelle des laboratoires américains d’IA à l’aide de milliers de comptes écrans.

OpenAI, Anthropic et Google ont mis en garde cette année contre des entreprises chinoises d’IA, dont DeepSeek, qu’elles accusent de mener des attaques d’extraction de modèle (MEA), également appelées « distillation ».

Cette méthode consiste à soumettre des milliers de questions à un grand modèle, à recueillir ses réponses puis à s’en servir pour entraîner un nouveau modèle plus petit à raisonner de la même manière.

Accéder aux raccourcis d'accessibilité
Partager Discussion

À découvrir également

Taxe britannique sur les services numériques : de quoi s'agit-il et pourquoi irrite-t-elle Trump ?

Dans l'usine pékinoise de Xiaomi : la machine qui sort un smartphone toutes les 6 secondes

DeepSeek lance son nouveau modèle d’IA V4 alors que la course mondiale s’accélère