DeepSeek senkt V4-Pro dauerhaft um 75 Prozent auf bis zu 6 Yuan je Million Token
DeepSeek senkt den Preis seines Flaggschiff-Modells V4-Pro dauerhaft um 75 Prozent. Der Schritt drückt die Kosten für API-Zugriffe deutlich und verschärft den Preiswettbewerb bei generativer KI, die Unternehmen über Schnittstellen in eigene Tools und Prozesse einbinden.
Der chinesische Anbieter teilte die Änderung am 24. Mai 2026 mit. Laut dem Bericht von ETEnterpriseAI unter Berufung auf Reuters sinken die API-Preise für V4-Pro von bisher 0,1 bis 24 Yuan auf 0,025 bis 6 Yuan je Million Token. Ein Token ist eine verarbeitete Texteinheit. DeepSeek hält den neuen Tarif nach eigenen Angaben dauerhaft bei einem Viertel des bisherigen Niveaus.
Deutlich billiger pro API-Aufruf
Für Unternehmen ist die Änderung vor allem bei hohem Volumen relevant. Wer Chatbots, Zusammenfassungen oder Suchfunktionen über APIs betreibt, zahlt pro Million Token nun nur noch einen Bruchteil der bisherigen Sätze. Reuters berichtet in derselben Meldung, dass DeepSeek keinen direkten Grund für den dauerhaften Preissturz nannte. Genannt wurde aber erneut Huaweis Ascend-950-Plattform, mit der DeepSeek die Leistung von V4 maximiert habe.
Beim Start von V4 im April 2026 hatte DeepSeek den Pro-Tarif noch mit knapper Rechenkapazität begründet. Damals erklärte das Unternehmen laut Reuters, die Pro-Version koste wegen „constraints in high-end compute capacity“ bis zu zwölfmal mehr als die schwächere Flash-Version. Zugleich stellte DeepSeek damals einen starken Preisrückgang in Aussicht, sobald Huawei Ascend 950 Supernodes in der zweiten Jahreshälfte 2026 in großen Stückzahlen verfügbar seien.
Huawei-Chips im Mittelpunkt
Der Hintergrund reicht über reine Preispolitik hinaus. Huawei profitiert bei KI-Chips von US-Exportkontrollen, die Nvidia vom Verkauf seiner modernsten Halbleiter nach China ausschließen. Reuters verweist zugleich auf weitere Beschränkungen für Chipfertigungsanlagen, die Huaweis Produktionsausbau begrenzen. DeepSeek sagte laut Reuters nicht, ob die nun permanente Senkung bereits auf eine bessere Versorgung mit Ascend-950-Chips zurückgeht.
Preisdruck auf KI-Plattformen
Für den Markt ist der Schritt ein weiteres Signal im laufenden Preiskampf um LLM-Zugänge. Gerade KMU-nahe Software nutzt Modelle zunehmend über APIs statt über eigene Infrastruktur. Sinkende Tokenpreise wirken damit direkt auf Kosten von Assistenten, Automatisierungen und eingebetteten KI-Funktionen. DeepSeek hatte V4-Pro erst im April 2026 eingeführt; die angekündigten Ascend-950-Supernodes sollen laut Reuters in der zweiten Jahreshälfte 2026 in großen Mengen anlaufen.