- von Krystal Hu und Stephen Nellis und Fanny Potkin
SAN FRANCISCO/SINGAPUR, 25. Feb (Reuters) - DeepSeek, das chinesische Labor für künstliche Intelligenz, dessen Low-Cost-Modell im vergangenen Jahr die Weltmärkte erschütterte, hat den US-Chipherstellern sein kommendes Flaggschiffmodell nicht zur Leistungsoptimierung gezeigt, so zwei mit der Angelegenheit vertraute Insider. Damit weicht das Unternehmen von der üblichen Praxis der Branche vor einem größeren Modell-Update ab.
Stattdessen hat das Labor, das voraussichtlich sein nächstes großes FOKUS, V4, auf den Markt bringen wird, inländischen Zulieferern, darunter Huawei Technologies, einen frühen Zugang gewährt, so die Insider.
KI-Entwickler geben in der Regel Vorabversionen größerer Modelle an führende Chiphersteller wie Nvidia NVDA.O und Advanced Micro Devices AMD.O weiter, um sicherzustellen, dass ihre Software auf weit verbreiteter Hardware effizient funktioniert. DeepSeek hat bereits zuvor eng mit den technischen Mitarbeitern von Nvidia zusammengearbeitet. (link)
NVIDIA, AMD AUSGELASSEN
Für sein kommendes Modell, das um das Mondneujahrsfest herum veröffentlicht werden sollte, gewährte DeepSeek Nvidia und AMD keinen Zugang und gab den chinesischen Chipherstellern, einschließlich Huawei, einen Vorsprung von mehreren Wochen, um die Software für ihre Prozessoren zu optimieren, so die Insider.
Nvidia und AMD lehnten eine Stellungnahme ab. DeepSeek und Huawei reagierten nicht auf Bitten um Kommentare.
Reuters konnte den Grund für die Entscheidung nicht sofort ermitteln.
"Die Auswirkungen auf Nvidia und AMD für allgemeine Datenbeschleuniger sind minimal - die meisten Unternehmen nutzen DeepSeek nicht, das eher als Benchmarking-Modell dient", sagte Ben Bajarin, CEO des Forschungsunternehmens Creative Strategies. Er fügte hinzu, dass neue KI-Codierungstools die Zeit, die benötigt wird, um Software auf Hardware zum Laufen zu bringen, von Monaten auf Wochen reduzieren
Der Schritt ist wahrscheinlich Teil einer umfassenderen Strategie der chinesischen Regierung, die versucht, amerikanische Hardware und Modelle in China zu benachteiligen", so Bajarin.
Die Entwicklung kommt zu einem Zeitpunkt, an dem ein hochrangiger Beamter der Trump-Administration der Nachrichtenagentur Reuters (link) mitteilte, dass das neueste KI-Modell von DeepSeek auf dem fortschrittlichsten Chip von Nvidia, Blackwell, mit Hilfe eines Clusters auf dem chinesischen Festland trainiert wurde, was einen Verstoß gegen die US-Exportkontrollen darstellt.
DeepSeek wird möglicherweise versuchen, technische Indikatoren zu entfernen, die seine Verwendung amerikanischer KI-Chips offenbaren, und plant, öffentlich zu behaupten, dass es Huawei-Chips zum Trainieren seines Modells verwendet hat, so der US-Beamte.
Die Modelle von DeepSeek wurden auf der Open-Source-Plattform Hugging Face mehr als 75 Millionen Mal heruntergeladen, seit das Unternehmen im Januar 2025 auf den Plan trat, und trugen dazu bei, eine Welle chinesischer Open-Source-Modelle anzustoßen, die mit den US-amerikanischen KI-Labors konkurrieren. Bei den im letzten Jahr veröffentlichten Modellen haben die Downloads für chinesische Modelle die Downloads aus allen anderen Ländern auf der Plattform übertroffen.
Der rasante Anstieg chinesischer Open-Source-Modelle hat die Debatte in Washington über den Export fortschrittlicher KI-Chips aus den USA nach China verschärft. Letztes Jahr erlaubten die US-Behörden die Wiederaufnahme der Lieferungen von Nvidias H20- und AMDs MI308-Chips, die für KI-Inferenzen entwickelt wurden, nach China, auch wenn die Lizenzen für fortschrittlichere Prozessoren weiterhin eingeschränkt sind. Es war unklar, ob DeepSeek die Genehmigung zum Kauf dieser US-Chips erhalten hat.
Die Chips H20 und MI308 sind für die Inferenz, d. h. die Ausführung trainierter KI-Modelle, bestimmt. Die Nachfrage nach dem MI308 war beträchtlich: AMD gab an, im letzten Quartal 390 Millionen Dollar mit dem Chip umgesetzt zu haben.
DeepSeek ist eine von mehreren chinesischen KI-Firmen, die diesen Monat neue Modelle vorstellen sollen.