DeepSeek、華為チップ「昇騰Ascend」を使用か

中国のAI(人工知能)開発企業、杭州深度求索人工知能基礎技術研究(DeepSeek、ディープシーク、浙江省杭州市)が開発したAIモデル「DeepSeek-R1」について、中国通信機器大手の華為技術(ファーウェイ、広東省深セン市)のAIチップ「昇騰(Ascend)」を使って推論ワークロード(新たな入力に対する予測や生成)を実行しているとの推測が出ている。

29日付新浪財経は、李孟氏のブログを引用し、「国内最強のハードウェア(華為のチップ)とソフトウェア(DeepSeekのAI)の強力な組み合わせだ」と指摘。「もちろんDeepseekのAIパワーは昇騰だけでなく、米半導体大手、Advanced Micro Devices(AMD、アドバンスト・マイクロ・デバイセズ)の半導体を使用している」として、昨年12月にリリースしたDeepSeekのオープンソース系AIモデルの「DeepSeek-V3」はAMDのGPU(画像処理半導体)「Instinct MI300X 」上で構築したという。

AMDは、「DeepSeek V3は米OpenAIの『GPT-4o』を凌ぐ最強のオープンソース大規模言語モデル(LLM)だ」と評し、「SGLang(LLMの推論を実行する構造化言語モデルプログラム)を使用して米NVIDIA(エヌビディア)とAMDの両方のGPUで動作させている」ことも明らかにした。さらにLLMのトレーニングデータを提供してくれた中国のネット出前サービス最大手の美団(メイトゥアン、北京市)の推論チーム、フィンランドのAIサービス企業、DataCrunchにも感謝を示している。

李氏によると、DeepSeekは「昇騰とDeepSeekによりハードウエアとソフトウエアの統合が可能となり、モデルの推論効率を向上させるだけでなく、ユーザが異なるハードウエア環境でも柔軟かつ効率的にモデルを展開できるようになった」と分析。演算要件の最適化とトレーニングコストの削減により、DeepSeekは技術革新とコスト管理の面で国産AIの優位性を示しているとした。

AIモデルのオープンソース戦略

DeepSeekの創業者、梁文峰氏は先ごろ北京市内で開いた会議で、「DeepSeekは、SGLang、LMDeploy、TensorRT-LLMなどの複数の主流フレームワークをサポートしている。幅広いフレームワークをサポートすることで、開発者はニーズに応じて適切な開発ツールやフレームワークを選択することができる。このような包括的なオープンソース戦略は、技術の共有と交換を促進するだけでなく、AIエコシステムの構築を加速させる」と言及している。

Tags: , , , , , , , , , , , , ,

関連記事