中国LLMが米国に迫る、DeepSeekの「R1」の衝撃

企業のAI投資の95%はゼロリターン=米スタンフォード大

米スタンフォード大学の人間中心AI研究所(Stanford HAI)は13日、423ページに及ぶ「2026年AI(人工知能)インデックスレポート」を発表した。中国のAI開発企業、杭州深度求索人工知能基礎技術研究(DeepSeek、ディープシーク、浙江省杭州市)が発表した大規模言語モデル(LLM)「R1」が一時的に米国モデルに追いつき、その後双方は高頻度での性能の入れ替わり期に入ったとしている。

2017年から毎年発行されているこのレポートは、大規模言語モデルのリリース数と出所・業界への資本流入・労働市場の変化・エネルギー消費と環境影響・一般市民の態度など複数の側面を網羅する、AI業界の発展を追跡する最も包括的な年次文書となっている。

研究機関Epoch AIのデータによれば、26年3月時点で、Dario Amodei(ダリオ・アモデイ)氏が率いる米国トップAI企業Anthropic(アンソロピック)の最先端モデルは、性能面で中国の最強の競合相手をわずか2.7ポイント上回るにすぎない。この競争の転換点は25年2月に訪れた。DeepSeekが発表したR1モデルが一時的に米国モデルに追いつき、その後双方は高頻度での性能の入れ替わり期に入った。今年のレポートの主編集者Nestor Maslej(ネスター・マスレイ)氏は、このリードの繰り返す逆転が、世界トップクラスのAI研究がある種の「技術的平等化」の段階に入ったことを示すと指摘した。

モデル産出数量は中国は30個

モデル産出数量の面では、米国が25年に50の注目すべきトップモデルを発表し、中国が30個でそれに続いた。モデルの絶対数と民間投資総額では米国が2,859億ドル(約45兆4581億円)に対し、中国の124億ドルで依然リードしているが、レポートは政策立案者に対して、帳簿上の数字が中国の実際の投資を大幅に過小評価していると特に警告している。2000年以来、中国政府の誘導ファンドがAI企業に注入した資金の累計はすでに約1,840億ドルに達しており、この「政府が舞台を作り、企業が演じる」モデルにより、中国はAI論文数・論文引用シェア・特許取得数において世界第1位の座を安定して占めている。

また中国は産業用ロボットの設置台数でも世界をリードしており、24年の設置台数は29万5,000台に達した。これはAIが物理世界で具現化される段階において、中国がより深いエンジニアリング基盤を持つ可能性を示唆している。

演算能力は米国が圧倒的トップ

米国のAI演算能力(コンピューティングパワー)王座は維持されているが、その圧力は電力網に転嫁されている。Stanford HAIのデータによれば、米国は5,427のデータセンターを保有し、中国の449、ドイツとイギリスの各約525を大きく上回る。25年末時点でAIデータセンターの総電力容量は29.6ギガワット(GW)に達し、ニューヨーク州のピーク電力需要に匹敵する。データセンターの規模拡大には顕著な環境コストが伴っており、Stanford HAIレポートはxAIのGrok 4モデルの学習が約7万2,816トンの二酸化炭素(CO2)換算量を排出すると推計しており、これは一般的な乗用車約1,000台の生涯排出量を上回る。

AIモデルの性能は過去10年で急速に向上し、加速傾向にある。マルチモーダル大規模言語モデルが新たなベンチマークを攻略する速度はベンチマークの公開速度に近づいている。AIエージェントの進化速度が最も顕著で、OSWorldベンチマーク(自律的なコンピューター使用をテスト)とSWE-Bench Verifiedベンチマーク(自律的なコーディングをテスト)のスコア曲線はいずれも最も急峻な上昇を示している。

「人類の究極試験」ベンチマークでは、2025年のレポート時点でトップのOpenAIのo1モデルが正解率わずか8.8%だったが、その後38.3%まで上昇した。2026年4月時点では、最高スコアのAnthropicのClaude Opus 4.6とグーグルのGemini 3.1 Proが50%を超えている。一方でAIモデルは一部の一般的なタスクで依然として低い性能を示しており、マルチモーダルLLMがアナログ時計を読み取る能力をテストするClockBenchでは、最高性能のOpenAI GPT-5.4でも正解率はわずか50%にとどまった。ロボットが家事をこなす能力にも大きな差があり、衣類の折り畳みや食器洗いなどの実際の家事での成功率はわずか12%だ。

医療分野でのAI普及

医療分野でのAI応用は急速な進展を見せている。過去2年間で、AI活用による創薬に関する論文数は2倍以上に増加した。臨床応用では、患者の診察から自動的に臨床記録を生成するツールが2025年に広く採用され、複数の病院システムで医師が記録作成時間を最大83%削減し、職業的燃え尽き症候群が大幅に低減したと報告されている。

具体的なタスクに焦点を当てると、AIは測定可能な効率向上をもたらしている。カスタマーサポートエージェントは1時間当たりの問題解決数が約15%増加し、GitHub Copilotを使用するソフトウェア開発者はプルリクエストの完了数が26%増加、AIを活用した広告制作を行うマーケティングチームは一人当たりの生産性が50%向上した。しかし独立したMITの研究によれば、企業のAI投資の95%は約350〜400億ドルの投資でゼロリターンとなっており、大規模なツール展開に成功した企業はわずか5%にとどまっている。

25年の世界AI投資は過去最高の5,810億ドルを超え、24年の2,530億ドルの2倍以上となった。大部分の資金が米国に流れ、2025年の米国AI投資は3,440億ドルを超えた。ただしレポートは、民間投資のみに基づく比較が中国のAIへの投資額を過小評価している可能性があると改めて強調している。

生成AIの普及速度は依然として加速している。生成AIは3年間で53%の人口普及率に達し、パソコンやインターネットよりも速い普及速度を記録した。2026年初頭時点で、生成AIツールの米国消費者への推計年間価値は1,720億ドルに達し、ユーザー一人当たりの平均価値は2025年から2026年にかけて2倍になった。

世論調査では国ごとに顕著な差異が見られる。中国・マレーシア・タイ・インドネシア・シンガポールなどの東南アジア諸国はAIに対して積極的な態度を示している。米国の一般市民の態度は他国と比べて最も慎重で、AIが仕事を改善すると期待する米国人はわずか33%で、世界平均の40%を下回った。政府のAI規制への信頼度ではシンガポールが81%で首位に立つ一方、米国は31%で調査対象国中最下位となった。

レポートはまた、現在最も能力の高いモデルが最も透明性が低いという懸念すべき傾向も指摘している。基盤モデルの透明性指数の平均スコアは2024年の58点から今年は40点に低下しており、最も能力の高いモデルほど開示する情報が少ない傾向がある。

スタンフォード大学のAIインデックスレポートは本質的に、人間と機械が共に書き上げた「生存マニュアル」だ。423ページの内容は、AIがもはや物語を語るだけで生き残れた幼少期を過ぎ、商業的リターン・エネルギーのボトルネック・グローバルな主権競争という成人の試練に直面しつつあることを示している。この4,050億ドルの大勝負はちょうど後半戦に入ったばかりであり、最終的な勝者は必ずしも最も算力が強い者ではなく、物理的な現実に最も適応でき、商業的価値を最も還元できる者となるだろう。

Tags: , , , ,

関連記事