米エヌビディア、LLM「Nemotron 3」を発表

AIモデル開発者への転身狙う

米半導体大手のNVIDIA(エヌビディア)は15日、新たなオープンソース大規模モデル(LLM)「Nemotron 3」シリーズを発表した。検索、計画、ツール実行、検証といった複数の知能エージェントが協調して動作する次世代AI(人工知能)システムに向け、高スループット、高精度推論、そして超長文脈処理能力を兼ね備えた基盤モデルを提供する狙いだ。

Nemotron 3は、Nano、Super、Ultraの3つの仕様で構成され、それぞれ明確な役割を持つ。Nanoは約300億パラメータ(有効30億)で、DGX SparkやH100、B200 GPU向けに最適化され、効率重視のタスクに特化する。Superは約1000億パラメータで、多数のエージェントが連携する高度な推論用途を想定。Ultraは約5000億パラメータ規模となり、最も複雑な応用に対応する最高水準の推論性能を提供する。

現時点でNano版はすでに利用可能で、高スループットかつ長文脈対応のエージェントAI構築の基盤を担う。SuperおよびUltraは2026年上半期の投入が予定されており、より深い推論能力と効率重視の設計によって性能を拡張する計画だ。第三者評価機関Artificial Analysisのベンチマークでは、Nemotron 3 Nanoは同規模モデルの中でトップクラスの精度を記録した。

Nemotron 3の中核を成すのは、3つの技術革新である。第1に、Mamba層、Transformer層、MoE(専門家混合)を融合したハイブリッドアーキテクチャだ。Mambaは超長系列を低メモリで処理し、Transformerは精緻な論理推論を担い、MoEは必要な「専門家」だけを動的に呼び出すことで計算効率を高める。この組み合わせにより、高精度を維持しつつ並列処理性能を最大化する。

第2に、多環境強化学習による後学習である。NVIDIAはオープンソースのNeMo Gym上で、API呼び出し、コード実行、段階的計画立案など現実に近いタスクを通じてモデルを鍛えた。これにより、長い推論過程での逸脱を抑え、実運用での信頼性を高めている。

第3が、最大100万トークンという超大規模コンテキストウィンドウだ。タスクの背景、履歴、計画を一つの文脈内に保持できるため、情報分断を防ぎ、長期かつ一貫した推論を可能にする。企業向けの大規模文書解析や複数セッションにまたがるエージェント協調において、事実性と論理性を大きく向上させる。

今後投入されるSuperとUltraでは、さらなる高度化が図られる。潜在MoEにより、同じ計算コストで最大4倍の専門家を活用できる設計を採用。加えて、一度に複数トークンを生成する多トークン予測で応答速度を向上させ、独自の4ビット浮動小数点形式「NVFP4」により、精度とコストの最適なバランスを実現する。

NVIDIAはまた、Nemotronの開発過程で使用した大規模データセットも公開する。3兆トークン規模の事前学習データ、1300万件の後学習用データ、強化学習データ、安全性評価用のエージェント軌跡データなどを含み、モデル開発の透明性を大きく高めた。NeMo Gymや各種評価ツールと組み合わせることで、開発者は独自のNemotronモデルを訓練・拡張できる。

早期導入企業には、アクセンチュア、デロイト、EY、オラクル、パランティア、シーメンス、Zoomなどが名を連ねる。NVIDIA生成AIソフトウェア担当副社長のカリ・ブリスキ氏は、100万トークン文脈と新アーキテクチャを組み合わせ、完全にカスタマイズ可能なAI構築を支援する姿勢を強調した。

今回のNemotron 3発表は、単なる新モデル投入にとどまらない。NVIDIAがチップ供給企業から、トップクラスのAIモデル開発者へと戦略的に踏み出す象徴的な一歩といえる。背景には、OpenAIやGoogle(グーグル)といった主要顧客が自社AIチップ開発を進め、将来的にハードウェア依存を下げる可能性があるという業界構造の変化がある。

Jen-Hsun Huang(ジェンスン・ファン)最高経営責任者(CEO)は「オープンなイノベーションこそがAI進歩の基盤だ」と語る。訓練データまで公開する徹底したオープン戦略は、開発者の参入障壁を下げ、AIエコシステムの中核としての地位を固める狙いだ。

もっとも、課題も残る。Hugging Faceの統計によれば、中国企業によるオープンソースモデルは更新速度や技術開示の面で評価が高く、世界の開発者から強い支持を集めている。中国では国産チップと国産モデルによる閉じたエコシステム構築も進みつつあり、長期的には英伟达の市場基盤を揺るがす可能性も否定できない。

それでも、オープンモデルが全トークン処理量の約3分の1を占めるという調査結果が示すように、開放型AIの重要性は増す一方だ。Nemotron 3は、英伟达がAI時代の「基盤インフラ」であり続けるための布石であり、将来の業界地図を左右する戦略的な一手として位置付けられている。

NVIDIA Debuts Nemotron 3 Family of Open Models

Tags: , , , , , , ,

関連記事