アリババなど、次世代AIモデル「世界模型」に20億元投資

(生数科技の発表より)

中国IT大手、阿里巴巴集団(アリババ・グループ)は10日、AI(人工知能)動画生成ツール「Vidu」の開発元である北京生数科技(Shengshu Technology、北京市)のBラウンドに20億元(約466億円)をリード投資したことが明らかになった。この巨額投資はテクノロジー大手が「世界模型(ワールドモデル)」に全力を傾け、現実世界をより忠実に再現できる新型AIの構築を目指していることを示している。

今回のラウンドはアリババが主導し、好未来教育(TAL Education)と百度(バイドゥ)ベンチャーズも参加した。これは生数科技がわずか2カ月以内に完了した2度目の大規模資金調達で、直前には啓明創投などの支援を受けて6億元の調達を完了していた。生数科技は最新の具体的な評価額の開示を拒否しているが、相次ぐ資本の注入はこの技術路線に対する市場の高い評価を示している。

今回の投資の核心的な論理は、現在の主流AI技術路線に対する業界の深い反省にある。過去数年間、OpenAIのChatGPTに代表されるテキスト学習ベースの大規模言語モデルが市場を席巻してきた。しかし応用シーンが深化するにつれ、開発者たちはテキストだけではAIが複雑な物理法則を真に理解することは難しいと気づき始めた。

大規模言語モデル(LLM)の限界が徐々に明らかになるにつれ、世界のAI競争の焦点は「テキスト生成」から「現実世界のシミュレーション」へと移行しつつある。テキストのみに依存する学習では、AIが複雑な物理法則や空間的な因果関係を真に理解することには本質的な制約があるとの認識が広がっており、視覚・音声・触覚などのマルチモーダルデータを統合した「世界模型」の構築が次世代AIの中核的な技術路線として注目を集めている。

生数科技はViduシリーズの動画生成モデルを通じてこの分野での技術的地位を確立しており、今回の具身知能企業との連携は、同社の技術をデジタル空間から物理空間へと拡張する重要な一歩となる。ヒューマノイドロボットが現実の環境で自律的に行動するためには、物理世界の動態を高精度で予測・シミュレートできるモデルが不可欠であり、生数科技のワールドモデル技術はこの需要に直接応えるものだ。

生数科技は「視覚・音声・触覚などのマルチモーダルデータに基づいて構築された汎用ワールドモデルは、大規模言語モデルよりも自然に物理世界の仕組みを捉えられる」と主張している。設立からわずか3年のこのスタートアップは声明の中でその技術ビジョンを説明した。同社の創業者である朱軍氏はさらに「我々の目標は知覚と行動を結びつけることだ」と補足し、この新型モデルによってAIシステムが現実世界の挙動をより良くシミュレートし予測できるようにして、デジタル世界と物理世界の隔たりを打ち破ることを目指していると述べた。

AI分析機関のデータによれば、生数科技が今年1月に発表したVidu Q3 Proは、テキストと画像から動画を生成するAIモデルの中ですでに世界トップ10に入っている。この技術力がアリババを引き寄せた重要な要因でもある。

実際、アリババの「ワールドモデル」分野への布石はすでに静かに進んでいた。Eコマース出身のテクノロジー大手として、アリババは2月にロボット駆動用のモデルを投入したほか、動画生成用の無料オープンソースAIモデルも発表している。生数科技に加え、アリババは最近PixVerseの6,000万ドルの調達にもリード投資した。PixVerseは今年初めにAIワールドモデルを発表し、ユーザーが動画生成の過程で展開方法を精密に制御できるようにしている。一方、百度と百度ベンチャーズも先月、Tripo AIの5,000万ドルの調達をリード投資した。Tripo AIは写真からAI技術を使って3Dデジタルモデルを素早く生成することに取り組んでおり、言語モデルが使用する技術から脱却し、物理空間に基づくAIツールの開発へと転換していることを明確に表明している。

この投資ブームの背景には、AIの次の段階の形態についての世界的なテクノロジー界の共通認識がある。米国の技術誌「Wired」の共同創業者であるケヴィン・ケリー氏は先月のSubstackコラムで、ワールドモデルはロボット工学にとって不可欠であり、この技術にはLLM以上のものが必要だと指摘した。ケリー氏は「最終的に人間の知性を再現するには、AIに推論能力・物理世界の理解・継続的な学習という3つの要素が必要だ」と述べ、現在のチャットボットはすでに知識の要素を構築しているが「ワールドモデルこそが突破が急務の重要領域だ」と特に強調した。

激しい市場競争の中、中国のテクノロジー企業は「ワールドモデル」を通じて逆転を目指している。OpenAIが動画生成モデルSoraの関連サービスを段階的に終了させた後、バイトダンス・快手(Kuaishou)を含む複数の企業が類似のAI動画生成ツールを相次いで投入している。

生数科技はこのほど、同社がすでに複数の具身知能(Embodied AI)を開発する企業と戦略的パートナーシップを構築したと明らかにした。これらの協力は、AI技術を物理世界と相互作用するヒューマノイドロボットなどのシステムに応用し、産業・商業・家庭環境に服務することを目的としている。

生数科技完成近20亿元B轮融资,以通用世界模型定义下一代数字与物理世界生产力底座

Tags: , , , , , ,

関連記事