テンセントの生成AI「混元」、事業者向けサービス開始
パラメータ数1000億以上
中国インターネットサービス大手の騰訊控股(広東省・深セン市、テンセント・ホールディングス)は7日、独自開発した文章などを自動生成する大規模言語モデル(LLM)の生成AI(人工知能)「混元(Tencent Hunyuan)」の事業者向けサービスを開始すると発表した。
テンセントが同日に開催した「2023テンセント・グローバルデジタルエコシステム大会」で、クラウド・スマート産業事業群の最高経営責任者(CEO)を務める湯道生(ドーソン・ トン)氏が宣言した。
混元は、1,000億以上のパラメータ数を有し、事前トレーニングモデルは2兆個のトークンでトレーニングされており、中国語と英語で高い文章理解・生成能力を備える。中国語の創作では、複雑な文脈下での論理推理などで優れているという。
パラメーター数は米OpenAIの「GPT -3」が20年時点で1,750億、メタ・プラットフォームの「Llama2」が23年時点で700億で、これらと並ぶ規模となっている。テンセントによると、混元は「幻覚」(不正確な情報を正確であるかのように回答する現象)がLlama2より30%少ないという。
混元はこれまでに、騰訊雲(クラウド)、騰訊広告(ネット広告)、騰訊金融科技(フィンテック、騰訊会議(Web会議アプリ)、微信搜一搜(WeChat内での検索機能)といったグループ内の50以上の部門が導入し、業務効率化の効果を確認したという。
テンセントの蒋杰・副総裁は「テンセントはゼロから大規模言語モデルのトレーニングを開始し、LLMのアルゴリズム、機械学習のフレームワークなどAIの基礎インフラを全て自社で構築した」と紹介した。
中国では生成AI開発競争が激化している。百度(バイドゥ)が「文心一言(アーニーボット)」、中国版TikTok「抖音」が「雲雀大模型」、百川智能が「百川大模型」、商湯科技(センスタイム)が「日日新SenseNova」などをリリースしている。