アリババクラウド、AI画像生成モデル「通義万相」を発表

通義万相によるテキストから画像への生成例「Prompt: Beautiful nature superimposed into an infinite loop sign with bright colours.」

中国IT大手、阿里巴巴集団(アリババ・グループ)でクラウドサービス事業を手掛ける阿里雲智能(アリババクラウド、Alibaba Cloud Intelligence)は7日、上海市で開催された「世界人工知能会議 2023」で最新のAI画像生成モデル「通義万相(Tongyi Wanxiang)」を発表した。

通義万相は、アリババクラウド独自の大規模言語モデル(LLM)「Composer」を使用して開発した。知識整理、視覚AI、自然言語処理(NLP)における先駆的なテクノロジーを搭載し、多言語素材を活用してトレーニングを強化。意味理解能力が高く、文脈に即したより正確な画像生成を実現した。

中国語や英語のテキストプロンプトに応答し、水彩画、油彩画、中国画、アニメーション、スケッチ、フラットイラスト、3D(三次元)漫画など、多様なスタイルのディテールに富んだ画像を生成する。さらに、高解像度の拡散プロセスをS/N比(signal-to-noise ratio)に基づいて最適化することで、構図の正確さと鮮明なディテールをバランスよく保ちながら、高コントラストで視覚的に美しい背景画像を生成する能力を強化している。同生成AI(人工知能)モデルは現在、中国の企業顧客向けにベータテストを実施している。

アリババクラウドはさらに、言語、視覚、音声領域にわたる複雑で専門的なAIタスクの達成を支援するために設計された汎用フレームワークである「ModelScopeGPT(モデルスコープ GPT)」も発表した。ModelScopeは、アリババクラウドが昨年導入したオープンソースのモデル・アズ・ア・サービスプラットフォームであり、900以上のAIモデルを搭載している。

通義万相

ModelScopeGPT

Tags: , , , , , , ,

関連記事