O Google DeepMind は人工知能の世界で最新プロジェクトをリリースしました。 精霊, 生成的インタラクティブ環境 (Generative Interactive Environments) は、画像プロンプトに基づいて真にプレイ可能なゲームを作成することを約束します。どのように機能するかを確認してください:
ジーニーとは何ですか?
新しいAIは、 グーグル 制御可能なアクションを備えたゲームや、写真や絵だけからインタラクティブな環境全体を作成します。同社によれば、この画像は物体など現実世界に存在するものである場合もあれば、テキストを画像に変換する他の AI ツールによって作成されたものである場合もあります。
これは、プロセスをさらに分散化する可能性に加えて、高度なコントロールを備えたゲームをはるかに短い時間で作成できるため、ゲーム界の将来にとって素晴らしい先例となり、アマチュアのゲーム作成者により多くの可能性を与え、ゲームのレベルを平準化することができます。競争。 。
実際、仮説的に言えば、このツールはそれをはるかに超えて、超現実的なシミュレーションを使用してインスタント仮想世界を生成する可能性があります。
同社はまた、次のようなツールを使用して専門家が作成した最も洗練されたものから、図面からゲームを作成できるようになると述べています。 アドビイラストレーター 子どもたちが描いた絵や手作りのスケッチも。
「近年、言語、画像、さらにはビデオを通じて新しく創造的なコンテンツを生成できるモデルを備えた生成 AI の出現を見てきました…今日、私たちは生成 AI、生成インタラクティブ環境の新しいパラダイム、Genie を紹介します。」
Google DeepMind
Genie がどのようにゲームを作成するか
O 精霊 たった 1 枚の画像で制御可能な世界全体を作成でき、同社が提示したモデルによると、AI が動作するためには解像度の高い素材は必要ありません。
この新しいゲーム AI は、ストック レーベルではなく一連のオンライン ビデオからトレーニングされています。 グーグル 2 時間以上のデータと 200.000 億の世界モデルをトレーニングした 11D プラットフォーム ゲームとロボット工学の学習に重点を置いています。もう一つの新機能の注目すべき機能は、 Google ジーニー 変形可能な物体をシミュレートすることを目的としており、将来的にはジェネラリスト AI エージェントのトレーナーになる可能性があると同社は考えています。
「…ジーニーは、監視されていない方法で、一貫した方法でキャラクターを制御するいくつかの潜在的なアクションを学習します。」
Google DeepMind の開発者 Tim Rocktäschel 氏は次のように述べています。 Twitter.
ティム・ロックタッシェル、の彼のアカウントでも述べられています Twitter (または X)AI 精霊 最初のフレームから異なる軌道を作成でき、この作成の焦点は「アクション」です。これはツールの最大の差別化要因である点であり、これは、次のような AI ツールでもまだ見られていません。 ソーラも今月発表されました。
ティムはまた、学習プロセスについても強調しました。 魔神AI これは、ビデオを直観的なデータ単位に圧縮するために一時的にビデオを認識する一種のチャネライザーを使用して、完全に教師なしのビデオ方式で行われました。 潜在的なアクション 2 つのフレームから 8 つのフレームのいずれかへの遷移をエンコードする (潜在的なアクション) 潜在的なアクション そして将来のフレームを予測するMaskGITダイナミクスモデル。
上のビデオでYouTuberのWes Roth氏によると、使用された潜在的なアクションにより、2人の間でどのような種類のアクションが行われたかを理解するプロセスが作成されます。 フレーム ビデオの。したがって、あるキャラクターが地上のフレームに登場し、もう一方のフレームでは空中にいた場合、キャラクターは、その間に起こったアクションがジャンプの理由であることを理解します。ダイナミクスモデル マスクGIT アクションの後に何が起こったかを予測するために使用されます。つまり、ビデオゲームのキャラクターが崖から飛び降りた場合、彼はおそらく落下し、軌道を続けますが、飛び降りた場所から地面に落ちるでしょう。
模範
A ディープマインド そして彼の協力者はいくつかの例を公開しました プロンプト 新しい人工知能を使用して:
可用性
O Google ジーニー 開発中のツールであり、まだ一般公開されていません。同社は市場投入の見通しを明らかにしなかった。
これは、によって作成された最も革新的な AI ツールと思われます。 グーグルというのは、アイデアを紙から取り出して、ほんの数秒で簡潔でインタラクティブなものに変えるための鍵となるからです。この最初の製品デモで提示されたものによれば、この新しいツールは、私たちが次のようなテクノロジー大手に期待していたものです。 グーグル。あとは、彼女が期待を超えて生きられるかどうかを知る必要があるだけです。
人工知能の世界についてさらに詳しく知りたい場合は、以下をお勧めします。 この記事 それが何であるか、主な種類、この分野の進歩などについて詳しく説明します。
また見なさい
Fontesは: Google DeepMind e X.
によってレビュー グラウコンバイタル 27/2/24。
Showmetech について詳しく知る
最新ニュースを電子メールで受け取るには登録してください。