指示通りに何でも描けるAIが誰でも使えるようになる

指示通りに何でも描けるAIが誰でも使えるようになる
指示通りに何でも描けるAIが誰でも使えるようになる

ライフハッカーのロゴ

  • Bluesky ページを見る (新しいタブで開きます)
  • Instagramページを見る(新しいタブで開きます)
  • Facebookページで見る(新しいタブで開きます)
  • YouTubeページを見る(新しいタブで開きます)
  • Twitterページを見る(新しいタブで開きます)
  • コピーしました

当初は「信頼できるテスター」のみに公開されていましたが、現在では誰でも DALL·E 2 ベータ版にサインアップできます。

指示通りに何でも描けるAIが誰でも使えるようになる

クレジット: OpenAI/YouTube

目次


テクノロジーは素晴らしいですが、正直に言うと、時々少し退屈になることもあります。コンピューターやスマートフォンは毎年少しずつ進化し、ソフトウェアはサブスクリプション型に移行し、一般的にイノベーションはそれほど頻繁ではありません。しかし、時折、新しい技術開発は実に驚きと興奮をもたらします。この新しいAIは、どんなものでも引き寄せる力を持っているので、私もそう感じています。

OpenAIが開発したこのソフトウェアはDALL·E 2と呼ばれ、機械学習を用いてユーザーが入力したテキストの説明に基づいて新しい画像を生成します。その仕組みの例はウェブサイトでご覧いただけます。開発者は、様々な被写体、アクション、設定を組み合わせることで、DALL·E 2が説明からどのように異なる画像を生成するかを確認できるようにしています。

例えば、「宇宙飛行士がフォトリアリスティックなスタイルで馬に乗っている」という検索語は、まさにその画像を生成します。その結果、MTVのプロモーション写真のような、馬に乗った宇宙飛行士の様々な「写真」が生まれます。「フォトリアリスティックなスタイル」を「鉛筆画」に置き換えると、馬に乗った宇宙飛行士の複数のスケッチのように見えるものが突然現れます。ただし、実際には誰も描いていません。すべてAIによって生成されたものです。

ライフハッカーのロゴ

あなたも気に入るかもしれない

しかし、このAIはこれらの素晴らしい技術デモをはるかに超えるものです。私が見たテストでは、このAIは最も詳細なリクエストにも対応し、現代美術館に展示されているような画像を生成することができました。ディレクターのカレン・X・チャン氏はこれを実演し、まずDALL・E 2に無限階段を上る少女を描くように指示したところ、難なく描き上げました。次にDALL・E 2に、クッキーでできた雲の中で無限階段を上る少女を描くように指示したところ、これも難なく描き上げました

DALL·E 2の仕組み

このプロジェクトは、2021年1月にDALL·Eから本格的に始動しました。目標はDALL·E 2と同じで、テキストから新しい画像を生成できるプログラムを作成することでした。その後、OpenAIは画像品質を大幅に向上させる方法を見つけ出し、DALL·E 2としてソフトウェアを再導入しました。

DALL·E 2の開発者は、ラベル付き画像を使ってシステムをトレーニングします。DALL·E 2は、「車」とラベル付けされた車、「家」とラベル付けされた家、「コーヒー」とラベル付けされたコーヒーなど、数千もの画像を学習していると考えられます。この知識データベースを用いて、ユーザーが何を求めているのかを的確に推測します。ユーザーの説明を一つ一つ理解できるほど十分なトレーニングができれば、「面白い帽子をかぶって税金を納めているサル」など、これまで見たことのないものの驚くほど正確な画像が得られるでしょう。

多くの機械学習プログラムがこのように動作しますが、DALL·E 2の特徴の一つは、OpenAIの言葉を借りれば「空白を埋める」ことができることです。つまり、DALL·E 2はテキストの説明を見て、提供されていない文脈を考慮します。「外でバスケットボールをしている犬」と尋ねられた場合、DALL·E 2はバスケットボールコートを指していると想定します。バスケットボールコートは公園の周辺にある可能性があり、木々、草、空などが見えるはずです。

とはいえ、DALL·E 2のチームは、システムの知識に欠陥があることを率直に認めており、そこから興味深く洞察に富んだ発見が得られる可能性がある。システムが「ホエザル」について学習していない場合、「ホエザル」を描くように指示すると、探している特定の種類のサルではなく、叫んでいるサルの画像が返される可能性がある。

ライフハッカー画像

クレジット: OpenAI/YouTube

DALL·E 2の機能は、新しい画像を生成するだけではありません。AIを搭載した写真編集ツールとして利用でき、画像から気に入らない要素を削除したり、元々存在しなかった新しい要素を追加したりできます。また、既存の画像に基づいて新しい画像を生成することもできます。例えば、モナ・リザを描きたいのに描けないという場合でも、DALL·E 2を使えば描けるように見せることができます。

これまでのところどう思いますか?

DALL·E 2の開発者は、憎悪や暴力に基づく画像の生成など、DALL·E 2の悪用を徹底的に防ぐよう努めています。しかし、実在の人物の画像をDALL·E 2に組み込むことに関しては、DALL·E 2は方針を転換しました。当初、開発者は実在の人物の写真をDALL·E 2にアップロードすることを許可していませんでしたが、最近、その方針を転換しました。現在では、AI生成アートに実在の人物の画像をアップロードして編集することが可能ですが、これには倫理的な懸念が伴います。

ただし、これらのサイトに作品をアップロードするつもりがない限り、DALL·E 2をご自身で試してみることができます。開発者は当初、限られた「信頼できるテスター」のみにソフトウェアを公開していましたが、現在は登録を希望するすべての人にベータ版を公開しています。DALL·E 2のサイトにアクセスし、メールアドレスでサインアップし、届いた確認メールをクリックするだけです。

その後、50クレジットを無料でご利用いただけます(1クレジットにつき1枚の画像リクエストにご利用いただけます)。その後は毎月15クレジットを無料でご利用いただけます。クレジットは115クレジットパックで15ドル(1ドルあたり約7.67枚の画像、1枚あたり0.13ドル)で販売されており、最大100パック、つまり11,500クレジット(1,150ドル)まで購入できます。これはAIアートの膨大な量です。

[この記事はもともと2022年5月5日に公開され、ベータ版が誰でも利用できるようになったことを示すために9月29日午後12時に更新されました。

ダウンロードニュースレター 技術ニュースを見逃さない

ジェイク・ピーターソンのポートレート ジェイク・ピーターソン シニア技術編集者

ジェイクとチームからの最新の技術ニュース、レビュー、アドバイスを入手してください。

ダウンロードニュースレター テクノロジー 関連のニュースを見逃さないでください。ジェイクとチームからの最新のテクノロジーニュース、レビュー、アドバイスをお届けします。

次の記事へスクロールしてください