- Bluesky ページを見る (新しいタブで開きます)
- Instagramページを見る(新しいタブで開きます)
- Facebookページで見る(新しいタブで開きます)
- YouTubeページを見る(新しいタブで開きます)
- Twitterページを見る(新しいタブで開きます)
- コピーしました
人々は AI をいつ使用しているかを認識する必要があります。

クレジット: ミシェル・エアハート
目次
GoogleのPixel 10スマートフォンが今週正式にデビューし、カメラアプリに多数の生成AI機能が直接組み込まれました。昨今のスマートフォンでは「コンピュテーショナル・フォトグラフィー」が当たり前になっています。これは、写真を撮る際に照明や後処理などのエフェクトを加える、いわゆる「コンピュテーショナル・フォトグラフィー」のことです。しかし、AIの登場によってコンピュテーショナル・フォトグラフィーは全く別の存在になり、私たちがまだその準備が整っているかどうかは分かりません。
テクノロジーオタクは「写真とは何か?」と自問自答するのが好きで、写真に後処理を加えれば加えるほど、現実世界で実際に起こったこととは似ても似つかなくなる、と冗談めかして言います。夜空が明るすぎるとか、鏡に映るよりも顔の傷が少ないとか、そういう類のことです。カメラアプリの生成AIは、まさにこの道徳的難問のラスボスと言えるでしょう。これらの機能がすべて役に立たないと言うわけではありませんが、結局のところ、これは技術的な議論であると同時に、哲学的な議論でもあるのです。
写真は、撮影者が実際に目で見たものと同じように見えるべきなのでしょうか?それとも、リアリティなど気にせず、できるだけ魅力的に見えるべきなのでしょうか?今のところ、こうした疑問を些細なことにこだわる人たちだけに限定しておくのは簡単です。空が少しネオンカラー過ぎても、写真がもっと際立つなら、誰が気にするでしょうか?しかし、AIが写真に全く新しいオブジェクトや背景を追加し始めるなら、Geminiアプリを開く前から、誰もがスマートフォンのカメラに何を求めるのか自問自答し始めるべき時が来ているのです。

あなたも気に入るかもしれない
また、Google が最新のスマートフォンで AI を使用していることから、AI が撮影した写真であっても、それが AI によるものであることに気付かない可能性があります。
プロ解像度ズーム
Googleの新しいAIカメラ機能の中で、おそらく最も衝撃的なのは「Pro Res Zoom」と呼ばれる機能だろう。Googleはこれを「100倍ズーム」と宣伝しているが、その仕組みは、昔の警察ドラマで見かけるような、全く架空の「ズームインして映像を鮮明にする」技術と似ている。
Pixel 10 ProまたはPro XLでは、ズームレンズを100倍に押し込むことができるようになります。表面的には、通常のソフトウェアズーム(AIではなくトリミングを利用)と何ら変わりません。しかし、スマートフォンのプロセッサ内部では、CSIのようなドラマで「ズームインして補正する」という機能が滑稽に思えるのと同じ問題に直面することになります。
要するに、問題はカメラが捉えられなかった解像度をでっち上げることができないということです。もしカメラのレンズがぼんやりとしたピクセルしか捉えられないほどズームインしてしまったら、現実世界で実際に何がそこにあったのかを確実に知ることは決してできないのです。
クレジット: Google
そのため、この機能は一見普通の、AIを使わないズームのように見えますが、実際には100倍ズームというよりはAIによる編集に近いものです。Pro Res Zoomを使用すると、スマートフォンは最大限にズームインし、ぼやけたピクセルをデバイス上の拡散モデルに入力として利用します。モデルはピクセルの見え方を推測し、その結果を写真に編集します。現実を捉えているわけではありませんが、運が良ければ十分に近い結果が得られるかもしれません。
岩石やその他のありふれた無生物といった特定のディテールであれば、それで問題ないかもしれません。しかし、顔やランドマークの場合は、例えばコンサートのリードシンガーの素晴らしいクローズアップを撮影したという印象しか残らないかもしれません。しかも、その「ズーム」が実際にはGeminiのちょっとした工夫によるものだとは、全く気づかないかもしれません。Googleは幻覚現象の抑制に取り組んでいると述べていますが、Geminiが吐き出した写真を投稿したりクリエイティブなプロジェクトに取り入れたりすることに抵抗があるなら、Geminiでも同じ問題が発生するでしょう。ただし、ブランドイメージのせいで、AIが関わっていることに気づかないかもしれません。
幸いなことに、Pro Res Zoomは非AIズームを完全に置き換えるわけではありません。通常のハードウェアズームの5倍制限を超えてズームすると、Pro Res Zoomを適用した画像と適用していない画像の2つの結果が表示されます。興味のある方は、これについてより詳しく書いた記事をご覧ください。ただし、非AIズームのオプションが利用可能であっても、選択時にAIズームが明確に示されません。
これは、Googleがこれまで採用してきたAIへのアプローチよりもはるかにカジュアルなものです。AIが写真の加工を依頼すれば、人々は慣れているかもしれませんが、カメラのレンズを通して自動的に加工されるというのは、新たな一歩です。
編集を依頼する
AIのさりげない連携は、写真を撮った後も続きます。Pixel 10では、Googleフォトアプリから自然言語を使ってAIに写真の修正を依頼できるようになりました。修正したい写真を開いて編集アイコンをタップするだけで、チャットボックスが表示され、自然言語で写真の修正を提案できます。必要に応じて、キーボードではなく音声で指示することも可能です。
表面的には、これは気になりません。Googleフォトには数十種類の編集アイコンがあり、一般の人にとっては使い方が分かりにくいかもしれません。シンプルな切り抜きやフィルターを適用したいだけなら、このアイコンがあれば、複雑なインターフェースを経由することなく、編集作業を行うことができます。
クレジット: ミシェル・エアハート
問題は、「編集を依頼」では、昔ながらのGoogleフォトのツールに加え、より奇抜な変更も提案できてしまうことです。しかも、AIを使って変更を加えているかどうかは、AIによって明確に区別されません。写真の背景を全く新しいものに変更するようAIに指示したり、あるいは、それほど劇的な変更をしたくない場合は、窓越しに撮影した写真の反射を消すよう指示したりすることも可能です。問題は、こうした編集の多くは、一見するとそれほど破壊的ではないように見えるグレア除去でさえも、生成型AIを必要とするということです。そして、それが適用されたかどうかは、直感に頼らざるを得ません。
例えば、Google フォトの編集候補の中に「AI 補正」ボタンがよく表示されますが、これが AI をショットに取り込む唯一の方法ではありません。Ask to Edit は、アクセスできるツールを使って、ユーザーのリクエストに最大限応えようとします。Google のデモで実際に使用した感想からすると、これには AI 生成も含まれるようです。「この自撮り写真の後ろにメルセデスを追加する」といった場合に AI が使用されることは明らかですが、技術に詳しくないユーザーは、切り取らずにアスペクト比を変更する場合にも生成 AI を使用する必要があることを知らずに、AI に「ズーム アウト」するように指示できると考えるかもしれません。具体的には、ショットに写っているものの周囲に現実世界で何があったかを AI に想像してもらう必要があります。AI にはこれを知る術がないため、「ズーム アウト」がいかに地味な機能であっても、幻覚を引き起こすリスクが本質的に高くなります。
これは技術にあまり詳しくないユーザーを支援するために設計されたツールなので、ユーザーが誤ってフィクションを生成してしまい、それがまったく無邪気で現実的なショットだと思ってしまう可能性が高いのではないかと心配しています。
これまでのところどう思いますか?
カメラコーチ
そして、カメラコーチがあります。この機能もカメラアプリにAIを組み込みますが、写真にAIを組み込むわけではありません。カメラが捉えた映像に合わせて、AIが代替のフレーミングやアングルを提案し、それらのショットを撮影する方法をアドバイスしてくれます。
クレジット: ミシェル・エアハート
言い換えれば、まさに「見たままの仕上がり」です。Camera Coach の提案はあくまでアイデアであり、それを実行するには多少の手間はかかりますが、撮影した写真はどれも、AI が加わることなく、ファインダーで見たものと全く同じ仕上がりになることは間違いありません。
これで、非現実的な写真が絶対的な真実であるかのように提示されるのではないかという懸念はほぼ解消されました。Camera Coachが、例えば立ち入り禁止区域に入るように指示するなど、実際には撮影できない写真を提案する可能性はありますが、最悪の場合、AI生成をズームインしたのと同じかのように見せかけるような写真ではなく、フラストレーションを感じる程度でしょう。
人々はAIを使っていることを認識すべきだ
「写真とは何か?」という問いを、たった一日で解決できるわけではありません。写真には現実世界を表現するためのものもあれば、ただ見た目を美しく見せるためのものもある、というのが真実です。それは理解できます。AIが写真の見た目をより魅力的に見せることができるなら、たとえそれが現実に完全に忠実でなくても、その魅力は理解できます。だからといって、学習データの入手先に関する倫理的な懸念が払拭されるわけではありませんので、これらのツールは慎重に使っていただきたいと思います。とはいえ、写真を指して「あれは実際には起こっていなかった」と言っても、修辞的な魔法の弾にはならないことは承知しています。
私が懸念しているのは、Googleの新しいAI機能がいかに気軽に実装されているかということです。まるで従来のコンピュテーショナル・フォトグラフィー(計算写真術)と全く同じかのように。従来のコンピュテーショナル・フォトグラフィーは、常に実際の画像をベースにしており、作り話はしません。AIにまだ警戒心を抱いている私にとって、「100倍ズーム」を装ったAI画像生成を見ると、すぐに警戒心が湧きます。誰もが私と同じようにこれらのツールに注目しているわけではありませんし、これらの機能が幻覚のリスクをもたらすのではなく、謳い文句通りの働きをすることを期待するのも無理はありません。
言い換えれば、人々は自分の写真にAIが使われているかどうかを知ることができ、撮影した写真がリアルなのかそうでないのかを確信できるはずです。望遠レンズを使ったズームを「5倍ズーム」と表現したり、AIをピクセルに重ね合わせたズームを「100倍ズーム」と表現したりしても、それは実現できません。また、写真アプリに自然言語エディターを組み込んでも、生成AIが使われているかどうかが明確に示されないのも同様です。
Googleはこの問題を認識しています。Pixel 10で撮影されたすべての写真には、C2PAコンテンツ認証情報が組み込まれており、写真のメタデータにAIが使用されたかどうかが分かります。しかし、最後に写真のメタデータを確認したのはいつでしょうか?「編集を依頼」のようなツールは明らかに万全を期して作られており、ユーザーがAIで編集された写真とそうでない写真を一つ一つ手作業で確認するのは現実的ではありません。特に、最終的な写真を得るまでの手順を少なくすることを目的としたツールを開発しているのであればなおさらです。
Geminiアプリを開いたときにAIが使われることを期待するのは当然ですが、カメラアプリのようにこれまでAIが使われていなかったツールにAIを組み込むには、C2PA認証情報を静かに提示したり、プレスリリースに曖昧な一文を添えたりするよりも、もっと大々的な宣伝が必要です。AIが使われることをユーザーに通知するのは、写真を撮る前、あるいは編集を行う前に行うべきです。後で探そうとした時に見つかるように、ひっそりとマークアップしておくべきではありません。
Adobeなどの他のAI写真ツールは、 AI生成機能を使用するプロジェクトにシンプルな透かしを適用することで、既にこれを実現しています。AI生成画像全体についてどう考えるべきかは述べませんが、うっかりAI生成画像を作ってしまうような状況に陥るべきではないことは確かです。GoogleのAIカメライノベーションの中で、これを実現しているのはCamera Coachだけでしょう。今年のMade by GoogleでGoogleが「オープン」と誇らしげに宣伝したAndroidエコシステムの開発者による大きな新製品としては、透明性に関するヒット率が3分の1というのは、予想外のことです。
ダウンロードニュースレター 技術ニュースを見逃さない
ジェイク・ピーターソン シニア技術編集者
ジェイクとチームからの最新の技術ニュース、レビュー、アドバイスを入手してください。
ダウンロードニュースレター テクノロジー 関連のニュースを見逃さないでください。ジェイクとチームからの最新のテクノロジーニュース、レビュー、アドバイスをお届けします。
次の記事へスクロールしてください