AI は、すべてまたは何もないというコミットメントである必要はありません。
クレジット: ザイン・ビン・アワイス
AIは私たちの生活を変えています。あなたは準備ができていますか?
メタバースやNFTがかつてそうであったように、今のテクノロジーニュースを追うとき、AIの話題を耳にしないのはほぼ不可能に思えます。確かに、AI技術はまだ開発途上で、誰もがAIアートを生み出す倫理性や、どうすればAIアートを魅力的に仕上げられるのかを模索している段階です。また、ワークフローに大きな変化をもたらすと約束したテック企業のCEOが、メールをロボット風に書き換えるツールを発表するなど、AIを完全に無視したくなるのも無理はありません。
それは間違いです。AI懐疑論者ですが、AIが他のどの選択肢よりも優れている重要なユースケースをいくつか発見しました。たとえテクノロジー業界が期待するような魔法の弾丸とまではいかなくても、適切な状況であればAIは命を救う存在になり得ます。AI懐疑論者として、AIが最も有用だと考えるのは、まさにこの点です。
AIを使うべき時
私はAIを、他の自動化ソフトウェアと同じように、退屈な作業の代物だと考えています。AIによる画像生成は、既存のアートワークを少し手直しして先生に気づかれないようにしているような、あるいは生成検索は「ラッキー」ボタンをリブランドしたようなものに感じられることが多いですが、機械学習が既にその実力を発揮している分野は数多くあります。
私が興味を持っているのは、まさにそのようなAIです。「なぜロボットにメールを書いてもらいたいのか」と自問自答しているなら、AIが最適な解決策となるかもしれない問題をいくつかご紹介します。
AIを使用して画像のアスペクト比を変更する
クレジット: Adobe
次のようなシナリオを考えてみてください。間違ったアスペクト比で写真を撮影してしまい、Web サイトやスライドショーに収まるようにトリミングする必要があります。コンテンツが失われるような気がしてイライラしますが、そこで AI を活用した生成的な塗りつぶしの出番です。Adobe PhotoshopやMicrosoft のペイントに含まれる Cocreatorなど、ますます多くの写真編集ツールで利用できる生成的な塗りつぶしは、AI を使用して写真の欠けている部分を塗りつぶし、希望するアスペクト比にすることができます。ツールに応じて、プロンプトを使用してこれを行うか、既存の背景を引き伸ばすことによってこれを行うことができます。両方のオプションにアクセスできる場合もあります。ただし、基本原理は同じです。つまり、AI 以外の情報をショット内に多く残す、目立たない AI です。
必ずしも成功するとは限りませんが、背景がシンプルな場合は、それが使われたことが分かりにくい場合があります。とはいえ、他のAIと同様に、特に人物写真に適用する場合は、ある程度の人間による監督が必要です。例えば、ある技術パネリストがプロモーション用に自撮り写真をカンファレンスに送ったところ、彼女の同意なしにAIによって拡大され、元の画像よりも露出度の高い写真になってしまいました。カンファレンス側は彼女の外見を変えるつもりはなく、写真のアスペクト比を変えたかっただけでしたが、それでも誤解を招く結果になってしまいました。
AIアップスケーリング
クレジット: マイクロソフト
AIアップスケーリングは、実は最近の生成AIのトレンドよりも前から存在していました。多くのゲーマーは、ChatGPTが有名になる前からAIを使っていたと言うでしょう。しかし、企業がニューラルチップをますます多くのデバイスに実装するようになったため、AIアップスケーリングはかつてないほど普及しつつあります。
この技術を適切に使用すれば、映画や写真がより鮮明に見えるだけでなく、ゲームの動作も高速化できます。機械学習を用いて画像を分析し、元のショットにはなかったディテールを追加します。これは、リアルタイムでグラフィックを処理する場合や、古い写真や圧縮されたレトロビデオゲームのグラフィックなど、元のソースファイルが失われてゼロから再レンダリングできない素材を扱う場合に便利です。
例えば、50年以上前に撮影された祖母の写真があるとします。写真の細部はそのまま残っていても、Microsoft フォトの「スーパー解像度」のようなツールを使えば、機械学習モデルに空白部分を補わせることで、元の画像のスタイルを可能な限り維持しながら、AIを活用して解像度を上げることができます。
議論の余地がないわけではありません。写真の雰囲気を変えてしまう可能性があり、ビデオゲームのリマスター版などに適用する場合、制御が不十分だとアートディレクションが変わってしまう可能性があります。また、元の画像の解像度が低すぎる場合、AIによるアップスケーリングによって幻覚的な画像や夢のような画像が生成される可能性もあります。
しかし、適切な人間によるキュレーションと十分に厳密なトレーニング データセットがあれば、多くのプロフェッショナル向け製品が AI アップスケーリングを効果的に使用し、プロジェクト全体を手作業で行う場合よりもはるかに合理的な時間と予算で、数百または数千のアセットをリマスターできます。
しかし、一般の人がAIアップスケーリングを最も頻繁に使うのは、ビデオゲームのパフォーマンス向上かもしれません。AMDのFSR、NvidiaのDLSS、そしてソニーが近々発表するPSSRといったツールは、AIアップスケーリングを利用して、ネイティブ解像度を低く抑えながらも、高解像度テレビで表示した際に十分な画質を保ち、より高いフレームレートを実現しています。リアルタイム・レイトレーシングなどの技術が普及するにつれ、AIは、コンソールが売りとする最新のグラフィック技術を活用しつつ、ゲームを滑らかに保ち、細部まで見えるようにパフォーマンスを犠牲にしていないと感じられるような最適な方法となるかもしれません。
何かが舌先に浮かんだ時
AIチャットボットを使って情報を検索すると、検索エンジンほど役に立たないと感じることがよくあります。検索結果を自分で確認する能力を奪い、まるでGoogleのページを理解できるほど大人ではないかのように、仲介役のように機能しているように感じます。しかし、検索エンジンが役に立たない状況が1つあります。それは、自分が何を探しているのかさえよくわからない時です。
つまり、AIは何かが口から出そうになっている時に非常に役立ちます。例えば、昔の映画のあるシーンは覚えているけれど、それ以外は何も知らない、といった状況です。そんな時は、Googleで検索するキーワードを思いつくことさえ難しいかもしれません。本物の人間の助けが得られるsubredditもありますが、問題は、投稿が注目され、誰かが妥当な時間内に返信してくれることを期待しなければならないことです。
待っている間に、AIが代わりに質問に答えてくれるかもしれません。例えば数週間前、YouTubeで聞いたことは覚えていたものの、タイトルが思い出せなかった特定のバットマンのコミックを検索していました。そのコミックはトリッピーなビジュアルとダークなトーンが特徴的なはずでしたが、バットマンのテーマとしてはそれほど珍しいものではないため、Googleはそれらのテーマを持つもっと有名なコミックしか表示しませんでした。一方、「サイケデリックアートのバットマン コミック」とGoogleで検索すると、ファンアートや、皮肉なことにAIが生成した画像がたくさん表示されましたが、探していたコミックはありませんでした。(これは、検索から探していない結果を除外した場合も同様でした。)
一方、ChatGPTとMicrosoft Copilotはどちらも、私が探しているコミックを一発で推測してくれました。私はただこう言いました。「トリッピーでサイケデリックなイラストとダークなトーンのバットマンのコミックを探しています。『アーカム・アサイラム:シリアス・ハウス・オン・シリアス・アース』ではありません。1980年代に出版されたと思います。」
バム: 実際のコミック マニアに相談したり、YouTube の履歴を調べてそのコミックについて初めて知った動画を探したりしなくても、すぐに探していたコミック『バットマン: ザ・カルト』にたどり着きました。
AIが障害にどのように役立つか
AIにメールを書いてもらいたいとは思わないかもしれませんが、誰もがそう思っているわけではありません。その理由の一つは、メールを書くのが肉体的に負担になる人がいるからです。
例えば、身体的な障害のためにキーボードで文字を入力するのが難しいけれど、言いたいことは問題なく理解できるとしましょう。このような場合、机に向かって何段落も文章を入力しようとするよりも、AIに伝えたいことを数文伝え、AIが作成した文章を確認する方がよいかもしれません。
これは、ダイナボックス・グループのトップであるフレドリック・ルーベン氏が先日電話で話してくれた一例に過ぎません。ダイナボックスは、コミュニケーションに影響を及ぼす障がい者向けの支援ソフトウェアとハードウェアを製造しています。ルーベン氏は、AIにはリスクもあるとしながらも、同社が患者を支援するための手段を大幅に増やしていると語りました。
AIによる音声複製を例に挙げましょう。Appleのツールにも搭載されているこの技術は、声を失うリスクのある人が、電子音声の代替音声を訓練して、より自分に似た声にすることができるものです。以前は、自分の言語のほぼすべての単語を録音する必要がありましたが、ルーベン氏によると、今ではわずか50文程度で完了します。これは時間を大幅に節約できるだけでなく、過去の録音データを使って音声を複製できるため、既に声を失った人にもこのツールが利用可能になります。
あるいは、話すのに電子音声装置が必要だとしましょう。AIはそれを使うにつれてあなたの発話パターンを学習し、より便利なオートコンプリート機能を提供します。そして、言いたいことをすべて手動で入力するよりも、周囲の人とより素早く会話できるようになります。
これらはすべて、ルーベンが今後も探求していくことに意欲的な分野です。また、私たちの話とは別に、他の企業が聴覚障害者を支援するためにAI生成のライブキャプションを活用していることも特筆に値します。しかし、ルーベンは、障害のある患者を支援するためにAIを使用することにはリスクが伴う領域が1つあると指摘しました。
これまでのところどう思いますか?
「ユーザーに認知障害がある場合、AIは非常に危険です」とルーベン氏は述べた。特定の認知障害を持つ人は、プロンプトに何を入力すればよいのか、AIの原稿を校正して自分の言いたいことを正確に伝えればよいのかわからない場合があるからだ。AIが書いた文章が自分の本当の気持ちを反映していなくても、そのまま受け入れてしまう可能性がある。このような状況では、AIがユーザーを「なりすまし」、ユーザーが気づかないうちに誤った表現をしてしまうことが容易になる。友人や家族は、患者がほとんど関与することなく、実質的にChatGPTとだけ会話することになり、誤った印象を与えてしまう可能性がある。
AI音声クローンのようなツールにも、ディープフェイクのようなリスクが伴います。また、AIが作成または編集したメールが、大規模な規模で手書きのメールと同等の効果を発揮するかどうかはまだ分かりません。しかし、個人レベルでは、たとえ自分自身ではあまり役に立たないと思っていても、これらのAIツールは責任ある使用をすれば、公平な競争環境を整えるのに役立ちます。
スプレッドシートにデータを簡単に入力したり、音声を書き起こしたりできます
データ入力は、どんな仕事でも最も退屈な作業の一つです。書類からスプレッドシートに情報をコピー&ペーストするだけなら、頭を働かせる要素はほとんどありません。それでも、入力に時間がかかることがあります。音声の文字起こしなら、その時間は倍増します。
退屈な作業を楽にするツールが欲しいという私の願いに応えて、AI はこれらのタスクの両方をあっという間に非常にうまくこなせるようになりました。ツールによっては高度なサブスクリプションが必要になるかもしれませんが、選択した AI チャットボットにドキュメントへのアクセスを許可し、それをスプレッドシートに変換するよう依頼するだけで、ここまでくれば驚くほど安定します。テキストベースのプロンプトを使用してスプレッドシート プログラムにインポートできる CSV を要求する方法や、サードパーティ製のツールを使用してPDF を自動的に取得して Excel シートに変換する方法など、複数の方法があります。データ ポイントが少ない場合や必要なデータがすべてオンラインで入手できる場合は、ドキュメントをアップロードせずに、通常のチャットボット インターフェイスから必要な情報を取得できる場合もあります。Copilot を使用して作成したこのマクドナルドのメニューを見てみましょう。(比較のために実際のメニューはこちらです。) 特に AI にインターネットから情報を取得するように依頼している場合は、結果を二重に確認する必要がありますが、データを手動で再フォーマットすることなく、ようやく下書きを入手できるようになります。
クレジット: Microsoft Copilot
同様に、Otter.aiのようなプログラムや、今ではiOSのボイスメモでさえ、音声録音から完全な文字起こしを生成できます。先輩たちが行ったインタビューを一時停止して再生し、何時間もかけて文字起こしをすることでジャーナリズムのキャリアをスタートさせた私にとって、これはまさに救世主です。必ずしも正確とは限りませんが、AIが生成した文字起こしの下書きを編集する方が、ゼロから書き起こすよりもはるかに速いです。
旅行の旅程を素早く作成
楽しい時間を過ごしましょう。AIは仕事の退屈さを解消するのに役立ちますが、私が外出中にAIを使うのは、休暇の計画を立てている時です。旅行の計画を立てるには、何十回、あるいは何百回もGoogle検索をする必要がありますが、AIチャットボットなら、たった1回のやり取りで済むのです。
もちろん、AIの提案を自分で調べたり、補足したり、再確認したりしたくなるでしょう。しかし、全く何も思いつかない場合は、AIに目的地での滞在例を計画してもらうと、どこから探し始めればいいかが分かります。そうすれば、「トラベルインフルエンサー」のTikTokをぼんやりとスクロールしたり、旅行サイトのアルゴリズムが勝手に表示させようとするものを見たりせずに済みます。
例えば、私がCopilotに計画を依頼した今回の日本旅行を考えてみましょう。Copilotが提示する結果はやや簡素で、実際にレストランを探したり宿泊施設を予約したりするには自分で検索する必要がありましたが、大まかな内容は、日本がパンデミックによる渡航制限を緩和し始めた直後に実際に行った旅行と驚くほど似ています。予約時期の関係で旅行代理店を利用せざるを得ませんでしたが、この無料の旅程は、有料の旅行代理店が提案した内容とそれほど変わりません。
クレジット: Microsoft Copilot
確かに、上記のようなことはほんの始まりに過ぎませんが、AIを使って旅行プランのサンプルを作成し、より詳細な調査を始める前に準備しておけば、全体的な作業量を削減できます。また、旅行のニーズに合わせてカスタマイズできるため、他のツールよりも柔軟性が高まります。
受信トレイを要約する
そろそろ私の隠れた恥を告白する時が来た。携帯のメールアプリによると、未読メールが89,000通以上もある。もう諦めた。受信トレイを全部空にするのは、私一人では到底無理だ。
でも今は、もう一人で悩む必要はありません。Outlook、Gmail、そしてAppleのメールアプリは、受信トレイを整理するためのAI搭載のヘルプ機能を開発中、または近々導入予定です。特にメールアプリは今週から導入される予定です。メールの自動分類(Apple Mail向け)、何ページにもわたる記事を1文で要約する機能、その他、一目で状況を把握できるツールなど、AIが返信の下書き作成まで手伝ってくれるのです。
この記事の冒頭で述べたように、これらすべてが必ずしも必要なわけではありません。それに、上司からのメールをそのまま読むのではなく、AIに中継させるべきかどうかについても、いまだに懐疑的です。でも、受信トレイの容量に圧倒されてほとんど読み飛ばしてしまうのと比べたらどうでしょう?確かに、ざっと目を通す作業はずっと効率的になるはずです。
これは特に、長旅からオフィスに戻ってきた時や、勤務時間中にスマホの通知音にうんざりしている時に便利だと思います。例えば、Apple Intelligenceのメール概要は通知概要と統合され、AIが緊急だと判断した通知のみを通知するフォーカスモードも設定できます。繰り返しになりますが、私はメールを頻繁に受け取るので、重要な電話を待っている時にフォーカスモードを使うのは気が引けますが、5分から10分ごとにうるさい通知音が鳴っている時にスマホの電源を切る代わりに、このモードは有効な代替手段になると思います。
GPTが何なのかを知る前の時代を今でも懐かしむ私にとって、AIはまさにその分野で最も活用される傾向にあります。AIツールがデータセットをどこで収集し、どれだけのエネルギーを消費するのかという倫理的な問題を今でも懸念している私は、AIを使う際にはかなり慎重になり、AIによって大幅に時間が節約できるか、自分ではできないことができる場合にのみ活用するようにしています。私だけではないようです。良くも悪くも、AIは近い将来にどこかへ消え去るとは思えません。
ダウンロードニュースレター 技術ニュースを見逃さない
ジェイク・ピーターソン
ジェイクとチームからの最新の技術ニュース、レビュー、アドバイスを入手してください。
ダウンロードニュースレター テクノロジー 関連のニュースを見逃さないでください。ジェイクとチームからの最新のテクノロジーニュース、レビュー、アドバイスをお届けします。
ミシェルの他の記事