Redditの古いスレッドを読むのが難しくなりそう。その原因はAIにある

Redditの古いスレッドを読むのが難しくなりそう。その原因はAIにある
Redditの古いスレッドを読むのが難しくなりそう。その原因はAIにある

ライフハッカーのロゴ

  • Bluesky ページを見る (新しいタブで開きます)
  • Instagramページを見る(新しいタブで開きます)
  • Facebookページで見る(新しいタブで開きます)
  • YouTubeページを見る(新しいタブで開きます)
  • Twitterページを見る(新しいタブで開きます)
  • コピーしました

Reddit スレッドの削除がさらに永続的になりました。

スマートフォン画面上のredditロゴ

クレジット: Mijansk786 / Shutterstock.com

重要なポイント

  1. Reddit は今後、インターネット アーカイブによるサイトの大部分のインデックス作成をブロックする予定です。
  2. Reddit は、アーカイブされたページからトレーニング データをスクレイピングする AI 企業がこの決定の原因であると非難している。
  3. 既存のアーカイブは今のところ影響を受けないようです。
  4. Redditとインターネットアーカイブはこの決定についてまだ協議中だ。

目次


最近、Google検索でAIがどんどん表示されるようになってきたので、インターネットを動かす魔法の言葉、Redditにすっかり頼るようになりました。確かに問題はありますが、検索ワードに「Reddit」を付けて検索するのが、生身の人間から正直な意見を得られる最も確実な方法です。これは他のプラットフォームではなかなか言えないことです。残念ながら、「Reddit」というトリックは、今後かなり役に立たなくなるようです。そして、またしてもAIのせいにされてしまうのです。

ライブフォーラムの問題点は、古い投稿が削除されたり、新しい更新によってサイトの古い部分が壊れたりすることで、情報が流れたり消えたりすることです。以前はこれを回避する方法がありましたが、今後はその抜け穴が塞がれていきます。

そう、Redditはインターネットアーカイブをブロックし始めようとしているのです。オープンインターネットの保護に尽力する非営利団体が運営するこのサイトは、Wayback Machineをホストしています。Wayback Machineは、現在はアクティブではない、あるいは最初に公開されてから大幅に変更されたインターネットページを閲覧するための人気のツールです。Wayback Machineの検索ボックスにURLを入力するだけで、そのページがかつてどのような状態だったかを示すキャプチャを閲覧でき、中には1990年代まで遡ったものもあるのです。

ライフハッカーのロゴ

あなたも気に入るかもしれない

これは、サイトがどのように変化したかを確認したり、とっくに消えてしまったはずの情報にアクセスしたりするのに役立つ方法です。Redditの場合、例えば削除されたホテルのレビューを見るのに使えます。意図的に削除された投稿を読むのは少し気まずいかもしれませんが、サービスを終了する際にすべてのスレッドを削除するのは一般的な慣習であるため、Wayback Machineは有用なコンテンツを将来にわたって保存し、古典的なミームが忘れ去られるメディアにならないようにするための優れた方法です。

残念ながら、RedditはWayback Machine全般に反対しているわけではないとしているものの、インターネット・アーカイブによるRedditホームページ以外のインデックス登録を停止しようとしている。つまり、今後保存できるアーカイブは、特定の日にRedditで人気だったもののリストのみとなる。個別のサブレディットや投稿はブロックされる。

これは、例えばインターネットリサーチャーであれば全く役に立たないというわけではありませんが、今後のRedditスレッドはより一時的なものとなり、一般的なウェブ検索には間違いなく悪影響を及ぼします。今ホテルのレビューを投稿してスレッドを削除すれば、1~2ヶ月後のユーザーは簡単にそのスレッドを見ることができなくなります。明るい面としては、既存のアーカイブは今回のブロックの影響を受けないはずです。少なくとも、Redditがインターネットアーカイブに既存のキャプチャの削除を依頼しない限りは。しかし、時間が経つにつれて、Redditアーカイブの不足はますます大きな問題になるでしょう。

では、なぜこのようなことが起こるのでしょうか?基本的に、RedditはAI企業がサイトからコンテンツをスクレイピングすることを、少なくとも事前に料金を支払わずに行うことを好まないのです。

これまでのところどう思いますか?

「インターネットアーカイブはオープンウェブにサービスを提供しています」とRedditの広報担当者ティム・ラスシュミット氏はThe Vergeに語った。「しかし、AI企業がプラットフォームのポリシー(Redditのポリシーも含む)に違反し、ウェイバックマシンからデータをスクレイピングしている事例があることは認識しています」

Redditは基本的に、提携するAI企業を厳しく管理したいと考えている(この件で過去に訴訟を起こされている)。そのため、ほとんどの企業によるサイトのクロールをブロックしている。しかし、一部の企業がインターネットアーカイブがキャプチャしたRedditページのスクレイピングに切り替えたことで、Redditは今後、それらのキャプチャも取り締まる方針だ。つまり、私たちは少数の悪徳企業の代償を払っていることになるのだ。

ラスシュミット氏はThe Vergeに対し、インターネット・アーカイブへの制限は本日から「段階的に」強化されると述べたが、具体的な内容については明確にしなかった。詳細についてRedditに問い合わせたが、今のところ再確認したところ、既存のアーカイブにはアクセスできるので、少なくともRedditはまだ核兵器開発には至っていないようだ。

今後の投稿に関しては、すべてが失われるわけではないかもしれない。The VergeはWayback Machineのディレクター、マーク・グラハム氏にもインタビューを行い、インターネット・アーカイブはRedditと「長年にわたる関係」を築いており、「この件について現在も協議中」だと述べた。

ダウンロードニュースレター 技術ニュースを見逃さない

ジェイク・ピーターソンのポートレート ジェイク・ピーターソン シニア技術編集者

ジェイクとチームからの最新の技術ニュース、レビュー、アドバイスを入手してください。

ダウンロードニュースレター テクノロジー 関連のニュースを見逃さないでください。ジェイクとチームからの最新のテクノロジーニュース、レビュー、アドバイスをお届けします。

次の記事へスクロールしてください