Gemini 2.5 ProはGoogleのこれまでで最も強力なAIモデルであり、すでに無料です

Gemini 2.5 ProはGoogleのこれまでで最も強力なAIモデルであり、すでに無料です
Gemini 2.5 ProはGoogleのこれまでで最も強力なAIモデルであり、すでに無料です

Googleは、実験的なラベルが付いているものの、Gemini 2.5 Proという新しいAIモデルをリリースしました。しかも無料で利用できるので、Gemini Advancedに加入する必要はありません。最近の多くのAIモデルリリースと同様に、このモデルの「推論」機能が最大のアップグレードと言われています。

人工知能(AI)の用語で言えば、推論とは、より綿密に検討された回答を意味します。Googleによると、これによりミスが減り、より論理的な回答が得られ、文脈とニュアンスをより正確に理解できるようになるとのことです。この「思考」をさらに深める機能は、今後のGoogleモデルに標準搭載される予定です。

Pro(実験的)リリースは、Gemini 2.5の最初のバージョンです。最初のブログ投稿では無料ユーザーについては触れていませんでしたが、1週間も経たないうちにアップデートが公開され、すべてのユーザーが利用可能になりました。ただし、Gemini Advancedのサブスクリプションをお持ちでない場合は、レート制限が適用されます(Googleはレート制限の内容を明らかにしていません)。新しいモデルは現在デスクトップアプリで利用可能で、モバイルアプリでも近日中にリリース予定です。

Google Geminiベンチマーク

Gemini 2.5 Proは、様々なAIベンチマークで新たなレベルに到達しました。 クレジット:Google

Googleは、Gemini 2.5 Proの優れた性能を示す複数のベンチマークテストを挙げています。執筆時点では、ユーザーが数十のAIチャットボットの応答を評価するLMArenaのリーダーボードでトップに立っています。また、人間の知識と推論能力を測定する「Humanity's Last Exam」テストでは18.8%のスコアを獲得し、OpenAIやAnthropicの競合モデルを僅差で上回っています。

もう一つ注目すべきは、大きなコンテキストウィンドウです。簡単に言えば、これはAIモデルが一度にどれだけのデータを処理できるかを示す指標です。Gemini 2.5 Proのコンテキストウィンドウは100万トークンで、Googleによると200万トークンは「近日中に」対応予定です。これは、例えばChatGPTのo3-mini推論モデルのコンテキストウィンドウが20万トークンであるのと比較すると大きな値です。

Gemini 2.5 Proをテストする

AIモデル間の改善を定量化するのは難しい場合があります。だからこそ、LMArenaのようなベンチマークが役立ちます。Gemini 2.5 Proを本格的にテストするには、私には専門的な科学的知識やプログラミングの知識が不足していますが、以前のモデルと同様に、オンラインタイマーなどの簡単なWebアプリを数分で作成できました。

チャールズ・ディケンズの『荒涼館』については少し知識があったので、Gemini 2.5 Proを使ってテキストを解析してみました。すると、プロットの正確な要約と、様々な物語技法の巧みな評価が得られました(学生時代に本当に役に立ったはずです)。また、原作を映画化に適した三幕構成に仕上げることもできました。これは、この作品が一度に多くのことを「考え」ていたことの証左です。

これまでのところどう思いますか?

旧バージョンのGemini 2.0 Flashも『荒涼館』の同じ質問に正確に答えることができましたが、Gemini 2.5 Proの回答はより長く、より詳細で、より一般的な表現が少なく、よりスマートでした。これは、追加の「推論」機能が活用されている証拠です。また、Gemini 2.0 Flashモデルは、処理しようとしたテキストの量が膨大だったためか、映画版の回答を3つに分割する必要がありました。

GoogleはGemini 2.5 Proの機能について独自の例を提供しており、単一のプロンプトからシンプルなエンドレスランナーゲームを作成できることを示しています。コード出力を示すデモビデオは高速化されていますが、ゲームは正常に動作し、非常によく設計されているように見えます。これは、単一の自然言語プロンプトから得られる素晴らしい成果です。デジタルの魚が泳ぎ回る、洗練されたウェブデモもあります。

ウェブ上の他の場所では、新しいAIモデルが広範囲にテストされています。ソフトウェアエンジニアであり、独立系AI研究者でもあるサイモン・ウィリソン氏は、画像作成、音声転写、コード生成などを含む複数のテストを実施し、Gemini 2.5 Proの成果に非常に満足していると述べました。

AI開発の猛烈なペースは当分の間減速する兆しを見せておらず、近い将来、おそらくGoogle I/O 2025の間にさらに多くのGemini 2.5モデルが登場すると予想されます。「いつものように、私たちはGeminiの素晴らしい新機能を急速に改善し続けるためにフィードバックを歓迎します。その目標はすべて、AIをより役立つものにすることです」と、GoogleのDeepMind AIラボのKoray Kavukcuoglu氏は述べています。