
米国のテック系人気ユーチューバーの何人かが、こぞって「AI開発競争はGoogleが勝利した」という見出しの動画をアップしている。彼らの興奮気味の語り口を聞いていると、まるでゲームチェンジャーが現れたかのような印象を受ける。確かに、ここ最近のGoogleのAIに関する発表は目覚ましいものがある。特にGemini 2.5 Proの登場は、AI業界に大きなインパクトを与えたと言えるだろう。
動画のサムネイルやタイトルにはっきりと「Google won(Googleが勝った)」と明記しているのは、人気ユーチューバーのMatthew Berman氏 、Wes Roth氏や、Theo – t3․gg氏、PromptHub氏など。ここまで人気ユーチューバーが一斉に勝利宣言をするのは珍しい。これでGoogleの勝利が決定したのかどうかは私には分からないが、少なくともOpenAIの首位独走の時代は終わったのかもしれない。
彼らがGoogleの勝利を主張する根拠は幾つかある。まずGoogleの最新の基盤モデルGemini 2.5 Proの評判が非常にいいことだ。ユーザーが実際に試して性能を評価するLMArenaのリーダーボードでは首位を獲得した。また数学や科学、論理的思考力を測るいくつかの一般的なベンチマークと呼ばれるテストでも高いスコアを記録。特に知識と推論に関する難関ベンチマークであるHumanity’s Last Examでは史上最高点を叩き出した。ネット掲示板のRedditの一部のユーザーは、Gemini 2.5 Proを「現時点で最高のコーディングモデル」と絶賛しているほどだ。
これまでのGoogleのAIモデルと比較しても、Gemini 2.5 Proは大きな飛躍を遂げたと言えそうだ。専門家の中には、以前のGemini 2.0 Proが「まあまあ」のレベルだったのに対し、短期間でこれほどまでに印象的な進化を遂げた点を高く評価している人もいる。
特にコーディング能力の向上は顕著だ。エージェント的なコード評価のための業界標準であるSweetBench verifiedでも高いスコアを獲得している。ユーチューバーのMatthew Berman氏が作成した、Gemini 2.5 Proが「ゼロショット」でコーディングしたルービックキューブのシミュレーションは、その堅牢なインタラクティブコード生成能力を示す好例として紹介されている。
さらに、100万トークンという巨大なコンテキストウィンドウも大きなアドバンテージだ。これは多くの競合モデルと比較して格段に大きく、コードベース全体や長大なドキュメントなど、より大量の情報を処理し、理解することを可能にする。将来的にはこれを200万トークンに拡張する計画もあるという。これは、AIがより複雑なタスクに取り組む上で非常に有利な要素となるだろう。
そして、多くのユーチューバーたちが注目しているのが、Googleが発表した新しいプラットフォームAgent Spaceと、エージェント間のオープンプロトコルA2A(agent-to-agent)プロトコルだ。Agent Spaceは、様々な企業や開発者がAIエージェントを作成し、それらをシームレスに連携させることができるエコシステムを目指している。ユーザーはコーディングなしで、自身のニーズに合わせたカスタムエージェントを構築し、利用できるようになるという。異なるベンダーによって構築されたエージェントであっても、A2Aプロトコルを通じて相互に連携し、タスクを完了させることができるようになれば、AIの活用範囲は飛躍的に広がる可能性がある。YouTubeチャンネルのAI GridLockは、Agent Spaceを「AIゲームに勝利した」とまで評しており、今後の展開に大きな期待を寄せている。かつてGoogleが検索バーによってウェブへの入り口を支配したように、今後はAIエージェントがその役割を担う可能性を指摘し、Agent Spaceがその中心的なプラットフォームになるかもしれないと予測している。
Gemini 2.5 Proは、応答する前に自分の思考を推論できる「リーズニングモデル(思考モデル)」としても説明されている。Googleは、より複雑なプロンプトを処理し、有能なエージェントをサポートするために、これらの論理的思考能力をモデルに直接組み込んでいるという。ただし、API経由で使用する場合、この「思考」データは現在利用できないという指摘もある。
Googleが独自開発した半導体、TPU(Tensor Processing Unit)も、大きな強みとして挙げられる。最新世代であるIronwoodは、性能とエネルギー効率が大幅に向上しており、独自のハードウェアを持つことで、Googleはモデルと計算インフラを最適化し、パフォーマンス、速度、コスト効率の向上を図ることができる。他のAI企業がNVIDIAなどのサードパーティのハードウェアに依存しているのに対し、Googleは自社で最適化されたハードウェアを開発できる点で、競争において有利な立場にあると言えるだろう。
さらに、費用対効果の面でもGoogleは優位性を示している。Gemini 2.5 Flashは、2.5の高速バージョンであり、低遅延で費用対効果の高いモデルとして強調されている。ネット上の掲示板には、「(GeminiモデルがClaudeなどの代替モデルよりも)大幅に安価でありながら、同等以上のパフォーマンスを提供している」という意見が出ていた。Gemini 2.0 Flashのトークンあたりの価格は、AnthropicのClaude 3.7 SonnetやOpenAIのGPT-4.5よりも安価である可能性が指摘されており、これは大量のデータを処理するアプリケーションにとって大きなメリットとなる。
これらの要素が複合的に作用し、人気ユーチューバーを始め多くのユーザーが、GoogleがAI競争でリードを奪ったと考えているのだろう。
しかし、一方で、より慎重な意見や批判的な見解も存在する。あるRedditユーザーは、調査、推論、創造的な出力を含むタスクでChatGPTがGemini 2.5 Proを上回ったと報告しており、別のユーザーは、Gemini 2.5 Proは「コーディングには優れているが、他のすべては平均的」であると述べている。またモデルの不安定さや、Web検索やツール使用に関する問題も経験しているという報告もある。さらに、Gemini 2.5 Proは強力なベンチマーク結果を示しているものの、一部の人は、ベンチマークが操作されている可能性や、実際のパフォーマンスは異なる可能性があると主張している。また、大規模なコンテキストウィンドウは強力な機能だが、実際にその全体を効果的に活用するのは難しいという課題も指摘されている。
加えて、OpenAIをはじめとする競合他社も黙って見ているわけではない。OpenAIは開発者の要望に応えたGPT-4.1をリリースしたし、AnthropicもClaudeシリーズで着実に進化を続けている。AI技術の進歩は非常に速く、今日のリードが明日も続くとは限らない。
AIの世界の変化は速い。Googleの「勝利」は一時的なものかもしれない。引き続き最先端の開発競争を注意深く見守っていく必要がありそうだ。

湯川鶴章
AI新聞編集長
AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。