
ロイター通信によると、OpenAIは独自開発のブラウザを近くリリースする計画だという。Googleに対抗するための施策だという論評が多いが、OpenAIのCEO、Sam Altman氏のこれまでの発言を統合すると、ブラウザをベースにしたAI時代のOS的な仕組みを手中に収めるための大胆な構想が動き出したことが分かる。
ロイター通信の報じた内容は、①OpenAIが数週間以内に独自開発のブラウザをリリースすると3人の関係者が明らかにした②AIエージェントが予約手続きやオンラインフォームの記入などをユーザーに代わって実行してくれる③結果として Google のデータ源を脅かす、というもの。
▼AIエージェントがユーザーに代わってブラウザを操作
ユーザーに代わってパソコン操作を実行してくれる、というのは、ブラウザユース(browser use)やコンピュータユース(computer use)と呼ばれるAIエージェント技術のこと。例えば、「トランプ大統領の関税問題に関する最新情報と解説、世論の反応を調べて」とエージェントに打ち込むと、ブラウザを開いて各ニュースサイトにアクセスして事実情報を収集し、1本のニュース記事にまとめてくれるのに加え、複数の解説記事の論点を1本の記事にまとめて、X(旧twitter)などのSNS上の意見などもまとめてくれる。そんなようなことができるというイメージだ。
また「バッテリーが1週間持つ2万円ぐらいのスマートウォッチを探して。買うところまでお願い」とエージェント画面に打ち込むと、エージェントがamazonや楽天で、星評価が4つ以上の製品で、2万5000円から3万2000円までの商品で、バッテリーの保ちが7日程度の商品を検索。5件に絞り比較表を生成してブラウザに表示してくれる。ユーザーがそのうちの一つを選ぶと、その商品をカートに入れて配達先、支払いクレジットカードの入力までしてくれる。「注文しますか」という問いに「はい」と答えれば購入完了になる。また購入する前に「3日以内にこの商品が2万5000円以下に値下げになれば、その場で購入して」と命令しておけば、値下げになった時点で自動的に購入したりしてくれる。今の技術で、既にそういうようなことが実現すると見られている。
これと同様の機能は、実は月額約3万円のChatGPT proでは既にプレビュー版として実装されている。Operatorと呼ばれるAIエージェント機能で、ChatGPTと同じようなチャット画面で、上のようなプロンプトを入力すればブラウザ画面が立ち上がり、Operatorがユーザーに代わってブラウザを操作してくれて、情報収集や買い物を実行してくれるようになっている。
ただChatGPT proのOperatorは、ブラウザがOpenAI側のサーバーに実装されている仮想ブラウザなので、動きが遅く、途中固まったりもする。Operatorはあくまでもブラウザユースの実験という位置付けだ。
今回、ロイター通信が報じたのは、この実験をいよいよ正式版としてリリースするという話だ。ブラウザはOpenAI側の仮想ブラウザではなく、ユーザーの手持ちのパソコン上にアプリとしてインストールされるようになると見られているので、動作が早く安定するほか、新しい機能も搭載可能になる。
今まであった実験版の技術が正式プロダクトとしてリリースされる。今回のニュースはその程度の話だとも言える。
▼ブラウザ開発は、AI時代の覇権争いの最初の一手
ただSam Altman氏のこれまでの発言を統合すると、同氏はかなり大胆な構想を考えており、今回の独自ブラウザのリリースはその構想の最初の一歩の可能性がある。
その構想に言及している同氏の発言には次のようなものがある。
「複雑な調べ物ほど ChatGPT 検索の方が速く簡単になる。将来的には“検索クエリを投げると、その場でカスタム Web ページが動的生成される”世界を目指している」(2024-11-01 Reddit AMA)
「平均的な20歳の若者は、ChatGPTをコンピューターのOSのように使う。複雑な方法で大量のファイルをChatGPTに接続しているし、複雑なプロンプトを記憶している。ChatGPTに質問することなく人生の決断を下さない。家族、友人知人の関連情報や、彼らが何を言ったのかを全部メモリに記憶させている」
「われわれは、インターネットの重要なプラットフォームを構築できる立ち位置にいる。そのためには、いろいろなサービスに使われるような人々のパーソナルAIにならなければならない。われわれはコアAIサブスクリプションになりたい。まだそれがAPIなのかSDKなのかどのような形になるのか分からないが、何度か試行錯誤すれば見えてくるはず。それができれば信じられないような富を生み出す仕組みを人々に提供できるようになるはず」
「それは将来のインターネットにおけるHTTPのレベルでの新しいプロトコルのようなもの。そこでは物事がフェデレーテッド(分散型)になって、もっとずっと小さなコンポーネントに分解されて、エージェントが常にいろいろなツールや認証、支払い、データ転送などを公開したり使ったりしているような状態。そして、それがすべて信頼されたレベルで組み込まれていて、すべてがすべてと通信できる、という感じ。僕たちにはそれがどんなものか、まだ完全には分かっていない。霧の中から現れてきているような感じ。そこにたどり着くまでに何度かの試行錯誤が必要だが、それがわれわれが望む方向性」(2025-05-13 Sequoia Capitalのイベントに登壇)
こうした発言やその他の情報を統合すると、同氏は若者のChatGPTの使い方に必要な機能をまとめて提供したいと思っていることが分かる。そのことをプラットフォームや、プロトコル、OSなどといった表現で表しているが、ここでは便宜上、OSという表現で話を進めたいと思う。OSとは、いろんな用途に共通するような必要機能をまとめて提供している技術レイヤーのこと。モバイルのOSは、スマホのカメラや入力の文字変換、音声調節、支払い機能など、ほとんどのアプリに必要な技術のパッケージを含む、アプリとハードを仲介する共通抽象レイヤーだ。それと同様に、AI時代に必要なチャット機能や、ブラウザ操作機能、音声機能などをパッケージにしたものを提供したいと考えているようだ。
ロードマップとしてはまずはブラウザ操作機能を提供し、AI時代のネット上のOSになることを目指す。次にパソコン上のデータやアプリなども連携して、ChatGPTやOperator搭載ブラウザで操作できるようにする。そして現在開発中とされている新たなAIネイティブのモバイル機器のOSにもなっていくことだろう。
AI時代のOSを提供することで、AIをもっと便利なものにすると同時に、モバイル時代のOSの提供者であるAppleやGoogleのように、圧倒的な影響力を手にしたいと考えているのだろう。
▼広告非表示でウェブ戦争必至
こうしたAI時代の覇権奪取の構想に、モバイル時代の覇者であるAppleやGoogleが黙っているわけはない。またエージェントが収集し整理した情報をWebページとして構築し、ブラウザ上で表示する場合、元の情報に付随していた広告バナーをそのまま表示するとは考えにくい。広告が見られなくなるサイト運営者からの反発も出てくることだろう。
OpenAIはNews Corpに対して5年間で2.5億ドル支払う契約を結ぶなど、大手情報提供者との話合いは済んでいる。問題は中小のサイト運営者だ。中小のサイト運営者向けには、OpenAIのエージェントがアクセスしてきた時に1アクセス当たり $0.00001〜からとレート決めておき、未払いならアクセスを拒否するPay Per Crawlという仕組みが登場している。そうした仕組みで中小のサイト運営者が満足するのかどうか。
ここ何年かは、モバイル時代の覇者やサイト運営者を交えたウェブ戦争が勃発しそうな雲行きだ。

湯川鶴章
AI新聞編集長
AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。