OpenClawの何がそんなに革命的なのか。Marc Andreessen氏の解説

AI新聞

エージェントはLLMに依存しなくなる

「技術のブレークスルーは往々にしてシンプル。後から考えれば、どうしてそれを思い付かなかったのだろうと思うほどシンプルなものなのだ」。米人気ポッドキャスト「Latent Space」に登壇した著名ベンチャーキャピタリストMarc Andreessen氏はそう語る。今話題のオープンソースの自律型エージェントシステム「OpenClaw」も、その構造は至ってシンプルだ。シンプルだからこそ既存の技術をそのまま使え、未来に莫大な可能性を秘めている——Andreessen氏はそう主張する。

OpenClawのアーキテクチャは次の5つの要素が連動して回り続ける。①まず目覚まし時計のような仕組み「cron」というスケジューラーが時間になればイベントを自律的に「起動」し、②次に何をすべきか書かれたファイル「heartbeat.md」を読む。③次にLLM(大規模言語モデル)が何をすべきかを「考え」、④コンピュータの全機能にアクセスするための万能なインターフェース「シェル」が、コマンドやブラウザを「実行」する。⑤その結果をmemory.mdというMarkdownファイルに「記憶」として書き出す。OpenClawは、この5段階のループが止まらず回り続ける非常にシンプルな構造になっている。

 



自律型AIエージェントとは、LLM、シェル、ファイルシステム、Markdown、cronという技術の組み合わせにすぎない。「エージェントとは、ファイルシステムに保存されたファイルの集合に過ぎないんだ。このことに気づいたときに自分の中で衝撃が走った」とAndreessen氏は言う。

そうであるならば、自律型エージェントは実行しているLLMに依存しない存在になる。ループの他の部分は同じで、LLMだけを取り替えることが可能というわけだ。LLMが変わればエージェントの性格は多少変わるが、ファイルに保存されている状態(state)はすべて維持される。「命令セットは変わるけれど、単にコンパイルし直しただけ、という感じになる」と同氏は指摘する。つまりエンジンを載せ替えても、これまでの記憶や設定はそのまま残る、ということだ。そうなればLLMは取り替え可能なコモディティになる。今は大手AI企業がLLMの性能を競っているわけだが、OpenClawの普及で競争のルールが変わる可能性がある。この可能性にAndreessen氏は衝撃を受けたのだろう。


命令を受ければ、自分で自分を変更できる

「そしてもう1つ、本当に驚くべき点がある」と同氏は言う。ファイルシステムにLLMが接続されていることで、ファイルの中身をエージェントが理解できるようになったことだ。「つまりエージェントが完全な自己内省能力を持ったということだ」と指摘する。自分自身のファイルについて理解していて、それを書き換えることができるのだ。広く使われてきたソフトウェアシステムで、自分自身の仕組みを完全に理解し、それを自ら変更できるシステムは、これまでほとんど存在しなかったとAndreessen氏は言う。

自らを変更できるとは、例えば新しい機能を搭載できるということだ。新しい機能を搭載するには「シェル」と呼ばれる万能インターフェースを活用する。世の中には膨大な数のUnixコマンドがあり、あらゆるものに対するコマンドラインインターフェースがすでに存在している。Macでもスマートフォンでもコンピュータはそのインターフェース「シェル」の上で内部的に動いている。つまり、コマンドラインレベルでコンピュータの全機能にアクセスできるわけだ。また新しい機能をコマンドラインインターフェースとして公開することも非常に簡単だ。そうAndreesen氏は力説する。

OpenClawを構成する技術は、LLMを除けば、シェルのようなUnixシステムなどで使われている技術ばかりだ。「どこがブレークスルーだ、すべて昔からある技術の組み合わせじゃないか」と言う人がいる。「しかし重要なのはそこだ。既存の要素を組み合わせることで、それまで埋もれていた本質的な能力が一気に解放されたのだ」とAndreessen氏は言う。「MCPみたいな高度なプロトコルが新たに必要だという考えは間違い。単に(シェルの)コマンドラインがあればいいんだ」と同氏は言う。

AIエージェントが自分を内省し、自己改良が可能になった。「自分を拡張しろ」「新しい能力を獲得しろ」と言うだけでいい。エージェントは「了解」と答え、インターネットにアクセスして必要な情報を調べ、コードを書き、必要なものをすべて実装する。そして気づけば、新しい機能が自分のエージェントに追加されている。「この一連の仕組みの組み合わせは、本当にとてもすごいこと。信じられないほど強力だ。概念的なブレークスルーだ」とAndreessen氏は絶賛する。

「世界中の誰もが、少なくとも1つ、あるいは複数のエージェントを持つようになる。人々がコンピュータを使う方法そのものが、この形に変わっていくのは避けられない。私はそう確信している」と同氏は予測する。世界中のユーザーが自分の欲しい機能をエージェントに追加し、それぞれが独自に育てていく——そんな時代が来るとすれば、コンピュータとの関係は根本から変わることになるだろう。


ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー


このほかにも興味深い発言がいくつもありました。

ブラウザ、UI、プログラミング言語が不要になる

そもそも将来、プログラミング言語なんて存在するのか?それとも(AIは)直接バイナリを吐き出すようになるのか?(49:20)
「今私たちが理解している意味でのプログラミング言語という概念自体が、将来は成立しなくなるかもしれない」(50:25)
この流れを最後まで考えると、そもそもブラウザが不要になる。つまりそれはブラウザの終わりということになる。ユーザーインターフェース自体が不要になるかもしれない(50:40)
ユーザーインターフェース自体が不要になるかもしれない。では将来、誰がソフトウェアを使うのか?…それは他のボットだ(50:44)

 

エージェントに時間の制約はない。何でもリバースエンジニアできる


 AIが勝手に自己改良するようになれば、モデル間の互換性がなくなり、モデルメーカーのロックイン(抱え込み)に繋がるのでは」という質問に対しMarc Andreesen氏は、「それってロックインですらないんじゃないか。だって、後から来たモデルが、最初のモデルがやったことを学べばいいだけじゃないか?」
今のモデルはソフトウェアをリバースエンジニアリングできる。もしx86バイナリを解析できるなら、他のものだって解析できるはずだろう?」(52:42)
「今話していることは、理論的には人間でも昔からできたことなんだ。ただ、それはコストと労力の面で現実的ではなかっただけだ。」「人間でもバイナリをリバースエンジニアリングすることはできる。複雑なバイナリだと1000年かかる。でもAIモデルにはそんな制約はない。」(53:18)

AIとクリプトの合体

暗号資産のステーブルコインや暗号資産そのものという形で、インターネット・ネイティブなお金がすでに存在している。そして私は、これから起きようとしているのは、AIとクリプトの一大統一だと思っている。」
「私は、AIこそがクリプトのキラーアプリになると思っている。実際にその形で表れてくるはずだ。」
「AIエージェントがお金を必要とするのは間違いない。たとえばClawに何かを買わせたいなら、何らかの形でそのエージェントにお金を持たせなければならないからだ。」

IoTという中途半ばな概念がなくなる

(OpenClawの登場で)今回初めて、はっきりと確信を持って言えるようになった。
半導体とインターネット接続を持つ30種類もの異なる機器があるスマートホームでも、それらすべてがちゃんと意味を持って連携し、全体として一貫した形で機能するようになる
しかも、その状態が、人間がいちいち設定や作業をしなくても、自然に実現されるようになる」

https://youtu.be/knx2wrILP1M?si=Pwktv8RRn6WdMEgV

 

 

湯川鶴章

AI新聞編集長

AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。

  • Home
  • AI新聞
  • OpenClawの何がそんなに革命的なのか。Marc Andreessen氏の解説

この機能は有料会員限定です。
ご契約見直しについては事務局にお問い合わせください。

関連記事

記事一覧を見る