注:画像はAdobe Fireflyで自動生成
ChatGPTを開発したOpenAI社の初めての開発者向け大規模イベント「OpenAI DevDay」が、このほど開催された。このイベントの中で同社CEOのSam Altman氏が基調講演を行ったが、この基調講演を見た人の感想が実にさまざまだったのが面白かった。エンジニア系の人たちは、大規模言語モデルの性能がよくなったことや利用料金が安くなったことに主に関心を示す傾向にあり、一方でビジネスパーソンは性能の話よりもチャットボットのエコシステムが誕生することに関心があるようだった。中には、性能の進化に関し「想定の範囲内」という冷めた見方もあった。しかし個人的には、大規模言語モデルの持つ可能性や、新しい産業パラダイムを指し示した画期的な講演だったと思う。
▼1000人の家庭教師AIが一人の生徒に教える近未来
Altman氏は、講演の冒頭で「性能の話やコストの話もしますが、それが一番重要なのではなく・・・」とまず指摘。そして講演の最後では「今回の発表は、AIエージェントがより多くのことができるようになる前段階です」「そうした世の中になる前に、その兆しを体感してもらうことが重要」と締めくくった。
同氏は日頃から、AIが技術的に未完成であっても早い時点で公開し、その可能性を多くの人に理解してもらい、AIの進化にどう対処すべきか社会全体で議論すべきだと主張している。AIは破壊的な影響を社会に与えかねないからだ。では同氏が考える今回のAI技術の社会への破壊的な影響とはどういうものなのだろうか。
今回発表があったのは、プログラミング知識のない人でもチャットボットを簡単に作成できるツールや、作成したチャットボットを紹介するストア、人気のチャットボットを作成したクリエーターと収益を分配する仕組みなどだ。またより高度なチャットボットを開発できるプログラマー向けのAssistant APIと呼ばれる技術も発表された。
Altman氏は、同社のチャットボット作成ツールで作られたチャットボットを「GPT」という名称で呼び、Assitant APIなどの開発ツールで作られたチャット型AIを「Assistant」という名称で呼ぶ。素人でも驚くほど簡単にGPT(チャットボット)を作れるし、人気が出れば大きな収益を得ることも可能。YouTubeで多くのクリエーターたちが収益を得るためにコンテンツを大量に生産したように、今後は世界中のクリエーターたちが大量にGPT(チャットボット)を作成する可能性がある。
また同氏によると、こうしたGPTやAssistantが、さらに高度なタスクを実行できる「エージェント」に進化していくと言う。
エージェントとはどのようなことができるAIなのだろう。人間の場合、例えば旅行エージェントは、顧客の要望を聞いて、その要望にあった旅行計画を立て、航空便やホテルなどを予約してくれる。人材エージェントの場合は、求職者の経歴や技能、要望を聞いて、それに合った企業の募集案件を探し、求職者の相談に乗りながら、企業と求職者のマッチングしてくれる。AIエージェントとは、こうした一連のタスクをこなすことができるチャット型AIになるわけだ。
こうしたエージェントが無数に誕生すれば、どのような社会になるのだろうか。有力画像生成AIベンチャーStable Diffusion社のCEO、Emad Mostaque氏は、例えば教育のあり方が激変するという。一般的に教師と生徒の数の比率が、教育の質に大きく影響すると考えられている。一人の教師が100人のクラスを受け持つより、20人のクラスを受け持つほうが、生徒一人一人によりそった教育を実施することができるという考え方だ。なのでAIが進化した時代には家庭教師AIが一人の生徒に寄り添えるので、教育の質が向上すると考えられている。
しかしMostaque氏は「教師と生徒の比率が1対1である必要はない。1000人の家庭教師AIが一人の生徒に教えるほうが、より効果的だ」と主張する。それぞれに専門教科や得意分野を持った1000人のAIが、生徒を性格などを共有しながら連携して一人の生徒に教えていく。もしくは共同作業の重要性を教えるために、10人の生徒に教えてもいい。いろいろな方法で、生徒の学びをサポートできるはずだと言う。「必要な技術は既に揃っている。そう遠くない未来に教育は激変する。医療やヘルスケアの領域も同じように激変するだろう」と指摘する。
確かに教育がこのように変化すると、公共教育や教育産業に、Altman氏が言うような破壊的な影響を与えるかもしれない。
▼Agent Swarmでエージェントがエージェントを生成
確かにMostaque氏の言うように、必要な技術の多くは揃い始めた。今回のOpenAIの発表を受けて、自動化技術のエンジニアのDavid Shapiro氏がOpenAIのAssistant APIを使ってエージェント生成の自動化を早速実験。その様子をYouTubeで公開している。
「自分で言うのも気が引けるが、僕は非常に優秀な自動化技術のエンジニアだ。僕は(システム連携の技術である)APIがあれば、なんでも自動化できる。そして今回、OpenAIがAssistant APIを公開してきた」「これを使えば、エージェントが別のエージェントを自動で生成できるようになる。大量のエージェントが人間を支援するようになる時代が、もうそこまできている」とShapiro氏は興奮気味に語っている。
同氏によると、人間がCEOエージェントに対して要望を伝えれば、CEOエージェントがその要望を実現するために、その要望を実現するための実行すべき複数のタスクを計画する。またそのCEOエージェントは、タスクごとに担当の重役エージェントを生成する。重役エージェントは、自分の担当タスクを実行するのに必要な部下エージェントをさらに生成する。こうして生成された多数のエージェントが、群れ(Swarm)のように束になって人間の要望を実現しようとするという。同氏は、この仕組みをAgent Swarmと呼んでいる。
Agent Swarmが完成すれば、何千体というAIエージェントが束になって人間の仕事をサポートし、何千体というAI家庭教師が束になって学生の勉強を支援するようになる。
人間の仕事はどうなるのだろう。教育はどうなるのだろう。ものすごい社会変化、産業変化がこれから起ころうとしている。
同氏は「実は今、とても緊張している。なぜなら多くの人が思っている以上に汎用人工知能(AGI)の時代がすぐそこにきているからだ」と語っている。AGIはあらゆる領域でトップレベルの人間の専門家と同等の知能を持つAIのこと。AIがトップレベルの人間の知能と並び、それを超える時代に差し迫っているというわけだ。
こうしたエージェントに関する取り組みに対し、OpenAIのLogan Kilpatrick氏は「エージェントに関する取り組みはいろいろ出てきている。しかしまだどれも完璧ではない。仕事のすべてをエージェントに任せっきりにして、問題が発生すればだれが責任を取るのか」と指摘する。「OpenAIももちろんエージェント技術に取り組んでいるが、われわれの方針は技術を段階的に公開していくこと。AIは社会を激変させる可能性がある技術。社会のコンセンサスを取りながら進化させていくことが重要」と、Alotman氏の主張を再度強調している。
実用化はまだだとしても、技術的にはかなり完成の域に近づいていることが、こうした発言から読み取ることができる。
こうした仕組みが完成する前に、この時代変化の兆しを体感し、社会としてどう対応すべきかを議論しようというのが、Aleman氏の今回の基調講演の最大の主張というわけだ。
こうしたエージェントの時代はいつ到来するのだろうか。個人的には5年以内には間違いなくこうした時代になると思う。早ければ来年ぐらいから、その兆しが見え始めることだろう。
▼LLMの最大の価値はマシンインターフェース
今のところ大規模言語モデル(LLM)の最大の価値は、と問われると、専門家の多くは「人間の意図をより正確に把握すること」と答えるのではないだろうか。Altman氏自身も「(LLMの価値を)知らない情報を見つけ出すことだと思っている人が多いが、情報を検索するのに適した技術はほかになる」「LLMの価値は、ユーザーの意図をより正確に把握することにある」と語っている。
人間と機械とのつながり方、つまりヒューマンインターフェースにおける進化が、LLMの価値というわけだ。
しかしエージェントの時代になれば、LLMが司令塔になって、あらゆるデータベース、ソフト、機械を統率することになる。機械、ソフト、データベースを基にしたAIエージェントの共通言語は、人間の言葉になる。機械同士のつながり、つまりマシンインターフェースにおける進化が、LLMの価値になる。
LLMがヒューマンインターフェースとして生み出す価値の何百倍、何千倍もの価値を、これからLLMがマシンインターフェースとして生み出すことになるわけだ。
今回のAltman氏の講演は、こうしたLLMの新たな価値を指し示す結果にもなっているのだと思う。
「想定の範囲内」どころではない。新たな時代変化を示唆する画期的な講演だったと思う。