米AIベンチャーのOpenAIが2022年11月30日にリリースした対話型AIのChatGPTが人気だ。ユーザー数は急速に伸びており、1月にはアクティブユーザー数が1億人を超えた。その性能に多くの人が驚いたようだ。
言語系のAIモデルはどこも、この2、3年で大きく性能を伸ばしており、これからいろいろな言語系AIが登場すると見られている。
その一つがFacebookを運営するMeta Platformsが同じく11月に研究成果を発表したAIモデルのCICERO(シセロ)だ。
CICEROは、対話エンジンと計画エンジンの両方を持つAIモデルで、人間と交渉したり、人間を説得できるという。
ChatGPTは対話エンジンしか搭載しておらず、人間の質問に対して豊富な知識で回答してくれるが、交渉したり説得したりという能力はない。CICEROはChatGPTとは異なる領域で活躍することになりそうだ。
CICEROの研究成果は、動画の形でYouTubeにアップされている。この動画によると、CICEROは数人の人間と、戦略ゲーム「ディプロマシー」をプレー。同ゲームの世界チャンピオンに勝利している。
「ディプロマシー」は、第一次世界大戦時のヨーロッパが舞台の戦略ゲーム。プレーヤーは、ロシア、オーストリア、ドイツ、イギリスなどの国になり、他国と手を組んだり、裏切ったりしながら戦いを進め、最終的に物資補給都市をより多く手中に納めたプレーヤーが勝利する。
今回のゲームでは、他のプレーヤーとのコミュニケーションがテキストチャットで行われ、だれがどの国か分からないまま進められた。CICEROも1つの国として参加したが、他のプレーヤーから見破られることはなかった。
ゲームに参加した世界チャンピオンのAndrew Goff氏は、6つの点でCICEROの動きが素晴らしかったと評価する。
1つは同盟を組む相手を正しく決めた、という点。プレーヤーはまずどこの国と同盟になるのかをコミュニケーションしながら決める。CICEROはGoff氏に手を組むことを提案。Goff氏もこの提案に「いいアイデアだ」と返事した。ところが、同氏のちょっとした反応からCICEROは、同氏が同盟関係に消極的であることを見破ったもようだという。
2つ目は、信頼関係の醸成。関係性をよくするような会話をする一方で、重要な戦術に関しては詳細に議論したという。
3つ目は、すぐれた戦術の提案。CICEROは熟練プレーヤー並みの戦術を、同盟国のプレーヤーに教えたという。初心者プレーヤーでもCICEROの知恵を借りて、世界チャンピオンと伍して戦えたらしい。
4つ目は、すべての国と対話を継続した点。ディプロマシーでは、同盟国がいつ裏切るか分からない。今の敵国と同盟を組まなければならない状況になるかもしれない。なのでCICEROは、敵国ともコミュニケーションを継続していたという。
5つ目は長期的視野。目の前の小さな勝利より、最終的な大きな勝利を求めて長期的な視野で戦っていたという。
6つ目は、誠実であったという点。たとえ敵国にも、うそをつくことはなかったという。もちろんすべての情報を敵国に開示していたわけではなく、開示していい情報とそうでない情報を判断し、使いわけていたという。
CICEROの開発チームのエンジニア、dam Lerer氏は当初、CICEROに誠実さと狡猾さの両方を持たせ、嘘をつくこともできるようなプログラムにしていたという。ところがCICEROは誠実さだけで戦ったほうが勝率が上がったらしい。
最終的にCICEROは、基本的に誠実で、人間と共同作業ができるAIになったという。世界チャンピオンのGoff氏は、誠実さと協調性が求められる領域でCICEROが大活躍するのではないかと語っている。
CICEROに関してはAI研究者の間でも評価は高く、オックスフォード大学のマイケル・オズボーン教授は、2022年に見たAIの中でもCICEROの性能に非常に驚いたと語っている。