製薬・化粧品業界の専門技術展示会インターフェックス大阪に出展されたマルチモーダルAIロボットを見学してきた。AIを使って液体を計量する世界でも珍しいロボットだという。AIは有効なデータが多くなればなるほど、どんどん賢くなる。今は液体を計量するというシンプルな機能しかないが、やがて熟練工の「匠の技」も学習できるようになるかもしれない。開発に携わった大成建設株式会社の渡野邉哲也氏は、「熟練工が少なくなる中で、匠の技をAIに学ばせることは急務」と語っている。
デモブースに置かれていたのは、ロボットアームと牛乳瓶のような容器2つとビーカー。1つの容器には水が、もう一つの容器にはグリセリンが入っているという。パソコン上でグリセリン250ccと入力すると、ロボットアームがグリセリンの入った容器を持ち上げて、何度か左右に振り、やがてビーカーにグリセリンを注ぎ始めた。最初は、ドボドボっと大胆に注ぎ、230ccを超えた辺りから、ゆっくり少量ずつ注いでいった。
なんのことはない。人間なら簡単にできることだ。
しかし人間に簡単にできることが、AIには一番難しい。大成建設と共同開発したAIベンチャーの株式会社エクサウィザーズの浅谷学嗣氏によると、同じ展示会に出展している大手機器メーカーの技術者が見学にきて「液体の計量が、どうしても自動化できなかった。どういう方法でやっているんですか」と質問に来たという。
同じ容量を何度も注ぐ大量生産なら、同じ動きをロボットにプログラミングすればいい。しかし化粧品業界のように非常に多くの種類の液体原材料を使って多品種少量生産する工場では、人間がするしかない。「自動化された工場で、液体の計量の仕事だけを何十人かの人間が受け持っているそうですよ」と浅谷氏は言う。
なぜそこまで難しいのか。液体の粘度を計るのが難しいからだ。ドロっとした液体なら、容器を大きく傾けてもゆっくりしか出てこない。一方でサラっとした液体なら、ちょっと傾けただけで大量に容器から出てくる。粘度を正確に把握しないと、容器をどれだけ傾ければいいのか分からない。ただ当たり前だが、液体によって粘度が異なる。また同じ液体でも、そのときの室温によって粘度が変わってくる。さらには同じ液体の製品でも、製造ロットが異なれば粘度が微妙に異なるのだという。
計量しようとするたびに専門の機器で粘度をいちいち計るわけにもいかない。「多くの液体の粘度の違いを考慮して、液体を一定量注ぐプログラムを書くのは非常に大変。というか無理だと思います」と浅谷氏。渡野邉氏も「計量ロボットを作る計画を立てたとき、多くの人から絶対無理だって言われました」と語る。
それを可能にしたのが、今回のロボットに搭載されたマルチモーダルAIだ。マルチモーダルとは、複数のモード、つまり複数の感覚を使うという意味。今回のロボットでは、視覚(カメラ)と触覚(ロボットアームの手の部分につけられた圧力センサー)の2つのモードを使ってAIが学習する仕組みになっている。
ドロッとした液体を振ったときと、サラッとした液体を振ったときでは、表面の波立ちかたが違う。また容器を持つ手に伝わる力も、違うような感じがする。手の部分の圧力センサーのデータでAIが粘度を予測できるのかどうか。確信はなかったが、試しに圧力センサーのデータもAIに入力してみた。「そうしたら、うまくいったんです。視覚と触覚のマルチモーダルで粘度を予測し、粘度にしたがってロボットアームの注ぎ方が変化したんです」と浅谷氏は語る。カメラの映像データと手の部分の圧力データ。粘度を予測する上で、AIはこれらのデータのどの部分を重要と考えたのか。それは分からない。分からないが、粘度を予測し注ぎ方を変化させ、早く正確に計量した。
今は単純な計量作業しかできないマルチモーダルAIロボットだが、これからはより複雑な作業ができるようになるのだろうか。熟練工の匠の技を再現するには、指先の触覚のちょっとした違いなどを計るセンサーが必要になるはず。そうしたセンサーはこれから開発されるのだろうか。「そうなると思います。これからいろいろなセンサーが出てくるとは思いますし、的確なセンサーがなくても今回のように複数のモードのデータを入力することで匠の技を再現できるかもしれません。というかそうしていかなければならないでしょう。熟練工が少なくなる中で、匠の技を早くAIに学習させていかなければならないと思っています」と渡野邉氏は語る。
ディープラーニングの日本の代表的な研究者である東大の松尾豊准教授は、ディープラーニングに関しては米国や中国の企業の開発スピードがとても速いという。ところが「物づくりの分野に対し、ソフトウェアに強みを持つシリコンバレーの企業などはなかなか参入できない。そうであれば、日本企業は強みである物づくりとディープラーニングを組み合わせることで、高い競争力を生むことができるのではないか」と語っている。
大成建設とエクサウィザーズのマルチモーダルAIは、まさに物づくりとディープラーニングの組み合わせだ。引き続き世界の最先端を走り続けることができるのだろうか。今後の技術開発が注目される。
【取材を終えて】
デモブースに来た人の反応を見ていたら、二つに大別できた。「ふーん」という感じと「すごい!」という真逆の二つの反応だ。過半数の人には、このロボットの真価は分からなかったようだ。それも仕方がないかもしれない。人間なら簡単に出来ることをロボットが出来るようになっただけ、に見えるからだ。しかし、この時点であえて断言したい。これからマルチモーダルAIロボットは、匠の技を模倣できるようになり、そしてさらには匠の技さえ超えていく。なぜなら、人間にはよく理解のできないデータの相関関係でも、ディープラーニングには見つけ出すことができるからだ。それがディープラーニングの真骨頂だからだ。AIが碁のチャンピオンを負かしたのと同じことが、これから製造業でも起こっていく。今回のニュースは、その道筋の可能性が見えたということだ。やがて大河となる川の、源流にたどり着いたという話なんだと思う。