テクノロジーをベースにした未来予測を仕事としているにもかかわらず、僕は文系なので技術のことは実はよく分かっていない。なのでどの技術やベンチャー企業が有望なのかは、技術が分かる人の動向を追うことで判断しようとしている。
動向を追っていた二人の優秀な技術者を通じて最近、米国のデータロボット社という人工知能系のベンチャー企業のことを耳にした。しかも一人は自分が創業した企業を離れてデータロボット社に入社したし、もう一人は同社に出資を決めた。
なんなんだ、このデータロボット社って!?
どうやらデータロボット社は、技術者でなくても人工知能を自由に扱えるようなサービスを提供しているのだとか。プログラミング知識がないビジネスマンでも、ワープロや表計算ソフトを扱う感覚で人工知能を扱えるようになるというのだ。「ビッグデータ活用が激変します。ビジネスに与える影響は半端ない。革命的です」。一人の技術者は興奮気味に解説してくれた。
渋谷のフリーターから世界的研究者、そして起業
その技術者とは、シバタアキラさんという若者だ。本名はもちろん漢字だが、あえて本人の意思でカタカナ表記で活動されている。
僕がシバタさんの動向を追っているのは、その生き様が半端ないからだ。
シバタさんは神奈川県の高校を中退し、渋谷でフリーター生活を続けていたが、パンクロックが好きだという理由で英国の大学に留学。そこで世界的な研究者の授業に感銘を受け、それからは猛勉強を続けて、ついには素粒子物理学で博士号を取得。ニューヨーク大学の研究員になってからは、世界的に有名なスイスのCERNという研究所で活躍した。すごい人物だ。
帰国後は白ヤギコーポレーションという人工知能系のベンチャー企業を創業。何度かお話をうかがったことがあるのだが、将来絶対にビッグになりそうなので目をつけていた。
そのシバタさんが、自分で作った会社を退社したあと、米国のデータロボット社の「ひら社員になりました」(シバタさん)という。「まじですごい会社だと思ったので」。
どういうことなんだ。いったいどんな会社なのだろう。
リクルートが出資
もう一人、僕が尊敬する技術者がいる。リクルートの人工知能研究所を立ち上げた加藤真吾さんだ。加藤さんは毎月のように渡米し、人工知能関連の研究者やベンチャー企業に会いまくっている。
僕は昨年、数人の人工知能の世界的権威を取材する機会に恵まれたが、全員、加藤さんに紹介してもらった。僕が持つ米国の人工知能ベンチャーに関する情報も、ほとんど加藤さんがネタ元だ。
リクルートは昨年11月にデータロボット社に出資したと発表した。仕掛け人は加藤さんに違いないと思って連絡すると、やはり加藤さんだった。
またしてもデータロボットだ。なんなんだ、この会社は。
データサイエンスのドリームチーム
人工知能の研究者や人工知能を実際に運用するデータサイエンティストたちと話していると、Kaggleという言葉をよく耳にする。どうやらKaggleは、データサイエンティストたちのコンペティションのサイトらしい。腕に覚えのある約30万人のデータサイエンティストたちが登録しているのだとか。
企業や大学が人工知能を使って解いてもらいたい問題をこのサイト上で公開すると、世界中のデータサイエンティストたちが問題を解くための数式モデルを考案し公開する。その中で最も優秀なモデルを提示したデータサイエンティストに賞金が手渡される。ただデータサイエンティストたちにとっては賞金よりも、世界中のデータサイエンティストからの賞賛を受けるということのほうが重要なようだが。
シバタさんによると、そのKaggleで30万人の頂点に立つようなトップデータサイエンティストたちが何人も、このデータロボット社に在籍しているのだという。つまりデータサイエンティストのドリームチーム。それがデータロボット社だという。
予測モデルの構築はここまで自動的になった
ではデータロボットはどのようなサービスを提供しているのだろうか。簡単に言ってしまえば、データさえあれば予測モデルをほぼ自動で作成してくれるというサービスだ。
1つの例として、米国のある医療機関のデータを基に、退院した患者が再入院する可能性を予測するモデルをデータロボットのシステムが作成する様子を見せてもらった。
アメリカでは医療の質の問題から、退院した患者の症状が悪化し再入院する問題が顕在化している。どういう処置を取れば患者の再入院率を低下させることができるのか。適切な処置を提案してくれるモデルを、データロボットのシステムが自動的に作成するのだという。
入力するのは患者の年齢、性別、病気の種類や症状といった患者の属性データに加えて、病院側で行った処置のデータ、そして30日以内の再入院の記録などのデータだ。インターネットを通じて、これらのデータがデータロボットのサーバーに送られ、どのデータがどの程度、再入院に関係しているのかを解析。再入院率を予測するための計算モデルを自動的に作り出してくれる。
「人間がこうした予測モデルを作ろうとすると、1つのモデルを作るだけでも、ものすごい時間がかかる。ところがデータロボットは、数十、数百という数のモデルを比較的短時間に自動的に組み合わせることが可能なんです」とシバタさんは言う。たくさんの異なる手法の予測モデルを組み合わせることで、単体のモデルでは到達できないほどに予測精度が高くなるのだという。
人間の仕事は前と後ろに
データサイエンティストと呼ばれる職種の人たちは、これまでこうした予測モデルを考案することに多くの時間を使ってきた。データロボットのシステムは、その作業を自動化するだけでなく、何十、何百というモデルを自動的に組み合わせる。到底人間にはできないレベルの作業をも、こなしてしまうわけだ。
そうなればデータサイエンティストは不要になるのだろうか。
「モデルを作る部分は、完全に自動化できると言っていいと思います。人間の作業は、モデル作りの前と後ろ。つまりモデル作成に必要なデータを集めて加工するところと、モデルが出してきた答えをアプリやプログラムにつなげるところになっていくでしょうね」とシバタさんは言う。
モデルを作るためにデータロボットのシステムにどのようなデータを読みこませるのか。データを選ぶだけではなく、ときにはデータを変換したり、加工することで、モデルの精度が向上する。その作業は、これからも人間がすることで価値を出せる領域だと言う。
もう1つは、モデルが出してきた予測結果をサービスに反映させたり、そこから新しいサービスを創りだしたりする部分。データロボットは生成されたモデルから自動的にAPI(アプリケーション・プログラム・インターフェース、プログラム間をつなぐ接続部分)を作ってくれるが、そこから先の部分はユーザーが行う必要がある。「予測モデルはできても、施策が明確でないこともある。離反確率の高いユーザーにアプローチしたら更に離反確率が上がったなどということもあり、人間の役割もまだまだ大きい」とシバタさんは強調する。人工知能が出してきた予測データを踏まえて、どういうアクションを起こせばいいのか。そこを考えるのも、まだまだ人間の仕事だということだ。
止まらない進化 メジャーリーグのスカウトも利用
とはいえデータロボットがAPIまで作ってくれるのは非常にありがたい話。シバタさんは「APIの自動デプロイなどはサービス化のためにはキーになる開発ですが、今まではモデルができてから開発に何カ月もかかっていました。これがデータロボットでは一瞬にして行われてしまうのです」と言う。簡単なアプリ画面を作り、サンプルデータさえ用意できれば、データロボットの人工知能は勝手に学習して予測モデルを作り、さらにはアプリと人工知能との間のデータの自動受け渡しの部分までもすべて自動的に作ってくれるわけだ。人工知能利用がここまで簡単になると、今後、人工知能につながるスマホアプリが多数登場してくることだろう。
データロボットでは現在、この客は買うか買わないか、再びアクセスするかしないか、というような2つの結果のどちらになるかを予測する「二値分類」と、売り上げが幾らになるのか、というような数値を予測する「リグレッション」の2つのタイプの予測モデルの開発が可能だという。
今後は、この料理は韓国料理なのかイタリアンなのかというように複数のグループに分ける「多値分類」や、この人にはこの商品をお勧めすると購買につながるというような「レコメンデーション」などの予測モデルの開発機能も提供する予定。既にベータ版(正式版をリリースする前の試作版)として提供を始めているという。
米国では、インターネット上のショップや、POSデータを持つリアルな店舗、銀行や保険会社、メディア、広告会社、ダイレクトメールのマーケッターなどが、データロボットのサービスを利用し始めている。おもしろいところでは、プロ野球のメジャーリーグのスカウトマンが、データロボットを使って選手のデータを解析し、妥当な契約金の額をはじき出しているという。
ほかにもビッグデータと呼ばれるような大量のデータを集めている企業なら、データロボットのシステムを使うことで、これまで以上の価値をビッグデータから引き出せることになるだろう。
ビジネスマンがビッグデータを活用する時代へ
人工知能の話をすると「うちの会社には無関係」という反応をする人が多い。その理由は「うちの会社には人工知能の研究者はいないし、採用できそうにもないから」というのが最も多い。そういう反応をする人に対して、「いずれ表計算ソフトExcelを触る感覚で、人工知能を操れるサービスが登場しますよ」と話してきた。
そう話した僕でさえ、一般ビジネスマンが人工知能を自由に操れる時代の到来は、あと数年先だろうなと高をくくっていた。
しかしデータロボットによって、ビジネスマンでも人工知能を操れる時代の幕が切って落とされようとしている。表計算ソフトExcelは、ビジネスの世界を一変させた。それと同等、いやそれ以上の大変化をビジネスの世界に引き起こすかもしれない。「データサイエンスの大衆化が始まるんです」。リクルートの加藤さんはそう語る。
ビッグデータ時代と呼ばれるようになって久しいが、集めた大量のデータをうまく活用できないケースが多いという話をよく聞く。人工知能が一般ビジネスマンでも利用できるようになれば、産業界のあらゆる場面に人工知能が利用されることになるだろう。
時代はますます加速している。テクノロジーの進化をレポートする僕のような人間にとっても、驚くべき進化の速度だ。
そのデータロボットのトップエンジニアが来日して、リクルート主催のカンファレンスで講演するという。このカンファレンスにはシバタさんも登壇するらしい。どのような変化がこれから起ころうとしているのか、このカンファレンスに参加して確認するつもりだ。その模様はまた後日、この場で発表したい。
Newsweek日本版より転載
http://www.newsweekjapan.jp/