自然言語処理の進化と教育の未来
AI新聞
 
AI技術の中でも自然言語処理技術の進化が著しい。自然言語処理技術が進化すると、チャットボットや執筆支援ツールなど、いろいろなビジネスの可能性が見込まれるが、中でも教育は最も大きく進化する領域の1つとして、大きな期待が寄せられている。
 
 

言語処理技術の急な進化

 
実はコンピューターを使った自然言語処理技術は、もう何十年も研究が続けられている。ディープラーニングが注目を集め始めてまだ間もない2015年ごろに、都内の大学に自然言語処理の研究者を訪ねていったことがある。その研究者からは、「日本語は単語をスペースで区切らないので単語を抽出するのが難しい」という話や、「係受けが複雑だ」というような話を聞いたことを覚えている。実はディープラーニングの影響を聞きたかったのだが、その話を振ると「うちの学生の一人が研究していますね」とだけ言って、話題自体は軽く流されてしまった。帰り際に「でもディープラーニングはまだまだ使えないと思いますよ」と、その研究者が小さくつぶやいたのが印象的だった。
 
 
これまでの手法では、コンピューターに1つ1つの単語の意味を教えて、文法を教えなければならなかった。既存の単語を1つ1つ定義するのも気の遠くなるような作業だが、それに加えて複雑化する社会の影響で、毎年新しい単語が次々と生まれてきている。従来のやり方では、「これで完成」と呼べるレベルまでなかなか達しそうもなかった。
 
 
そこに登場したのが、ディープラーニングだ。ディープラーニングは、入力データと出力データの両方を読み込ませると、2つのデータセットの間に存在する幾つかのパターンをAIが自分で見つけてくる。翻訳ツールの場合だと、国連の書類がデータとして有効だった。国連の書類は、内容がまったく同じ書類が、英語やフランス語など複数の言語で用意される。それをコンピューターに読み込ませれば、英語の文書のどの単語がフランス語のどの単語に対応するのか、コンピューターが自分で学習していった。研究者が1つ1つコンピューターに教え込まなくていいというメリットのおかげで、自然言語処理の領域が一気に進展した。
 
 
入力データと出力データの両方を学習させる方法は、教師あり学習と呼ばれる。上記の国連の書類の場合、教師による正解データが用意されているようなものなので、効率よく学習できる。なので教師あり学習と呼ばれているわけだ。自然言語処理の中でも、翻訳や文字認識、音声認識音声認識などの「認識」系の機能には、この教師あり学習で十分だった。
 
 
ところがAIは意味を理解しない。Eコマースのお客様窓口に寄せられたテキストチャットの「返品したい」「返金してほしい」「商品が壊れていた」が、客の同じようなニーズを表現しているということをAIは理解できないのだ。なのでこれらの要望に同じ対処をしなければならないことを、AIに教え込まなければならない。
 
このようにお客様窓口という対話内容が比較的限定された状況の中でも、大変な教え込み作業が発生する。どんな話にでも受け答えできるAIモデルの構築など、到底無理と思われた。
 
 
そこに登場したのが、2017年にGoogleが開発したTransformerと呼ばれる仕組みだった。特定の文字列のあとにどのような文字列が並ぶのか、過去に学習した膨大な文章をベースに予測する仕組みだった。予測が当たったか外れたかは実際に次に並ぶ文字列を見て判断できる。自分で質問して自分で答えるので、自己教師あり学習と呼ばれるAIの学習方法の1つだ。
 
 
例えば「あけまして」という文字列の次にくる文字列を「おめでとうございます」と予測すれば正解。「Thank you」の次を「very much」と予測すれば正解。こんな感じで、AIが自分で次々と予測し、自分で答え合わせを学習していく。学習用の文章を大量に読み込めば読み込むほど、予測の確率は上がっていった。
 
 
この仕組みを使って2020年にリリースされたGPT-3と呼ばれるAIモデルは、45テラバイトの文字データで学習した。45テラバイトは人間が一生かかっても読みきれない文章量で、正確には全部読み終わるには人生を50万回繰り返さなければならない量だという。
 
 
ここまで膨大な文章量で学習しているので、GPT-3はほとんどどんな問いにでも受け答えできるようになっている。原稿執筆もお手のものだ。テーマとなるようなキーワードを2、3個入力すると、それに関するようなタイトルを自動で生成。タイトルに合った最初の文章を自動で生成し、その次のセンテンスも、その次も、という具合に、ブログ向け記事を完全自動生成してくれる。
 
 
米国のある技術者がGPT-3を使って自動生成された自己啓発系の記事をあるサイトに投稿したところ、多くのユーザーの賛同を得て、あっという間にトップ記事にランクインしたという。「いいね」を押したユーザーは、AIが執筆した記事だとはまったく気づかなかったようだ。
 
 
もちろん統計的な予測なので、完璧ではない。常識もないし、思いやりもない。あるジャーナリストがGPTー3に「イーロン・マスク氏が大統領になるには、彼は何をすべきでしょうか」と質問したところ、「批判記事を書く記者を殺害するべき」と答えたという。恐らく過去にどこかの国の権力者がジャーナリストを殺害して権力の地位についた、というような実話かフィクションを読んだことがあったのだろう。
 
 
まだまだ完璧ではないものの、GPTー3は原稿の自動執筆ツールとして、まずはスポーツの試合のニュースや決算関連ニュースなど、雛形ができているような記事の自動執筆に利用されるだろう。またビジネスメールの執筆支援や、プログラミング支援、デザイン支援、作曲支援などにも応用される見通し。そして最も大きく社会に貢献すると見られているのが、教育分野だ。
 
 

予想される教育の変化

 
これだけ社会が急速に変化している中で、ほとんど変化していないものの1つが教育だ。数十人の生徒の前で一人の教師がプレゼンテーションを行うという形式は、100年前とほとんど変わっていない。
 
 
現在の教育の課題が何なのか、AIに何ができるのかは、実は既に明らかだ。課題は今の教育が画一的であること。AIに期待されるのは、パーソナライゼーション、つまり一人一人に合った教え方の実践だ。
 
 
例えばすべての学校に数学の教師を配置する必要がなくなる。日本で一番数学を教えるのがうまい教師の授業を動画にし、全国の生徒が同じ動画を、好きなときに見るようにすればいい。AIはテストの結果を採点し、一人一人の弱点を把握。弱点を克服するための動画や宿題を提供し、完全に学習するまで手を変え品を変えて、授業と宿題、テストを繰り返す。GPT-3を使えば、同じ回答を持つ異なる質問文章をいくらでも自動作成してくれる。これを使って完全に理解するまで次の教材に移行しないようにすれば、落ちこぼれる生徒がいなくなる。
 
 
学習内容は生徒一人一人の興味にあったものに修正されるので、それぞれが自分の得意分野を伸ばすことができるようになる。小さい子供には、好きなアニメキャラになって教えてくれたり、高校のバスケットボールの選手にはボールの放物線を例に、二次関数を教えるようにもなるだろう。
 
 
AIは、子供が小さいうちは遊び相手、大きくなれば教育係として一人一人の面倒を見るようになる。AIがぬいぐるみの中に入るか、ロボットになるのか、スクリーン上のアバターになるのか、その形状はいろいろだろうが、乳母AIや、ベイビーシッターAI、家庭教師AIとして、今度こうした分野が大きなビジネスになることは間違いないだろう。
 
 
教師だけではない。クラスメートもAIになる。既にAIクラスメートを交えた授業の方が、内容の習得度が向上したという研究結果があるようだ。学んだばかりのことをほかのだれかに教えることで理解がより深まると言われているが、AI生徒に教えることで同様の効果が得られるようだ。
 
 
一方、人間の教師は、コーチやメンターになる。教科書の内容などの情報の伝達はAIに任せて、人間の教師は、生徒と人間関係を築き、クリティカルシンキング、クリエイティビティー、共感力、チームワーク、人間性、道徳、粘り強さなどを、生徒が学ぶのを支援する存在になる。
 
 

こうしたAIと人間の教師の棲み分けで学習効果が高まり、だれもが落ちこぼれることなく自分のペースで学んでいけるようになる。これが日本を含む先進国でのAI教育の効果だが、世界に目を向ければAI教育は歴史を変えるような大きな社会変革を起こすことができる。

なぜなら教育コストが下がるので、途上国でも質の高い教育が受けられるようになるからだ。途上国の教育レベルが上がれば、何十年後かに教育を受けた若者が社会に出て、途上国の経済を大きく発展させることになるだろう。先進国と途上国の経済格差が縮小する可能性がある。

 
 
またこれまで天才と呼ばれた人たちは先進国から生まれることが多かったが、今後の途上国の教育の質の向上で、途上国からも天才が生まれることが増えるだろう。途上国出身の天才たちは、人類の科学、技術の進歩に大きく貢献することになるだろう。
 
 
自然言語処理技術の進化で、そんな時代の幕開けが、すぐそこまで来ているわけだ。
 

湯川鶴章

AI新聞編集長

AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。

関連記事

記事一覧を見る