IT mediaの言い間違いも直してくれるGoogleの「音声文字変換」、かなり使えるという記事から。
Googleの音声文字変換アプリ「Live Transcribe」がかなり使えるレベルにまできているみたい。
「堺屋太一」を正確に変換できるのは、ニュースなどのデータも取り込んでいるからだろうな。
エクサウィザーズ のAIエンジニア遠藤太一郎さんによると、教師なし学習における転移学習の領域で大きなブレークスルーがあったらしいので、音声文字変換のレベルはこれからますます向上するものと思われる。音声認識AIを使ったいろいろな製品がこれからいっぱい出てくるようになるのだろう。
ただ個人的な使い道においてさらに精度がよくなるには、ニュースに出てくる固有名詞だけではなく、自分の家族や友人の名前などプライベートな固有名詞のデータが必要になってくるはず。
精度向上かプライバシー保護か。難しい問題だけど、利便性に消費者は抗えない、というのが僕の基本的なものの見方。多くの人が音声認識の精度向上のためにさらなる個人情報をGoogleに提供するようになるんだろうな。