◎AIはメタバースのような一過性のブームではない?
今のAIブームって、どこかで減速するのだろうか。それともこのままイノベーションが続き、大きな社会変革の波になるのだろうか。
ニューヨーク大学のScott Galloway教授によると、モバイルやGPSといった社会のインフラとなる技術に関する論文の出版数の推移は同じようななだらかな山かの形のグラフになるという。
一方でメタバースやクリプトに関する論文数は急速に増えるものの、その後急速に減少している。
ところがAIに関する論文は、モバイルやGPS同様になだらかな波の形をたどっている。よってAIはメタバースやクリプトのような一過性のブームで終わることなく社会のインフラになる可能性が高い、としている。(ソース YouTube 英語)
◎Hugging Faceが2億3500万ドルの資金調達
評価額45億ドルでSalesforce、Google、Nvidia、Amazonが出資した。Microsoftが出資していないことからも分かるように、OpenAIにとっては脅威となる動き。
というのはHugging Faceって、AIのモデルやツールを共有できるオープンソースのコミュニティを運営している。今はクローズドのOpenAIが一番力を持っているけど、今回の出資でオープンソース勢がますます勢いをつけることになりそうだからだ。
Amazonは今年2月にHugging Faceと提携しているし、IBMと NASAはAI基盤モデルをHuggingFace上で公開した。
インターネットしかり、電子メールしかり、社会インフラとなる技術はオープンソースがいいと言われるが、言語モデルも社会インフラになりつつあるのでオープンソースのほうがいいのかもしれない。
(ソース SilliconRepublic 英語)
◎Metaが過去最高峰の翻訳モデルを開発
名前はSeamlessM4T。音声をテキストに変換したり、それを別の言語に翻訳したりできる。また音声を別の言語の音声に変換することもできる。複数の言語モデルを使うのではなく、一つの言語モデルでこれを実装しているところがすごいところ。
音声とテキストという複数のモード(データの種類)を扱うのでマルチモーダルと呼ばれる。AIは1つのモードで学習するより複数のモードを学習したほうが精度がよくなる。人の声だけに集中するのではなく、唇の動きや顔の表情にも注目したほうが相手の言うことをより正確に理解できるのと同じことだ。
これまで音声データのテキスト変換はOpenAIのWisperと呼ばれるモデルが最も性能がいいとされていたが、今回のSeamlessM4Tは、性能テストでWisperを上回ったという。
なぜMetaのAI研究がここまで進んでいるのかというと、Metaがオープンソースを推奨しているから。優秀な研究者の間では、民間企業の収益のために働くのではなく人類の科学技術の進歩に貢献したいとしてオープンソースの考えに賛同する人が多く、オープンソースを推奨する企業に優秀な人材が集まる傾向があるようだ。
ライバル社であるGoogleやMicrosoftは自社の独自技術を向上させることで自社のクラウドサービスの利用客を増やしたいと考えている。Metaはクラウド事業を持っていないので、独自技術にこだわる必要はそれほどない。それよりも自社の技術をオープンソースにすることで周辺ソフトをオープンソースコミュニティーのだれかに開発してもらい、自社の技術を使ったSNSなどの自社サービスの技術環境をより完璧なものにすることができるメリットがあるわけだ。
(ソース アスキー)
夏休みのせいか、今週はニュースが少なめでした。