デジタル維新—英雄たちの心のうち
シンギュラリティの提唱者カーツワイル博士が
スティービー・ワンダーからのたっての願いでその到来を確信したわけ
~シンギュラリティを予見した巨人 前編~
Text:林 伸夫
この「wisdom」の読者ならコンピューターの能力が人間の脳の働きを凌駕し、ついには自らを改良し続ける時代、すなわち「シンギュラリティ」の世界がほどなく来るという認識があることをご存知だろう。2005年に『シンギュラリティは近い』という著作を世に問い世界に衝撃を与えた人物、それが今日の主人公レイモンド・カーツワイル博士だ。
林 伸夫(はやし・のぶお) 氏
1949年10月14日、山口県生まれ。1972年大阪大学基礎工学部制御工学科(現情報科学科)卒。1982年日経マグロウヒル社(現日経BP社)入社。ソフト評価委員会主宰、日経パソコン編集長、日経BP社システムラボ、日経MAC編集長などを歴任した。スティーブ・ジョブズ氏やビル・ゲイツ氏などIT業界の巨人に数多く取材をしている。
AIを教え込むものから自分で学習する深層学習に転換させるきっかけ作り
1984年にボストンで会った博士は自然言語を解析する脳の働きを真似た解析システムの研究を熱心に説明してくれた。その成果の一つが文字を読み取り「人の声」で読み上げてくれる「カーツワイル朗読機」だ。それが1970年代〜80年初頭にかけて製品化。それを見たスティービー・ワンダーが特別な注文をして来た。「あの朗読機はすごく自然な《人の声で》しゃべってくれるよね。その仕組みを使って楽器を作ってくれないかな」
難問を投げ掛けられた博士は「リアルな楽器の発音の仕組みを徹底的にリバースエンジニアリングし、それをコンピューターで高速に再構成すれば元の楽器と同じものを作り出せる」と考えた。でき上がった世界初の“サンプリング・シンセサイザー”はその理論通り、これまでにない、圧倒的な素晴らしい製品になった。シュワーピーピーギャーギャーという音がアップテンポのリズムを叩き出す、として大いに人気を博したシンセサイザーだったが、「Kurzweil K250」は全く違った。まるで本物のスタインウエイのグランドピアノを弾いているかのようなサウンド、それが突如として突き刺さるかのような衝撃音に変化して楽曲を盛り上げる。スティービー・ワンダーの80年代のヒットアルバムにはこのシンセが多用され、独特のグルーブ感を醸し出した。日本でも発売されたが400万円という高額な値段にもかかわらず、プロミュージシャンの間では「神楽器」として重宝された。
その実世界のデータをリバースエンジニアリングし、それをコンピューターで高速で組み建て直す、という手法が今AIの世界でとても重要視されている「ディープラーニング」の手法と通じるのだ。博士はその当時、まだほとんど解明されていなかった脳神経の働きは、いずれセンシングデバイスの高性能化、極小化が加速することによって完全にリバースエンジニアリングされる。その脳細胞の働きをコンピューターで再構成すればコンピューターはいずれ自分で考え、自分を作り上げ・修復する力を持ち始めるのだ、と考えるに至った。その後博士は未来予測に没頭し、2005年に『シンギュラリティは近い』(『The Singularity Is Near:When Humans Transcend Biology』)を発表して世界に衝撃を与えた。
Googleがディープラーニングに邁進する精神的バックボーン
カーツワイル博士は2012年にはなんと、フルタイムのエンジニアリング・ディレクターとしてGoogleに入り、GoogleのAI、とりわけ機械学習・深層学習(Deep Learning)の研究開発を推し進めるバックボーンとして活躍してきた。AIの世界に巨大な一石を投じたカーツワイル博士を雇い入れた当時のGoogle CEOだったラリー・ペイジ(2001年7月にはCEO職をエリック・シュミットに譲っている)が、カーツワイルを招き入れたのはGoogleが自然言語処理・環境認識の分野で抜きんでた技術を築きたかったからと言っている通り、Googleは深層学習の開発を徹底的に進めてその基盤技術を磨いてきた。カーツワイルは直接的に深層学習の基盤技術を開発する役割ではないが、脳の働きを「リバースエンジニアリング」して、混とんとした自然界の事象から結論を導き出すニューラルネットやそれを効率的にコンピューター処理するテンサーフローを開発する方向づけに博士のビジョンが大きく寄与してきた。
AI、いわゆる「人工知能」は1900年代後半までさまざまな問題事象に対する正しいと思われる答えを網羅的に教え込んで答えさせるエキスパートシステムが中心的存在だった。しかし、その手法で世の中に山積する問題を解決するのは極めて難題。例えば、碁の打ち手を教えていくことを考えてみれば明白だ。打ち手の無限の可能性を一つひとつ潰していくことなどできるはずもない。
ところが、2015年10月、テンサーフローを基盤にハードウェアまで合わせて機械による深層学習を極限までチューニングしたGoogleの子会社開発のAIソフト「AlphaGo(アルファ碁)」が、欧州囲碁選手権3連覇を果たした中国のファン・フイ(プロ二段)を5戦全勝で下した。それまで、将棋ならコンピューターでも勝てるかもしれないが、碁ではあと10年は見込めないだろう、と言われていた世間の観測をあっさりと覆してしまったのだ。
2017年5月にはAlphaGo(アルファ碁)が中国の世界最強棋士、柯潔(か・けつ)九段を破った。このニュースは一般のテレビや新聞でも報道されたのでご存知の方も多かろう。
このAlphaGoでも重要な役割を果たしたテンサーフローを手元のパソコンやRaspberry PiのようなスモールLinuxマシン上で動かし、画像認識をエッジコンピューター上で処理完結させようとする試みもいよいよ本格化している。
ついに今年(2019年)3月米国で発売にこぎ着けたEdge TPU(Tensor Processing Unit) はそれの第1弾となる好例だ。このEdge TPUは「Google Cloud Platform」(GCP)向けのプロセッサとして開発された。GCPでの深層学習の推論に特化した製品だ。現在のところ、CPUボードを含めた開発ボートと、USB接続で既存システムの計算を加速させるためのUSBアクセラレーターの二種類が販売中だ。ブランドはGoogle傘下のCoral、日本でもMouserなどの商社から購入可能だが、残念ながら、肝心の開発ボードの方は2019年6月24日現在日本では販売されていない。こちらにCorelのオフィシャルサイトがあるので、確認してみるとよい。(https://coral.withgoogle.com/)
CPU基板を含めた開発ボードの販売価格は$149.99(米国内)。USB接続のアクセラレーターユニットは$74.99。個人の研究者でも購入できる価格帯なので、今後日本でも販売が始まれば大きな話題となることだろう。