AIで進化を遂げる「知識グラフ」の未来
人名を検索すると遭遇する「あの人検索 SPYSEE」。2000年代からWEBに触れている方であれば、覚えている方も多いだろう。検索した人物と、関連性の高い人物をネットワーク図で表示する2008年にスタートしたサービスだ。当時注目されていたセマンティック・ウェブ技術を活用し、「知識グラフ(ナレッジグラフ)」のかたちで人物関係を表現した先進的な取り組みだった。本サービスは終了し、いったんは下火となったかに見えるこの知識グラフだが、いま再び注目されようとしているという。
SPYSEEの開発に関わった筑波大学准教授 岡 瑞起氏は、ウェブサイエンスや人工生命の研究で数々の成果を挙げる気鋭の研究者だ。産学連携にも積極的に取り組み、さまざまなサービスを生み出している。知識グラフには、今後どのような可能性があり得るのか。かつて大学で交流のあったNECの研究者 星野 綾子が詳しく話を聞いた。
SUMMARY サマリー
SPEAKER 話し手
筑波大学
岡 瑞起 氏
システム情報系 准教授
博士(工学)。機械学習・深層学習、人工生命技術を使ったデータ分析・活用の研究を行う。大学での研究をベースに、新しい技術の社会実装と、これまでにない視座を持ち込み、革新的な価値の提供に力をいれている。人工知能学会人工生命研究会 主査やIPA未踏IT人材発掘・育成事業PM、株式会社ブランクスペース技術顧問も務める。
NEC
星野 綾子
技術価値創出本部
博士(学際情報学)、MSc (Artificial Intelligence)。NEC内で生まれた基盤技術の応用や価値創出、事業化促進に取り組んでいる。
組織の「空気」を可視化する知識グラフ
星野:今日はありがとうございます。岡先生とは、先生が東京大学の知の構造化センターにいらしたときに、遊びにうかがって以来ですね。10年以上前でしょうか。先生はその頃から「SPYSEE」の開発に関わるなど、知識グラフを用いた分析をされてきたと思います。最近になって、私は再び知識グラフの重要性が増してきているのではないかと考えているのですが、先生のお考えはいかがでしょうか?
岡氏:そうですね。この10年の間に知識グラフに関わる技術も大きく進化しました。新しい可能性が広がったことで、期待も膨らんでいるということではないでしょうか。
まず、時間情報を付加できるようになったことは大きなポイントです。時系列での変化も追えるようになったことで、この分野の研究がさらに興味深いものになりました。たとえば、ある人が周囲からどのくらい影響を受けて、時間とともにどう変化していくかを捉えることが可能になっています。昨今の状況下から、誰と誰が接触して感染が広がっていったかという経路を可視化する手段として使う研究も多く見られるようになりました。
また、近年めざましい発達を遂げているディープラーニングの効果も大きいですね。ディープラーニングは画像や動画、音声、自然言語処理などの幅広い分野に高い精度で対応できるようになっています。この技術が、これから知識グラフにどのような効果をもたらしてくれるかという点には、個人的にも期待しているところです。
星野:なるほど。大規模なデータも扱えるようになったことで、ようやく知識グラフを本格的に活用できる時代が到来したのではないかと私も感じています。先生は、今後こうした技術がどのような分野で活用されると面白いと思われますか?
岡氏:組織の活性化という分野には興味があります。例えば一人ひとりのパフォーマンスという問題を考えるとき、私たちは各人の能力だけを考えてしまいがちです。しかし、本当にそれだけがパフォーマンスに影響する要素だと言い切れるでしょうか。たとえば組織のなかで良いポジションにいたり、自分の力を発揮できるような仲間と働いていたりすることこそが、本人のパフォーマンスをつくり出しているとも言えるはずです。このような組織内の「空気」や関係性をデータ化しようとしたとき、ネットワークやグラフというアプローチは非常に有効な手法になると考えています。組織の関係性を可視化できれば、一人ひとりの心身の健康保持や離職者の防止にもつながりますし、より良い組織づくりに生かせるはずです。
しかし、重要なことはそれをアプリケーションとしてきちんと機能させることです。私たち人間は、なぜかネットワーク図が大好きで、それを見ただけでなんとなく満足してしまいがちです。もちろん、それは一種のエンターテインメントとして楽しんでもよいのですが、知識グラフをうまく活用して機能させていくことこそが重要であると考えています。
知識グラフ x ディープラーニングによる新たな可能性
星野:そうですね。知識グラフで単に可視化するだけでは、あまり意味がないというのは同感です。NECでも、いま知識グラフをベースとした新しいアプローチでの技術開発を進めているところです。「リンク予測AI」というディープラーニングを組み合わせた技術なのですが、このAIを使うとデータ間の関係性を予測することができます。たとえば、日本人と結婚して日本で長年暮らしている外国籍の方のデータがあれば、使用言語の入力がなくても高い確率で日本語を話すだろうと予測することができます。これは少々当たり前の例でしたが、現在は金融の不正取引検知や薬の副作用予測への活用を見据えて研究を加速させています。たとえば薬の副作用予測では、薬剤とタンパク質の間の関係や既知の副作用のデータを解析し、まだ解明されていない忌避すべき薬剤の飲み合わせや副作用の有無・種類を予測することが可能です。あらゆる副作用の可能性を検査することは、膨大な組み合わせパターンが必要となりますから非現実的です。しかし、この技術を使えば副作用の起こる可能性の高い組み合わせを当てられるようになります。
また、この技術では単に知識グラフによって直感的にその関係性がわかるということだけにとどまらず、論理的なルールを用いてその予測理由を説明できるように設計しました。「なぜその解が出たのか」という根拠を示すことで、現在AIで問題となっている説明性を担保しています。
岡氏:なるほど。金融の不正検知や副作用の調査は、そもそも実例が少ないうえに実世界での実証が難しく、実験がしにくい分野だと思います。そういう意味でも、リンク予測AIという技術はシミュレーションとして有効に機能しそうですね。実際の事例が増えたら、予測データと照合して検証を繰り返すことでシステムをアップデートすることもできるでしょうし、そうした知識グラフの使い方はもっと広がっていってほしいですね。
生物分野など、幅広い応用可能性
星野:岡先生の最近の研究で、知識グラフに関わる何か面白い成果はありましたか?
岡氏:そうですね。ユーザーとのコミュニティサイトを運営している企業さんとの取り組みのなかで、誰が誰にどのくらいの影響度を与えているかということをネットワーク図で表し、ユーザーの重要度を測るという方法を開発したのですが、そこで面白い発見がありました。たった一人がコミュニティに参加しなくなるだけで、システム全体が壊れてしまうようなことがあるとわかったのです。これは、生物の生態系では「キーストーン種」と呼ばれているものと似ています。例えばヒトデなどは、もともと個体数が少ないものの、いなくなってしまうと生態系が全て壊れてしまうほどの影響力をもっている生物です。これまで、ウェブ上でもそうした存在がいるとわかっていたのですが、実際のデータで実証することができました。
星野:それは面白い研究ですね。生態系の話が出てきましたが、岡先生は「Alife」と呼ばれる人工生命の研究もされています。この分野でもグラフやネットワーク図は活用されているのでしょうか?
岡氏:はい。ネットワークは重要な概念になります。人工生命研究では進化の仕組みそのものをつくりだすことが一つのグランドチャレンジとなっていますが、進化は一人ではできません。完全な自己複製では単に同じ個体が増えるだけです。変異が生じることで、異なる個体が生まれていきます。人間の場合であれば、両親からDNAを受け継ぎつつ、自分だけのDNAも持って子どもが生まれます。そして、個性の違う個体が集まる集団のなかで相互作用し、環境に適応して進化していくというのが、最もよく知られている進化の仕組みです。だからこそ、生態系全体の関係性をとらえることが重要になります。つまり、ネットワークから全体を捉えるアプローチが必要不可欠です。また、関係性は固定しているわけではありません。たとえば寄生していた生物と宿主が、長い年月を経て共生関係に至ることもあります。
こうしたところにも、まだまだグラフの関係性を抽出するようなテクノロジーは使えるのではないかと考えています。先ほどご紹介いただいた薬剤の副作用検出のように、知識グラフを使ったアプローチはデータサイエンスに関わらず、進化生物学などにも幅広い応用ができる可能性があるのではないかと改めて気づかされました。
これまで知識グラフは、何度か流行したものの、下火になるということを繰り返してきました。これも、実用性のあるキラーアプリケーションがなかったからだと思います。今回の再流行で、きっとそれを乗り越えるものが現れてくるのではないかと思いますし、いまご紹介いただいた応用にも、既にそのヒントが現れているのではないかと思います。
星野:はい、私たちも技術の事業化に向けて頑張っていきたいと思います。今日は貴重なお話ありがとうございました。