

デジタルトランスフォーメーションでビジネスチャンスをつかめ!
ビッグデータが高度化する感染症研究
この10年で情報通信技術のコストは下がり、さまざまなデータが低いコストで利用できるようになった。その変化は感染症研究においても大きな影響をもたらしている。変化を振り返りつつ、先端研究においてどのような取り組みが行われているのか紹介する。
本稿では、2017年11月7日、北海道大学大学院 医学研究院 教授の西浦 博 博士にインタビューした内容を紹介する。西浦氏は科学技術振興機構 戦略的創造研究推進事業CRESTビッグデータ応用領域における感染症ビッグデータ研究の研究代表者でもある。

SUMMARY サマリー

鈴木 良介(すずき りょうすけ)氏
株式会社野村総合研究所
ICT・メディア産業コンサルティング部 上級コンサルタント
株式会社野村総合研究所ICT・メディア産業コンサルティング部所属。情報・通信業界に係る市場調査、コンサルティング、政策立案支援に従事。近年では、ビッグデータの活用について検討をしている。近著に『データ活用仮説量産 フレームワークDIVA』(日経BP、2015年12月)。総務省「ビッグデータの活用に関するアドホックグループ」構成員(2012年5月まで)、科学技術振興機構 戦略的創造研究推進事業CRESTビッグデータ応用領域領域アドバイザー(2013年6月~)。
ビッグデータの活用がはじまる
「2010年を境に、感染症研究の可能性が大きく広がった」と西浦氏は語る。そもそも感染症は、法律によって患者数の実態調査が定められている。感染症患者を診察した医師は所定の届け出をしなければならないというものだ。このようにして得られた届け出数と人口から感染症拡大の傾向を見ることが、2000年代前半までの感染症研究の中心であった。
2010年代になると感染症研究とは関係なく蓄積されているデータの活用や、一般に普及したIT機器の活用が検討されはじめた。
ツイッターをはじめとしたソーシャルメディアは、つぶやきの内容やメタデータとしてのGPSデータから、つぶやいた人が「いつ、どこにいるか」が分かる。それらのデータから人の場所を再構築し、ネットワーク分析を行うことができるようになった。
事業者が保有するデータも有用だ。2010年頃には、国際航空運送協会(IATA)が保有する飛行機ごとの航路データの活用を検討した。また、携帯電話事業者が保有するデータも、個体の動きを広範に収集する上で強力な武器となる。このように、さまざまな機関が持つ、さまざまなデータとの連携の可能性が大きく広がったのが最近の特徴だ。
ゲノム解読コストの低下が大きな変化をもたらす
西浦氏は「コストの劇的な低下が、感染症研究に非常に大きな変化をもたらしたものがある。ゲノム解読技術だ」と言う。これは次世代シーケンサー(NGS)と呼ばれ、新しいゲノム配列解析技術の登場によって実現した。安くなったゲノム解読をどのように活用しているのか。人間に感染した細菌やウイルスといった病原体のゲノム解読に関する事例で見てみよう。
病原体のゲノムのサイズはヒトゲノムと比べてとても小さい。そのため、患者一人ひとりから収集される病原体の全ゲノムを安いコストで解読することができる。対象となる病原体の種類にもよるし、ゲノムの中でも特徴的な箇所に限った解読とはなるが、一件当たり1000円もかからずに実施できる。
地方で数十人規模の結核感染が発生したときなど、自治体の衛生研究所が自前の分析機器を使って、全患者分のデータを解析する事例も出てきている。そのぐらい気軽にゲノムデータの収集を行うことが可能となったのだ。
複数の感染者から得られた病原体のゲノムを解析することで、「誰から誰へと感染したのか?」という詳細な感染経路が明らかになる。なぜならば、病原体はヒトからヒトへと感染していく過程で少しずつ変異するからだ。そのため、感染の順番が遠ければ遠いほど、変異が蓄積される。この変異の度合いを比較することによって、感染経路がはっきりと分かる。これらの分析手法は、疫学的な調査を代替できるほど強力な手法になってきている。実際に、韓国で中東呼吸器症候群(MERS)が発生したときには、西浦氏は韓国の感染症対策機関と協力して、感染した180人のうち150人分のゲノムを解析し、詳細な感染経路を明らかにすることができたという。
気象データでインフルエンザの拡大を予測する。
「異なる領域におけるデータとの連携は、感染症研究の可能性を広げる」と西浦氏は示す。どのようなことが可能になるのだろうか。ひとつは、拡大予測の精度が高まることが期待される。感染者数がどのように増え、最終的にどの程度の感染者数に至るのかを予測することは難しい。ピークに近づいた頃に予測すれば高い精度となるが、拡大初期の段階での予測は非常に難しい。しかし、対策のための時間を稼ぐためには、早い段階で予測したい。そこで、これまでとは異なるデータを組み合わせて、その予測精度を高める研究を進めている。
具体的には、インフルエンザの感染拡大を予測するモデルへと気象データを組み込むことを気象の専門家と共同で研究している。注目しているのは湿度データだ。インフルエンザは、湿度が高いと感染しにくい。そのため、予測湿度をモデルに組み込むことで、数週間後までにそれぞれの都道府県でどれだけの患者が発生するかを予測する精度を高めることができる。
このようにして求めた予測結果を、医療機関に対してフィードバックすることが今後求められるであろう。翌々週にある県で大規模な感染拡大が予想される場合、人工呼吸器が足りない医療機関が出てくる恐れがある。インフルエンザ患者は重症化すると肺炎になり、重い肺炎にかかった場合、人工呼吸器が必要になるためだ。そのような場合、特定の大規模医療機関に呼吸器を集め、重篤なインフルエンザ患者はそこで一括して対応する、といったことが可能になる。いざ、人工呼吸器が足りなくなってからではそのような手続きはできないため、数週間前など早い段階での予測が効果を発揮する。
感染症にかからないようにすることは難しい。患者が出たときに、すぐにその拡大を抑える必要がある。そのためには、対策のための資源を適切に配分する必要がある。
感染症研究における2種類の予測
感染症研究における予測には、フォアキャスティング(forecasting)とプロジェクション(projection)の2種類がある。フォアキャスティングは、定量的に数値として何が起きるのかを算出する。感染症以外の身近な例では、天気予報の降水確率などが相当する。
プロジェクションは、将来起こりうる事象に対して「どのような介入を行うか」ということまで含めたストーリーを検討する。たとえば、「病院を造れば、感染症患者の拡大がどれだけ抑えられるか」「抗ウイルス薬を作ったらどうか」といったシナリオだ。プロジェクションの良いところは、施策に関する比較検討ができることだ。「病院を造れば十分対応できそうなのか、それとも一定の地域を隔離する必要があるのかなど、施策の妥当性の比較検証まで行う。これは、行政機関とすれば予算に直結するものなので、感染症対策を行う上で重要な手続きとなる」と西浦氏は言う。これは、予測のための予測ではなく、施策につなげることの重要性を示すものだ。
以上、西浦氏へのインタビュー内容を紹介した。フォアキャスティングとプロジェクションといった区別は感染症研究に閉じず、さまざまな事業の現場においても有効な考え方だ。プロジェクションをしなければならない状況で、フォアキャスティング止まりになっているようなケースはないかを常に考える必要がある。
また、異業種とのデータ連携は民間企業のなかでも重視されるテーマだ。インフルエンザの拡大予測と気象データのような、相性の良い「課題とデータ」の組み合わせを探すことは容易ではない。しかし、良い組み合わせはこれまでとはまったく違うアプローチで課題解決を実現しうる。本事例はそのような示唆を与えてくれるだろう。
関連リンク