ここから本文です。

2014年03月26日

NECのイノベーターズたち

予測の力で社会を変えるデータサイエンティスト

 NECが世界に誇る異種混合学習技術は、ビッグデータから高精度な予知や予測を実現する最先端の分析エンジン。この独自の分析エンジンを活用し、データサイエンティストとして多くのお客さまに接し、新たな価値の創造をサポートしている本橋 洋介。データサイエンティストとしてのこだわり、お客さまと開発現場を繋ぐ研究者としての役割、分析ソリューションの導入事例などについて語ります。

予測データをもとに、お客さまへ最適な価値を

──NECの分析ソリューション提供における、本橋さんの業務を教えてください。

本橋:
 一般的な言い方をするなら、データサイエンティストという表現になります。ですが、このデータサイエンティストという言葉や業務の定義が、かなり現状ではあいまいです。なので、私の仕事をもう少し具体的にご説明しましょう。

 NECには、顔認証やテキストマイニングなど、世界に誇るさまざまな分析技術があります。その中に、膨大で多様なデータから高精度な「予知・予測」を可能にするNEC独自の異種混合学習技術という分析エンジンがあります。私は、このエンジンを活用した分析ソリューションをお客さまに提供するチームに所属しています。具体的な業務としては、お客さまの課題をお聞きして「こんな分析をしたらよいですよ」とか「こういう分析をするなら、こんなデータを使うことをおすすめします」といったコンサルティングを行っています。それと同時に、実際にデータの分析・検証を行い、結果を出す分析チームのマネジメントも行っています。

NEC 情報・ナレッジ研究所 データ&テキストマイニング・テクノロジーグループ 主任: 本橋 洋介

 お客さまに最適なソリューションを提供するには、データ分析における高度な専門家であるデータサイエンティストと、お客さま特有の業種や個々の課題などに精通したドメインエキスパートという、2つのプロフェッショナルの存在が不可欠です。なぜなら、テンプレート化されたような上辺だけのコンサルティングでは、お客さま固有の課題に対して真に価値のある分析ソリューションがご提供できないからです。私たちデータサイエンティストは、これまでNECが数多く手掛けてきた業種ソリューションの強みを活かしたドメインエキスパートのスタッフとパートナーを組んで仕事を進めることが多いですが、案件によっては私自身がドメインエキスパートの役割をカバーすることもあります。

※「Quantitative Analyst」ということもあります。

重要なのは、統計学よりコンサルティング力

──本橋さんが考える、データサイエンティストの定義は何ですか。

本橋:
 ビッグデータの活用が注目されている現在、データサイエンティストという言葉や業務が話題となっていますが、その実体はあやふやです。私個人としてデータサイエンティストを定義するなら、『データを基点にしてお客さまの価値に資する分析を設計する人』でしょうか。『データサイエンティストは統計学のエキスパート』のような言い方を良く耳にしますが、ちょっと違うと私は思っています。統計学などの数学力は、持っていて当然の資質です。データサイエンティストに必要なスキルをひと言で言うなら、コンサルティング力だと私は思います。そこには、3つのポイントがあります。ひとつは、お客さまの課題や目的を正しく把握するヒアリングの力。2つ目は、分析方法の設計力。そして3つ目は、分析チームをコントロールするマネジメント力です。この3つのポイントをもとに、与えられたデータや課題から最適な提案を行うことが求められます。

 データサイエンティストに向いているのは、まず数字が好きな人ですね。数学ではありません。植物を育てたりする生物学、社会学、実験化学などの分野出身の人も向いていると思います。一見、分野がバラバラのようですが、観察や観測に基づいて現象の推測や把握をするという点ではどれも共通しています。これらの分野は、現象の観察や観測をもとに数学的分析を行うデータサイエンティストの基本スタンスと、相通じる部分が多いと思いますね。

──データサイエンティストとしての仕事で、最も重要なことは何ですか。

本橋:
 最も大切なのは、分析の最終目的をきちんと見定めることです。実は、分析から得られる結果は、お客さまの最終目的からとても遠いことが多いのです。お客さまから初めに提示される要望が、最終目的ではないこともしばしばです。

 たとえば、小売業の売り上げを予測する場合、売り上げの予測自体がお客さまにとっての最終目的ではありません。予測によって廃棄量を減らしたいのか、新商品の開発計画を立てたいのか、お客さまによって最終目的も異なります。その目的に応じて、分析対象も用いるデータも変わってきます。ですから、お客さまの課題解決の最終目的をきちんと見定めた上で、どんなデータを使って、何を予測するかを、きちんと判断することが重要です。お客さまがつくった分析プランが、最終目的にマッチしていないと判断した時には、私たちから変更を提案することもあります。

 お客さまから渡されたデータと分析課題をただ実行して、その検証結果をフィードバックするだけでは真のデータサイエンティストとは言えない、と私は思っています。お客さまが望んでいる最終目的をきちんと見定め、その目的に合わせた分析ソリューションを提案し、マネジメントすることが、データサイエンティストのミッションだからです。

分析結果で感心して頂いた時が、たまらなく快感

──本橋さんが行っている分析ソリューションはどのような流れで進むのですか。

本橋:
 分析ソリューションでは、初めにお客さまの業務課題などを洗い出して、分析システム活用の目的や狙いを明確化します。ここが一般のシステム開発と比べて大きく異なる点で、分析系のシステム開発において特に重要な部分です。先ほども言いましたが、お客さまの最終目的を見定めないと、どんなデータを使って、どんな分析をするかが変わってきてしまうからです。続いて分析データの評価指標を策定して、目的を達成するためのデータ分析のシナリオや分析方法の仮説を構築します。目的の明確化や仮説の立案などは、お客さまをはじめNECの営業スタッフ、ドメインエキスパート、さらに私たちのチームが一体となって議論を進めます。次に構築した仮説に基づき、お客さまのデータをお預かりしてトライアルを行います。トライアルの結果を見ながら実際のシステム開発に進みますが、システム開発の間もさらに分析を繰り返して、要件の定義などを調整していきます。この一連のプロセス全体をマネジメントするのが私の主な仕事です。

 現在は、異種混合学習技術という分析エンジンを活用した予測の仕事がメインですが、次のステップとして予測に基づいた生産・調達・流通などの制御や社会システムの制御へ向けた取り組みも積極的に進めています。たとえば流通業の分野では、予測に基づき、最小のコストで最大のメリットを生み出す発注システムなども、具体的に提供しています。

 さらに私には、もうひとつ大切な仕事があります。それは、研究者としての役割です。ひとつには、研究開発された最先端の分析エンジンを開発者の立場から、お客さまに最適な分析ソリューションとして提供すること。研究開発している者自身がその仕組みや効果を説明することにより、お客さまの大きな安心感に繋がります。もうひとつは、実際にお客さまと接することでわかる現場からの課題や要望などを、研究者としての知識を踏まえてNECの研究開発チームに正確にフィードバックすることです。異種混合学習技術の開発者やソフトウェアの設計者、そして実際にお客さまに接している研究者である私が、密接な連携やコミュニケーションを図ることで、異種混合学習技術の分析エンジンやソフトウェアのさらなる強化や進化に繋がっていきます。

──データサイエンティストとして、本橋さんのやりがいや苦労を教えてください。

本橋:
 お預かりしたデータをもとに検証した予測結果をご報告した時、「こんなに当たるってスゴイね!」と、お客さまが驚きの声を発する。この時が、たまらなく快感です(笑)。

 たとえば、異種混合学習技術の分析エンジンを使って不動産や中古品販売のお客さまに対し、物件や商品の価格をピンポイントで予測すると、「まるで業界における値付けのベテランに匹敵する精度」だと、驚嘆されることも多いですね。私個人としては、さまざまな業種のお客さまに数多くお会いして、お話しを伺い、実際のデータを拝見することが、本当に楽しいです。NECにいながら、ある時は製造業、またある時は流通業と、いろんな会社の社員になったような気分になります。また、今まで知らなかった業務や知識に触れることにも、大きなやりがいを感じます。

 苦労というか、ちょっと困るのはお客さまからデータだけを与えられて、目的もなしに「何か面白いことをやって!」と言われる時です。こんな時は、少々ツライですね。

関連キーワードで検索

さらに読む

本文ここまで。
ページトップ