インタビュー

データサイエンティストが生き残るために必要なのは「本質を見抜く力」|小川卓氏x尾崎隆氏対談

  • この記事をシェアする
  • 4
  • 46
  • 74
fc6927a4cd7fc6f068de9eb5d3ae4aff21

mini_machinoこんにちは、町野です。

ここ数年話題の職種、データサイエンティスト。
一時はバズワードとして、頻繁にその名を目にした人も多いのではないでしょうか。

今回はそんなデータサイエンティストの「今後」をテーマにアマゾンジャパン株式会社 データアナリストの小川卓氏と
株式会社リクルートコミュニケーションズ データサイエンティストの尾崎隆氏による対談をお届けします。

今後生き残るデータサイエンティスト像とは。
データサイエンティストとしてキャリアを考えている方、データサイエンティストの採用を検討している方は特に必見です。

小川卓(おがわ たく)氏
小川さんプロフ
アマゾンジャパン株式会社Mass Account Manager。
デジタルハリウッド大学大学院 客員准教授。
Webサイトやサービスの分析に長年携わる。
著書に『入門 ウェブ分析論  アクセス解析を成果につなげるための新・基礎知識』『ウェブ分析レポーティング講座』など。
個人ブログ 『リアルアクセス解析』 を運営。
リアルアクセス解析:>http://d.hatena.ne.jp/ryuka01/

 

尾崎隆(おざき たかし)氏
尾崎さんプロフ
株式会社リクルートコミュニケーションズ Data Scientist。
元脳科学者の経歴をもつ。アドホック分析やアルゴリズムを中心に行う他、統計を用いたコンサルティングでも活躍中。
著書に『手を動かしながら学ぶ ビジネスに活かすデータマイニング 』がある。
個人ブログ『銀座で働くData Scientistのブログ』を運営。
銀座で働くData Scientistのブログ:>http://tjo.hatenablog.com/

 

対談「データアナリストxデータサイエンティスト」

-本日はよろしくお願いします。

小川氏・尾崎氏:よろしくお願いします。

-まず、今データサイエンティストに求められている役割について伺いたいのですが、実際のデータサイエンティストの仕事というのはどういうものなのでしょう。

尾崎氏:定量的なモデルを作ることだと思っています。

僕のいる現場では、いわゆる発注者である「ビジネスパーソン」の要望に対して、要件をきちんと整理して伝える「プランナー」みたいな人が間にいて。そういった人とよくコミュニケーションを取っています。
で、最終的に僕が要件に沿ってモデルを作っていくと。

たとえばアドホック分析であれば、僕のところでモデルを作って「こんな感じになりました」って話をして、使用方法をまとめたレポートまで作ってお渡しします。
これがアルゴニズム実装であれば、実際にシステムを作って回しちゃうんですね。普通に現場にコミットして。この辺は多分、エンジニアと変わらないんです。
エンジニアとデータサイエンティストで違う点は「裏っ側にあるのはモデル」ということですね。

ただ「データサイエンティストだからモデルを作るのか」って言えばそういうわけでもないんです。
今のデータ分析の枠組みって小川卓さんのような「上流で要件を作って設定して、実際に意思決定する」っていう層と、僕がいる「データで支配されたモデルを完全に作り上げる」っていう層とに分けられるのかな?という風にちょっと考えています。

コミュニケーションのポイントは「本質を理解しているか」

小川氏:「意思決定する層」と「モデルを作り上げる層」の間でコミュニケーションがうまくいかないとか、いわゆる齟齬とかって起きてますか?

尾崎氏:いやー、よく起きますね。

小川氏:いつもそこって、課題にあがるなって気がしていていて…やっぱりそれって、お互いの要望を理解していないからかと。

尾崎氏:お互いが歩み寄らないといけないですよね。お互いが本質を理解しているかどうかなんですよ。

尾崎さん①

本質を理解するには、目の前のファクトにとらわれないこと

尾崎氏:例えば、ビジネス側のディレクターさんに結構高度な統計モデルを持っていく際、本質に対する理解がちゃんとできる方が相手だとすごく話が通りやすいんですよね。

「この広告の重みを計算しているんですよ」とか、「モデルでは自然成長の分を分離し、あくまでも施策の効果だけを見ているんです」というような話をした時にちゃんと理解してくれる人っていうのはやっぱり話がしやすいと。

逆にそんな話をしても「良くわかんないよ、結局何なの?」って言われると、なかなか難しい。

小川氏:なるほど。どうしたら本質を理解できるようになるんでしょうね?

尾崎氏:そこ、難しいですよね。ただ、一番大事なのは「目先のファクトだけにとらわれない」ことかなと思っています。

一般にファクトとして得られるデータって、たくさんの「ノイズ」が乗っていることがほとんどです。なので、無理やり追従させすぎると「オーバーフィッティング」つまり、ノイズに振り回されるばかりになってしまい、モデルとしては予測性能の悪いものができてしまうんですよね。

-モデルはノイズをちゃんと除去してから作るということですか?

尾崎氏:そうです。これは統計学の非科学的信念みたいなものなんですけど「ある真の値をうまく説明するモデルが、一番いいモデル」という風に言われています。なので、相手にも「ノイズまみれのデータの中に真の値がある」というところに気付いてもらえるといいですね。

小川氏:ビジネスの成長具合や施策の効果ってすごい求められますから、データのクリーニング工程や、分析に行く前のフェーズってやっぱりすごく大事ですよね。

尾崎氏:そうなんですよ。要は「ビジネス側の人材が裏側の本質っていうものをどれくらい突きつめる気持ちや意識があるか」って話になってくると思うんですよね。そういう人であれば、データ分析も活かせるだろうと。

で、そうなった時に小川卓さんのようなアナリストに入っていただいて、さらに、僕のようなデータ分析、統計学使う人間が同時に入って改良していくと物凄く成果が上がるんじゃないかなと思っています。だけど、どれか一個でも欠けてくれると結構ガタガタしてくる印象です。

小川氏:つまり、コミュニケーション齟齬が起こりやすいと。

尾崎氏:そうですね。

小川氏:結局は「結果を求めること」と「知りたいこと」のバランスですよね。

結果を求めるだけってのは「モデルなんてどうでもいいから売上を上げてくれ」っていう話になるし、知りたいってだけになると知るだけで終わってしまって、改善にはつながらないですからね。
結果を得る、あるいは伸ばすためにはやはり理解が必要なんだろうなって気はしてますね。

例えば「今ビジネスが結局どう成長していて、何が成長の要因になっていて、何がブレーキの要因になっていているのか」。そういったノイズを除いた上で、データを見ながらベストな施策を一緒に考えていけるといい気がしますね。

尾崎氏:そうですね。データサイエンティストっていう人種も、そこまで踏み込んでできるようになるとワンランク上の仕事ができるようになる印象がありますね。
そしてそのために「データサイエンティスト」にとってどうしても避けられない仕事の一つとして、「前処理」があります。
ひどいと工数の9割が前処理だったりして(笑)。
その意味では、データサイエンティストは「データマエショリスト」です、というのが正しいかもしれませんね。

 

>>次のページ 今後求められるデータサイエンティストの役割とは・・・?