データサイエンティスト 編

コンピュータ上に日々蓄積されるビッグデータは、私たちの生活に密接な関わりを持ちつつある。ショッピングサイトの購入履歴、ソーシャルメディアでのコメント、あるいはGPSやICカードなどの位置情報や乗車履歴といったデータは今、社会的・経済的な課題の解決に活用されているのだ。そこで今回は、株式会社トライディアのCEO西岡賢一郎氏と同社でデータサイエンティストとして活躍する那珂将人氏にご登場いただく。データサイエンスに魅了され起業した経緯や、教育の分野で起きつつあるITイノベーションについて話を伺った。

現代の宝の山、ビッグデータに挑む!教育のITイノベーションを巻き起こす

株式会社トライディア(3idea Inc.)
CEO

西岡 賢一郎 (にしおか けんいちろう)

1985年 鹿児島県生まれ
2003年 ラ・サール高校 卒業
2009年 東京大学 教養学部 卒業
2011年 東京大学大学院総合文化研究科 卒業
2012年 株式会社トライディア(3idea Inc.)設立
現在に至る

スティーブ・ジョブズ、ラリー・ペイジを越えろ東大が輩出する若き起業家たち

古くはアップルコンピューターのスティーブ・ジョブズ、あるいはグーグルのラリー・ペイジやセルゲイ・ブリン。若くして未踏のビジネスを開拓し、大きな成功を収めた起業家たちの姿は、世界中の多くの若者の憧れだろう。近年では日本においても起業家たちを支援する動きが活発となり、大学生が在学中や卒業後に起業するという例も枚挙にいとまがない。経済産業省の調査によると、日本における「大学発ベンチャー」の総数は1749社(平成26年度)。取りわけ多いのが、東京大学出身の起業家たちだ。

 「起業が特に厳しい道だとは思いません。私の場合は大学院を卒業後、一年ほどエンジニアとしてフリーで働いたあとにボストンを訪れる機会があり、そこで知り合った人たちと一緒に会社を立ち上げました。学生時代から起業したいという気持ちがありましたから、タイミングが良かったのでしょう」

 株式会社トライディアのCEO(代表取締役)を務める西岡賢一郎は、東京大学大学院総合文化研究科を卒業後、2012年に同社を設立した若き起業家である。東大で学んだコンピュータサイエンスの知識を生かし、ユーザー参加型の電子教科書編集を可能とした「OpenBook」や、文書作成をクラウド上で共有・編集する「VISE」といったサービスを立ち上げてきた。現在、特に力を注いでいるのが、コンピュータ上に大量に蓄積され続けているいわゆるビッグデータの中から価値のある情報を抽出する「データマイニング」。東進の教育データを解析して今までにない勉強法や講座を生み出すプロジェクト等にも参画している。

「一般的に教育のIT化は案外遅れていて、正確なデータを取る仕組みですら確立されていません。そうした中で東進の場合は、早くから生徒個人の詳細な学習状況やにしおか  けんいちろうTOSHIN TIMES 2015年12月1日発行 第三種郵便物承認 定価 150円模試の結果、彼らの合格実績などのデータを蓄積してきていました。これらのデータを活用すれば、教育のITイノベーションを起こす第一歩が踏み出せます。そのお手伝いができるのは、とてもやりがいのあることです」

 

アマゾンの土台は数学でできている!?おススメ機能の仕組みとは

西岡がデータ解析に興味を持ったのは大学4年生のとき。研究室選びの際に、アマゾン・ドット・コムのレコメンデーションやグーグルのページランクなどの仕組みを知り、おもしろいと感じたのがきっかけだ。ショッピングサイトのアマゾンは、ウェブサイトそのものが巨大なプログラムといっていい。とりわけレコメンデーション機能は、アマゾンが競合他社に先んじて実装してきたもので、顧客の好みを分析し、おすすめの商品をページに表示する仕組みだ。一方、グーグルのページランクはウェブサイトの重要度を測る指標のことで、「リンクされている数が多いほど、そのページの重要度は高い」とするものだ。これらの仕組みの根幹にあるのが「数学」なのだ。アマゾンやグーグルといった、今や私たちの生活に不可欠となっているサービスが実は数学によって支えられている。この事実に、もともと数学が好きだった西岡は驚かされる。

 「例えばアマゾンのレコメンデーションの場合、数学のベクトルの考え方が土台にあります。ショッピングという誰もが日常的に行うことに対して、数学的な考え方を用いることで発想を転換させて、よりよいサービスまでつなげる。それが私の得意な数学と社会貢献を結ぶ、とてもかっこいい世界に見えたんです」

 こうして西岡は、研究室でより優れたレコメンデーション機能のアルゴリズム開発にチャレンジする。アルゴリズムとは、より効率的に、正確な解答を導き出すための計算手順のことだ。当時西岡が興味を持ったのは、ショッピングサイトにおける書籍購入の、意外性のあるおススメ機能だ。例えば街中の書店で本を買う場合、目的の書籍を見つけてレジに持っていくまでに、あまり興味を持っていなかった分野の書籍コーナーも通るだろう。その過程でふとタイトルやカバーで興味が湧き、つい購入してしまったことはないだろうか。「ショッピングサイトでユーザーの書籍購入履歴からおススメ書籍を予想することは難しいことではありません。ただ、それではリアル店舗のおもしろさを味わうことはできません。ネットの便利さとリアルの意外性を融合させたいと思ったんです」

 ただし、それを実現するにはネットでの購買履歴からでは不十分で、リアル店舗での購買行動のデータなどが不可欠だった。「残念なことに、そのときはリアル店舗からのデータ協力を得ることができませんでした。データサイエンティストは、手元にあるデータだけではなく、目標のためにどのようなデータが必要なのかを判断し、それらを手に入れることも必要なのだということを学びました」

優れた教師の「勘」や「経験」を誰もが受けられる仕組みを作る

そして現在、西岡が力を注いでいるのが「教育」の分野だ。受講履歴や模試の点数の推移といったデータを解析することによって、これまで教師の「勘」に頼っていた教育のノウハウを数値化しようというものである。

 「データ解析をすることによって、より個人にあった学習プランの作成や細分化された学習傾向を分析できるようになります。これら教育系ビッグデータに対して、機械学習、パターン認識、データマイニングの技術を用いて新しい知見を得るためのサポートをしているところです。最適な授業を行うためにも、データを使ったアプローチは今後も必須になってくると思います」

 こうした取り組みが進めば、例えばどのレベルの講座をどれぐらいのスピードで、いつまでに、どの程度の理解度で進めれば、確実に難関大合格に結びつくのかということがわかるようになる。教師の「勘」や「経験」を、データから客観的かつ論理的に裏づけることが可能となることで、誰もが自信を持って指導できるようになり、教育の質を底上げできるようになるのだ。教育の「見える化」である。「人のために役立つものを作ろう」と決意して起業した西岡にとって、教育の舞台はまさに腕の振るいどころだ。

 そんな西岡に、今後の展望を聞くと「日本を出たい」という言葉が返ってきた。「やはり広い舞台でビジネスをしたい。幸いコンピュータサイエンスの仕事は、世界中のどこにいてもできます。海外で活躍している先人たちに会うと、皆さん野心があります。しかし自信家というわけではなくて、いろんな劣等感を持ちながらも頑張っている。そんな姿に憧れます」ベンチャー企業の経営者として、そしてエンジニアとして世界を相手に挑戦し続ける西岡。未知なる領域に果敢に立ち向かい、さらなる高みへ上がろうとしている。(文中敬称略)

データサイエンティストだからできる新しい「働き方」「生き方」

株式会社トライディア(3idea Inc.)
Data Scientist

那珂 将人 (なか まさと)

1989年 東京都生まれ
2008年 東京都立 武蔵高校 卒業
2012年 東京大学 教養学部 卒業
2012年 中国 吉林大学修士課程 留学
2015年 株式会社トライディア     
     (3idea Inc.) 入社
*吉林大学で学びながら同社にて正社員契約として働く。
 取材には中国からスカイプでご協力いただきました。

吉林大学で研究を行いながら日本のベンチャーで働く

東大器械体操部で西岡の後輩にあたる那珂将人は、東大大学院を休学して、中国の吉林大学修士課程に入学。現在吉林大学でデータマイニングの研究を行っている。研究者、それに加えて日本で事業展開するトライディアで働くという「二足のわらじ」を履いている。これまでにない「新しい働き方」を実践しているといえるが、両立させるうえでの不安は「まったくなかった」と那珂はいう。

 「データマイニングの研究は場所を選びません。パソコンがあってデータが手に入れば、どこででもできます。東大在学中から留学生との交流が多く、いずれは海外に出てみたいという思いが強かったんです。それで思い切って中国の大学院に進むことにしました」

 玉石混交の大量のデータから価値ある情報を抽出するデータマイニングが、那珂の専門分野だ。しかし始めからコンピュータサイエンスに興味があったわけではないという。

 「きっかけはiTunes でした。もともと統計が好きで、あるときiTunesでの再生回数の分布に興味を持ったんです。その後、YouTubeの再生回数から人気となりそうな話題の時間的な変化を抽出するといったことを研究室では取り組んでいましたね」

1000年かかる計算を5分で解け!データマイニングの醍醐味とは?

 中国吉林大学で現在、那珂はT w i t t e rの公開データをもとに、位置情報から人間の移動パターンを明らかにする研究に携わっている。トライディアにおいても大量のデータを扱うが、データマイニングの醍醐味は「どのデータに着目し、意味づけするか」だと那珂はいう。

 「実際のデータは未整理で、分析には不要な要素やノイズが絡み合っています。量も億単位です。そこにいろいろな処理を施すことによってようやく解析できるデータになる。手計算では1000年かかるような計算を、コンピュータを使って5分で解ける手法を見つける。優秀な計算手順、つまりアルゴリズムを生み出すことが私の仕事になります。困難ではありますが、だからこそ挑戦しがいがあります」

 二つの国を股に掛け、研究と仕事にまい進する那珂は、「二足のわらじ」をいかにも楽しんでいるように見える。

 「私にとっての仕事は、お金をもらうために自分の何かを犠牲にするものではありません。やりたいから、やる。それによって誰かを助け、引き換えとして報酬を受け取る。今の仕事は、たとえ無給でもやりたいと思っています。それぐらい意義のあることなんです」

 場所や時間に縛られず、好きなことを「仕事」にする那珂の姿は、これから社会に出る若者たちに多くの示唆を与えるに違いない。(文中敬称略)

Q&A

仕事をするうえで手放せない「三種の神器」を教えてください。

「Mac」「Kindle」「iPhone」です。電子書籍端末のKindleは、軽くて電池の持ちもよく、大量の本を簡単に持ち運べるので重宝しています。iPhoneは移動中もチャットで仕事の連絡を取ったり、スケジュール管理やtodoの管理を常に行いますから必携です。

五か国語を喋れるそうですが語学習得のコツを教えてください。

英語、中国語、スペイン語、ポルトガル語とすべて大学時代に独学で勉強しました。ポルトガル語はブラジル人の友人に教えてもらいました。「これはなんていうの?」と聞いて、その都度教えてもらうということを繰り返しているうちに自然と口をついて出てくるようになりましたね。日常会話を習得するときは、その方法が一番早かったです。