Shoeisha Technology Media

EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

データという水を得た魚となり情報科学の研究へ――Sansan DSOC 奥田裕樹さん

2018/10/11 06:00

 生物学の視点から漁業管理を学びデータ分析に足を踏み入れ、バイオインフォマティクスを研究、現在はSansanにて自然言語や機械学習を研究している奥田裕樹さん。データサイエンティストとして成長していくリアリティが見えてくる。

生物学にデータ分析が加わり研究への熱量が増加

Sansan Data Strategy & Operation Center R&D Group 研究員 奥田裕樹さん

 奥田さんは高校卒業後、東京海洋大学へ進学した。学部では魚をメスで解体したり、顕微鏡で観察したりと、いわゆる生物学を学んでいた。しかし、当時の生物学に対する熱意について本人としては「さほど高くはなかったです」と振り返る。奥田さんは「高校が進学校でしたのでいろいろと勉強しました。物理、化学、生物、どれも好きで、結局決めきれないまま……(進学した)」と話す。

 受験当時、親の趣味が影響してダイビングの経験があったという奥田さん。ライセンスを取り、沖縄や海外の海を潜ったことも。一般的な10代と比べると、海や魚と触れ合う機会に恵まれていた。「生きものは好きです。海も好き。だから海洋大への進学や大学院でのバイオインフォマティクスの研究につながったのかもしれませんね」と述懐する。

 学部生のころはコンピュータやプログラミングとの接点はなく、まだIT分野に進む気配はなかった。転機は大学4年の時に訪れた。資源生態学に関する研究室に所属したことだ。魚をどのくらい漁獲すると、翌年にどれくらいの資源量に変化するのかなど、漁業管理をテーマとする研究に取り組んだ。そこでは統計学が必要となり、奥田さんは見様見真似でデータ分析を始めた。これがデータサイエンティストである現在につながる最初のきっかけとなった。

 それまでは魚や生物は好きだったものの、奥田さんからは周囲の熱意が上回って見えた。当然だが、海洋大学の同級生たちはみんなそろって海や魚が大好きで、週末になると必ず釣りに出かける友人もいた。心のどこかで「かなわない」と思っていたのかもしれない。しかし研究室でデータ分析を始めたとき「これは面白い」と思えたという。やる気にスイッチが入ったようだ。

 さらにデータ分析への知見を深めたくなったのだろう。研究室とは別に、遺伝子のデータベースを作る研究所でアルバイトを始めた。ここでプログラミングなど基本的なことに少しずつ触れていく。後にバイト先の紹介で、東工大の技術員として過ごしたことも。

 2013年からはあらためて情報学を学ぶために奈良先端科学技術大学院大学(以下、奈良先端大学)の情報科学研究科へと進んだ。データ分析で一定の実践経験は積んだものの、奥田さんは「自分は情報系出身ではないから」ということで、基礎からみっちり学ぶための選択だった。

無意味に見えるデータから生命の仕組みが浮かびあがってくる

 奈良先端大学時代はデータサイエンティストとしてのキャリアで見ると、まだ「駆けだし」の段階だ。そんなころKaggleにも挑戦した。Kaggleとは、世界中のデータサイエンティストが集まるコミュニティで、その分析の腕を競うコンペティションが開催される。競技はKaggle運営側からデータ分析の課題が提示され、参加者は分析モデルを提出し、分析の精度で勝者が決まるというもの。参加者が提出したスコアは応募期間中でも随時公表され、応募期間であれば再提出してもいい。奥田さんは腕試しで参加したものの、ライバルたちのレベルの高さに「太刀打ちできない」と怯んだ。

 当時、まだ経験年数も浅く無理もない。むしろこの段階でKaggleに挑戦しようとする熱意を持つのはまれな方で、世界トップレベルの腕を肌で感じることができたのはいい経験になったはずだ。なお当時Kaggleに参加した時の上位入賞者には現在の同僚の名前もあったという。

 奈良先端大学ではバイオインフォマティクスを中心に研究した。生命情報科学とも言われるバイオインフォマティクスは、生命科学と情報科学を組み合わせた分野だ。代表的なのがゲノム解析。遺伝子の塩基対を読み取り、遺伝子の働きなど生命の謎に迫る。実際にはミドリムシなどを対象とした遺伝データの解析をしていたそうだ。

 生物に関心があり、そこにデータ分析が加わることで奥田さんはいわば「水を得た魚」になった。塩基対の並びとなるデータは一見して文字の羅列だ。中には遺伝的な情報がない部分もあると言われている。そうしたデータ解析は、魚の解剖のように目に見える世界ではない。奥田さんは「意味のないように見えるものから、解析を進めることで生命の基本原理などの意味が浮かびあがってくるところが面白いと思いました」と話す。

 当時はゲノム解析で画期的な計測法が出て間もない時期。分析時間の短縮と解析コストが大きく削減できたころでもある。最先端の研究であることも奥田さんを惹きつけたことだろう。

※この続きは、会員の方のみお読みいただけます(登録無料)。


※この続きは、会員の方のみお読みいただけます(登録無料)。


著者プロフィール

  • DB Online編集部(ディービーオンライン ヘンシュウブ)

    DB Online編集部 翔泳社 EnterpriseZine(EZ)が提供するデータベース/データテクノロジー専門メディア「DB Online」編集部です。皆様からの情報お待ちしています。 Twitter : https://twitter.com/db_online Fac...

  • 加山 恵美(カヤマ エミ)

    EnterpriseZine/Security Online キュレーター フリーランスライター。茨城大学理学部卒。金融機関のシステム子会社でシステムエンジニアを経験した後にIT系のライターとして独立。エンジニア視点で記事を提供していきたい。EnterpriseZine/DB Online&nbs...

バックナンバー

連載:データサイエンティストに会いたい!

もっと読む

All contents copyright © 2007-2018 Shoeisha Co., Ltd. All rights reserved. ver.1.5