日本のエンジニア3名がHadoop開発コミュニティのコミッタに就任
これは、コミュニケーション言語が多くの場合英語ということも敷居の高さとなっているかもしれない。とはいえエンジニアの多くは、英語力よりはプログラミング力でコミュニケーションがとれる。なので、米国産ソフトウェアの開発部門、たとえばOracleなどでも多くの日本人が開発に参画している。彼らの多くは英語も流ちょうに話すだろう。とはいえ、中には英語は不得意だけどC言語やJavaならしゃべることができ、それを使ってコミュニケーションをとり活躍している人もいる。
ところで2014年12月18日に、NTTデータが興味深い発表を行った。Apache Hadoopとその関連プロジェクトでの開発コミュニティ活動が評価され、 NTTデータ、NTT ソフトウェアイノベーションセンタの社員3名がコミッタに就任したのだ。Apache Hadoopの開発コミュニティのコミッタというのは、Hadoopのソフトウェアのソースコード変更をできる権限を持った主要開発者だ。
「Hadoopが話題になったのは2011年くらいからですが、NTTデータでは2008年にはHadoopをやり始めています。2010年には『Hadoop構築・運用ソリューション』を発表しています。Hadoopについては、国内唯一の実績があると自負しています」と言うのは、日本のHadoopの世界では有名なNTTデータ OSSプロフェッショナルサービス シニアエキスパートの濵野 賢一朗氏だ。Hadoopを業務システムや社会インフラのシステムで使う際には工夫が必要、そのためのノウハウをNTTデータは他社にはない優位な形で保持していると言う。
NTTデータがなぜHadoopの利用だけではなく開発にも参画しているのか。オープンソース・ソフトウェアは誰でも使うことができる。SIの仕事だけを考えれば、たんに使うにとどめるでも問題はない。
「それでもさらに開発に参画するのは、SIやサポートサービスをやっていて直面する課題、たとえばこんな機能が使えるはずなのにうまく動かない、突発的に障害が発生してその原因がHadoopの問題といったことがあります。これは、使っているからこそわかる問題点なのです。それらの解決方法を自分たちのナレッジにとどめておき、独自ノウハウとして売るというのもあるでしょう。しかしそうではなく、Hadoopそのものを改善するほうが良かろうと考えHadoopの改善活動を続けています。さらにもう少し先を見て、Hadoopに今後あるべきものは何かということも考えながらやっています。将来必要であろう機能や信頼性などを提案し、コミュニティと一緒に作っているのです」(濵野氏)。
今回コミッタに就任したのはNTTデータ 基盤システム事業本部の鯵坂 明氏、日本電信電話 ソフトウェアイノベーションセンタの小沢健史氏、NTTデータ 基盤システム事業本部の岩崎正剛氏の3名だ。鯵坂氏と小沢氏はHadoop本体の、岩崎氏は周辺機能となるHTraceのコミッタに就任した。鯵坂氏はOfflineImageViewerの拡張、Hadoop 2系のドキュメント整備、メトリクスのドキュメント整備、品質強化に関する取り組みなどが評価された。小沢氏は、YARNの高可用化、および処理基盤間のインタフェースの整備と実装、さらにYARNの致命的なバグの修正などが評価された。岩崎氏は、HTraceのモジュール開発、トレーシング機能のHDFSへの追加、Sqoopのコネクタ開発やHadoopの運用スクリプト改善などが評価された。
NTTデータはすでに世界では4位の貢献度合い
Hadoopの開発において、どの企業が貢献しているのかを2013年に解決済みのissue数で比較すると、Hortonworks、ClouderaというHadoop専業の企業、そして世界最大規模でHadoopを利用しているYahoo!などが上位を占めている。NTTデータはこの時点では世界で6位だ。これが、2014年上半期で集計すると、解決済みissue数も貢献コード行数でもHortonworks、Cloudera、Yahoo!に続いて4位となっている。つまり、貢献度はさらに高くなっている野だ。
今回3名のコミッタが誕生も貢献度の高さの証しだろう。とはいえ3名のコミッタが新たに誕生しても、NTTデータのHadoopに取り組む体制としては内部的に大きな変化はないそうだ。NTTデータは上記の貢献度合いの結果からもわかるように、すでにコミュニティでは信頼された存在。これまでも、コミュニティでの活動が進めにくい状況があったわけではない。
サポートサービスについても、多くの企業がHortonworksやClouderaなどHadoopのディストリビュータ企業の支援を受けながら提供しているのに対し、NTTデータではすでに単独でサービスを提供している。そんなサポートサービスにおいては、いざ何らかの問題がHadoopにあった際に、NTTデータにコミッタがいてその問題をコミュニティと供に直すことができると言えるのは「大きなメリットになります」と濵野氏は言う。
NTTデータでは、今後コミッタをさらに4、5人までは増やしたいと考えている。Hadoopの開発コミュニティには、世界に100名ほどいるコミッタの上位にProject Management Committee(PMC)という意思決定の場がある。コミッタを誰にするのか推薦するのもこのPMCだ。「PMC側に意思決定の力があるので、コミッタを増やしPMCも含め担うことも考えています」と濵野氏。現状のPMCの構成は、ほとんどが貢献度の高い欧米企業のメンバーで占められている。彼らが強権を振りかざしているわけではない。とはいえ、より健全で活発なコミュニティ活動となるためにも「既存の開発コミュニティの中の第三極を目指したい」と濵野氏は語った。