前回はツイートに含まれる単語をカウントしたものの、その出力結果はどの単語がたくさん使われているのかがそのままではよくわからないものでした。今回は出現数が多い単語が一目でわかるようにMapReduceでキーを降順ソートする手順を紹介し、さらに追加の情報を加えて分析を続けます。
この記事は参考になりましたか?
- HadoopでTwitterを分析してみた連載記事一覧
-
- Mahout使って分析しちゃいました。
- みなさん、元気にMapReduceしてますか?
- Hadoopクラスタを起動、いよいよTwitterの分析へ
- この記事の著者
-
平間大輔(ヒラマダイスケ)
株式会社インサイトテクノロジー
ビッグデータ・ソリューション開発部 外資系ITアウトソーシング会社を経て2011年にインサイトテクノロジー入社。
Oracle大好き、SQLのコーディング大好き人間だったが、気づけばSSD, InfiniBand, Hadoopといった旬のハー...※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア