見出し画像

Hadoopクラスター構築実践ガイドのまとめ

上記の本を読破したので、要点を纏める。

Hadoopの参考資料


目次

この本の目次は以下。

第1章:ビッグデータ分析基盤の概要 ※30
第2章:Hadoopのシステム構成 ※30
第3章:ハードウェアの事前設定とHadoopのインストール ※70
第4章:Hadoopのクラスターの運用管理 ※70
第5章:Spark - SQL、ストリーミング、グラフデータの処理、分類器の利用 ※70
第6章:Hive/impala/HBase/Pig - データベース操作 ※50
第7章:Spoop/Flume -データのインポート/エクスポート ※30
第8章:Mahout - 機械学習(クラス分類と強調フィルタリング) ※20

「※{数値}」 はその章のページ数 


Hadoopクラスター基盤構築 第2章


Hadoopクラスター基盤構築 第3章


Hadoopクラスター基盤構築 第4章

個人的には3章・4章が特に読み応えありました。
また、ページ的にもボリュームが多いため、何度も読み返そうと思います。

3章・4章の抜粋

Hadoopクラスター基盤構築 第3章パーティション例

Hadoopクラスター基盤構築 第3章clustershell

Hadoopクラスター基盤構築 第4章クラスター停止

一番重要と思うところを抜粋しました。
本当に読みごたえがあるので、3回は読み返したいと思います。

ClusterShell

ClusterShellのコマンドにあたる「 clush 」というコマンドがとても多くでてきます。
ClusterShellについても、勉強をしていく必要があります。

ClusterShellの参考サイト

ClusterShellをインストールした。

ClusterShellで始めるSSHで並列・分散サーバー管理


雑記

上記でも書いたのですが、

サンプルコード等をコピペすることができない。

というのは、技術書だと電子書籍のよさが消えてしまっていると改めて感じました。


よいと思ってもらえたら、「スキ」をお願いします。
「スキ」は、継続の源泉です。


kindle unlimited
定額で様々な本が読み放題。特に技術書の入門編のものが読み放題なので、いつもお世話になっています。

amazonキンドル

amazon audible
時短で読書できるので、とても重宝しています。

画像8


この記事が参加している募集

#スキしてみて

526,258件

いつもサポートありがとうございます。 あなたの100円がモチベーションアップの起爆剤です。 毎日更新頑張ります Twitterはこちら https://twitter.com/7010Rei