KATOエンジニヤリング開発日誌

「アウトプット無きエンジニアにインプットもチャンスも無い」の精神で書いています

ビッグデータ

2019年9月の活動報告 1

ここ数ヶ月、転職活動と情報処理技術者試験の勉強で忙しく、ブログをサボりがちなので今月行なったことをまとめて書きたいと思います。 今月は結構活動したので2回に分けて書いていこうと思います。

なぜImpalaではなくHiveを使い続けるのか

社内勉強会で表題の件について調査を行なったものをSpeaker Deckに公開したのでこちらにリンクを貼っておきます。 目次 調査動機 おさらい(Hive) おさらい(Impala) HiveとImpalaの比較 一旦結論 Clouderaの今後のHiveへの対応 Hiveを高速化する方法につ…

「詳解 Apache Spark」の第3章を読んだ

「詳解 Apache Spark」の第3章を読んだまとめです。 www.kato-eng.info

「詳解 Apache Spark」の第1章と第2章を読んだ

大規模データ分析基盤であるSparkについて興味が湧いてきたので、「詳解 Apache Spark」を読み始めました。 詳解 Apache Spark作者: 下田倫大,師岡一成,今井雄太,石川有,田中裕一,小宮篤史,加嵜長門出版社/メーカー: 技術評論社発売日: 2016/04/29メディア: …