簡介¶ 大數據¶ 數據的存儲 數據的計算 兩大框架¶ Hadoop HDFS、MapReduce、HBase(NoSQL數據庫) 數據分析引擎:Hive、Pig 數據採集引擎:Sqoop、Flume WEB管理:HUE 工作流:Oozie Spark Scala Spark code:數據計算 Spark SQL Spark Streaming:流計算 內容¶ 參考資料¶ test code