Java :只要了bai解一些基礎即可,做大數據不需要很深的Java 技術(shù),學(xué)java SE 就相當于有學(xué)習大數據。
Linux:因為大數據相關(guān)軟件都是在Linux上運行的,所以L(fǎng)inux要學(xué)習的扎實(shí)一些,學(xué)好Linux對你快速掌握大數據相關(guān)技術(shù)會(huì )有很大的幫助,能讓你更好的理解hadoop、hive、hbase、spark等大數據軟件的運行環(huán)境和網(wǎng)絡(luò )環(huán)境配置,能少踩很多坑,學(xué)會(huì )shell就能看懂腳本這樣能更容易理解和配置大數據集群。
Hadoop:這是現在流行的大數據處理平臺幾乎已經(jīng)成為大數據的代名詞,所以這個(gè)是必學(xué)的。
Zookeeper:這是個(gè)萬(wàn)金油,安裝Hadoop的HA的時(shí)候就會(huì )用到它,以后的Hbase也會(huì )用到它。
Mysql:我們學(xué)習完大數據的處理了,接下來(lái)學(xué)習學(xué)習小數據的處理工具mysql數據庫,因為一會(huì )裝hive的時(shí)候要用到,mysql需要掌握到什么層度那?你能在Linux上把它安裝好,運行起來(lái),會(huì )配置簡(jiǎn)單的權限,修改root的密碼,創(chuàng )建數據庫。
Sqoop:這個(gè)是用于把Mysql里的數據導入到Hadoop里的。
Hive:這個(gè)東西對于會(huì )SQL語(yǔ)法的來(lái)說(shuō)就是神器,它能讓你處理大數據變的很簡(jiǎn)單
Oozie:既然學(xué)會(huì )Hive了,我相信你一定需要這個(gè)東西,它可以幫你管理你的Hive或者M(jìn)apReduce、Spark腳本,還能檢查你的程序是否執行正確。