Spark的集群安裝部署【大數(shù)據(jù)技術文章】

更新時間:2020-10-29 來源:黑馬程序員瀏覽量:

以圖1所示的Spark集群為例，闡述Standalone模式下，Spark集群的安裝與配置方式。

圖1 Spark集群

　　從圖1可以看出，我們要規(guī)劃的Spark集群包含一臺Master節(jié)點和兩臺Slave節(jié)點。其中，主機名hadoop01是Master節(jié)點，hadoop02和hadoop03是Slave節(jié)點。

　　接下來，分步驟演示Spark集群的安裝與配置，具體如下。

　　1.下載Spark安裝包

　　 Spark是Apache基金會面向全球開源的產品之一，用戶都可以從Apache Spark官網http://spark.apache.org/downloads.html下載使用。本書截稿時，Spark最新且穩(wěn)定的版本是2.3.2，所以本書將以Spark2.3.2版本為例介紹Spark的安裝。Spark安裝包下載頁面如圖2所示。

圖2 Spark安裝包下載

　　進入Spark下載頁面，選擇基于“Pre-built for Apache Hadoop 2.7 and later”的Spark2.3.2版本，這樣做的目的是保證Spark版本與本書安裝的Hadoop版本對應。

　　2.解壓Spark安裝包

　　首先將下載的[spark-2.3.2-bin-hadoop2.7.tgz](https://archive.apache.org/dist/spark/spark-2.3.2/spark-2.3.2-bin-hadoop2.7.tgz)安裝包上傳到主節(jié)點hadoop01的/export/software目錄下，然后解壓到/export/servers/目錄，解壓命令如下。

$ tar -zxvf spark-2.3.2-bin-hadoop2.7.tgz -C /export/servers/

　　為了便于后面操作，我們使用mv命令將Spark的目錄重命名為spark，命令如下。

$ mv spark-2.3.2-bin-hadoop2.7/ spark

　　3.修改配置文件

　　(1)進入spark/conf目錄修改Spark的配置文件spark-env.sh，將spark-env.sh.template配置模板文件復制一份并命名為spark-env.sh，具體命令如下。

$ cp spark-env.sh.template spark-env.sh

　　修改spark-env.sh文件，在該文件添加以下內容：

1603941386285_圖片1.png