前言

Spark 是 Berkeley 开发的分布式计算的框架,相对于 Hadoop 来说,Spark 可以缓存中间结果到内存而提高某些需要迭代的计算场景的效率,目前收到广泛关注。下面来一起看看使用docker快速搭建Spark集群的方法教程。
适用人群
准备工作
Spark集群
Spark运行时架构图
如上图: Spark集群由以下两个部分组成
如何docker化(本例使用Standalone模式)
1、将spark集群拆分
base(基础镜像)
master(主节点镜像)
worker(工作镜像)
2、编写base Dockerfile
注: 为方便切换版本基础镜像选择的是centos, 所以要下载java和spark, 方便调试, 可以下载好安装文件后本地搭建一个静态文件服务器, 使用Node.js 的http-server可以快速搞定
命令如下
npm install http-server -g http-server -p 54321 ~/Downloads
正式开始写Dockerfile
FROM centos:7 MAINTAINER RavenZZ <raven.zhu@outlook.com> # 安装系统工具 RUN yum update -y RUN yum upgrade -y RUN yum install -y byobu curl htop man unzip nano wget RUN yum clean all # 安装 Java ENV JDK_VERSION 8u11 ENV JDK_BUILD_VERSION b12 # 如果网速快,可以直接从源站下载 #RUN curl -LO "http://download.oracle.com/otn-pub/java/jdk/$JDK_VERSION-$JDK_BUILD_VERSION/jdk-$JDK_VERSION-linux-x64.rpm" -H 'Cookie: oraclelicense=accept-securebackup-cookie' && rpm -i jdk-$JDK_VERSION-linux-x64.rpm; rm -f jdk-$JDK_VERSION-linux-x64.rpm; RUN curl -LO "http://192.168.199.102:54321/jdk-8u11-linux-x64.rpm" && rpm -i jdk-$JDK_VERSION-linux-x64.rpm; rm -f jdk-$JDK_VERSION-linux-x64.rpm; ENV JAVA_HOME /usr/java/default RUN yum remove curl; yum clean all WORKDIR spark RUN \ curl -LO 'http://192.168.199.102:54321/spark-2.1.0-bin-hadoop2.7.tgz' && \ tar zxf spark-2.1.0-bin-hadoop2.7.tgz RUN rm -rf spark-2.1.0-bin-hadoop2.7.tgz RUN mv spark-2.1.0-bin-hadoop2.7/* ./ ENV SPARK_HOME /spark ENV PATH /spark/bin:$PATH ENV PATH /spark/sbin:$PATH
3、编写master Dockerfile
FROM ravenzz/spark-hadoop MAINTAINER RavenZZ <raven.zhu@outlook.com> COPY master.sh / ENV SPARK_MASTER_PORT 7077 ENV SPARK_MASTER_WEBUI_PORT 8080 ENV SPARK_MASTER_LOG /spark/logs EXPOSE 8080 7077 6066 CMD ["/bin/bash","/master.sh"]
4、编写worker Dockerfile
FROM ravenzz/spark-hadoop MAINTAINER RavenZZ <raven.zhu@outlook.com> COPY worker.sh / ENV SPARK_WORKER_WEBUI_PORT 8081 ENV SPARK_WORKER_LOG /spark/logs ENV SPARK_MASTER "spark://spark-master:32769" EXPOSE 8081 CMD ["/bin/bash","/worker.sh"]
5、docker-compose
version: '3' services: spark-master: build: context: ./master dockerfile: Dockerfile ports: - "50001:6066" - "50002:7077" # SPARK_MASTER_PORT - "50003:8080" # SPARK_MASTER_WEBUI_PORT expose: - 7077 spark-worker1: build: context: ./worker dockerfile: Dockerfile ports: - "50004:8081" links: - spark-master environment: - SPARK_MASTER=spark://spark-master:7077 spark-worker2: build: context: ./worker dockerfile: Dockerfile ports: - "50005:8081" links: - spark-master environment: - SPARK_MASTER=spark://spark-master:7077
6、测试集群
docker-compose up
访问http://localhost:50003/ 结果如图
参考链接
本例源代码
本地下载:点击这里
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。
# docker
# 搭建spark集群
# spark
# 集群
# docker搭建spark
# 如何使用 Docker 部署 Spark 集群
# Docker-Compose搭建Spark集群的实现方法
# 使用 Docker 部署 Apache Spark 
# 镜像
# 的是
# 本例
# 本地下载
# 点击这里
# 可以直接
# 可选
# 如图
# 管理器
# 这篇文章
# 谢谢大家
# 相对于
# 准备工作
# 可以下载
# 源代码
# 迭代
# 文件服务器
# 如上图
# 为方便
# 架构图
相关文章:
建站之星安装后如何配置SEO及设计样式?
,怎么在广州志愿者网站注册?
大连网站制作费用,大连新青年网站,五年四班里的视频怎样下载啊?
如何在阿里云服务器自主搭建网站?
建站之星后台密码遗忘?如何快速找回?
百度网页制作网站有哪些,谁能告诉我百度网站是怎么联系?
Swift中循环语句中的转移语句 break 和 continue
网站制作公司排行榜,抖音怎样做个人官方网站
网站制作免费,什么网站能看正片电影?
如何快速查询域名建站关键信息?
如何在建站主机中优化服务器配置?
如何做静态网页,sublimetext3.0制作静态网页?
Android滚轮选择时间控件使用详解
如何在建站之星网店版论坛获取技术支持?
html制作网站的步骤有哪些,iapp如何添加网页?
建站之星伪静态规则如何正确配置?
动图在线制作网站有哪些,滑动动图图集怎么做?
制作网站的网址是什么,请问后缀为.com和.com.cn还有.cn的这三种网站是分别是什么类型的网站?
深入理解Android中的xmlns:tools属性
详解免费开源的DotNet二维码操作组件ThoughtWorks.QRCode(.NET组件介绍之四)
建站之星后台搭建步骤解析:模板选择与产品管理实操指南
网站制作大概多少钱一个,做一个平台网站大概多少钱?
山东网站制作公司有哪些,山东大源集团官网?
已有域名能否直接搭建网站?
linux top下的 minerd 木马清除方法
完全自定义免费建站平台:主题模板在线生成一站式服务
如何规划企业建站流程的关键步骤?
实惠建站价格推荐:2025年高性价比自助建站套餐解析
油猴 教程,油猴搜脚本为什么会网页无法显示?
子杰智能建站系统|零代码开发与AI生成SEO优化指南
标准网站视频模板制作软件,现在有哪个网站的视频编辑素材最齐全的,背景音乐、音效等?
潍坊网站制作公司有哪些,潍坊哪家招聘网站好?
C#怎么使用委托和事件 C# delegate与event编程方法
昆明网站制作哪家好,昆明公租房申请网上登录入口?
如何快速搭建支持数据库操作的智能建站平台?
广东专业制作网站有哪些,广东省能源集团有限公司官网?
建站之星CMS建站配置指南:模板选择与SEO优化技巧
如何快速生成高效建站系统源代码?
SAX解析器是什么,它与DOM在处理大型XML文件时有何不同?
如何自己制作一个网站链接,如何制作一个企业网站,建设网站的基本步骤有哪些?
建站ABC备案流程中有哪些关键注意事项?
Swift中swift中的switch 语句
济南网站制作的价格,历城一职专官方网站?
建站之星如何配置系统实现高效建站?
如何通过老薛主机一键快速建站?
如何设置并定期更换建站之星安全管理员密码?
如何选购建站域名与空间?自助平台全解析
已有域名和空间如何快速搭建网站?
魔方云NAT建站如何实现端口转发?
简历在线制作网站免费,免费下载个人简历的网站是哪些?
*请认真填写需求信息,我们会在24小时内与您取得联系。