博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark编译的三种方式
阅读量:4549 次
发布时间:2019-06-08

本文共 983 字,大约阅读时间需要 3 分钟。

有三种编译方式,此文采用make-distribution.sh编译

其余两种为maven 和SBT编译

 1.配置jdk 配置maven 配置scala

2.修改spark下make-distribution.sh中的配置  减少下载时间

查看下载地址:http://archive.cloudera.com/cdh5/cdh/5/

hadoop-2.6.0-cdh5.4.0-src.tar.gz
配置nameserver  1.sudo vi /etc/resolv.conf  添加
nameserver 8.8.8.8
nameserver 8.8.4.4
maven 镜像源
    <mirrors>  
        <mirror>  
            <id>alimaven</id>  
            <mirrorOf>central</mirrorOf>  
            <name>aliyun maven</name>  
            <url>http://maven.aliyun.com/nexus/content/groups/public/</url>  
        </mirror>  
      
        <mirror>  
            <id>ui</id>  
            <mirrorOf>central</mirrorOf>  
            <name>Human Readable Name for this Mirror.</name>  
            <url>http://uk.maven.org/maven2/</url>  
        </mirror>  
      
        <mirror>  
            <id>jboss-public-repository-group</id>  
            <mirrorOf>central</mirrorOf>  
            <name>JBoss Public Repository Group</name>  
            <url>http://repository.jboss.org/nexus/content/groups/public</url>  
        </mirror>  
    </mirrors>  
编译命令
./make-distribution.sh  --tgz -Pyarn -Phadoop-2.4 -Dhadoop.version=2.6.0-cdh5.4.0 -Phive-0.13.1 -Phive-thriftserver

 

转载于:https://www.cnblogs.com/gyadmin/p/8266924.html

你可能感兴趣的文章
Eclipse修改已存在的SVN地址
查看>>
C++ ACM基础
查看>>
(转)使用 python Matplotlib 库绘图
查看>>
进程/线程切换原则
查看>>
正则表达式语法
查看>>
20165301 2017-2018-2 《Java程序设计》第四周学习总结
查看>>
Vue的简单入门
查看>>
使用最快的方法计算2的16次方是多少?
查看>>
urllib 中的异常处理
查看>>
【SQL Server高可用性】高可用性概述
查看>>
通过SQL Server的扩展事件来跟踪SQL语句在运行时,时间都消耗到哪儿了?
查看>>
SQL优化:重新编译存储过程和表
查看>>
PCB“有铅”工艺将何去何从?
查看>>
Solr环境搭建
查看>>
ASP.NET的URL过滤
查看>>
自己写的Web服务器
查看>>
自定义定时组件
查看>>
2-素数打比表
查看>>
性能测试
查看>>
浅谈 Python 的 with 语句
查看>>