在线学习平台

QQ登录

微信登录

没有账号？扫码注册

在线学习平台

QQ注册

微信注册

« 返回已有账号？去登录

在线学习平台

微信扫码登录

Spark 快速入门 Spark 编程指南引入 Spark 初始化 Spark Spark 共享变量

Spark 快速上手

Spark 独立应用程序 Spark Shell Spark 运行程序 Spark RDDs Spark 并行集合 Spark 外部数据集 Spark RDD 操作 Spark RDD持久化 Spark Streaming Spark Streaming示例

Spark 基本概念

Spark Streaming关联初始化StreamingContext Spark Streaming离散流 Spark 输入DStreams Spark DStream中的转换 Spark DStream的输出操作 Spark DStreams缓存或持久化 Spark Streaming Checkpointing Spark Streaming部署应用程序 Spark Streaming监控应用程序 Spark Streaming性能调优 Spark Streaming优化执行时间 Spark Streaming批容量 Spark Streaming内存调优 Spark Streaming容错语义 Spark SQL Spark SQL开始 Spark SQL性能调优 Spark SQL其他接口编写语言集成相关查询 Spark SQL数据类型 Spark SQL数据源 Spark SQL RDDs Spark SQL parquet文件 Spark SQL JSON数据集 Spark SQL Hive表 Spark GraphX编程指南 Spark GraphX开始 Spark GraphX图算法 Spark GraphX例子 Spark GraphX提交应用程序 Spark 独立运行 Spark 在yarn上运行 Spark GraphX属性图 Spark 配置 Spark GraphX图操作符 Spark GraphX Pregel API Spark GraphX图构造者 Spark GraphX顶点和边RDDs

Spark 共享变量 >

初始化 Spark

初始化 Spark

Spark 编程的第一步是需要创建一个 SparkContext 对象，用来告诉 Spark 如何访问集群。在创建 SparkContext 之前，你需要构建一个 SparkConf 对象， SparkConf 对象包含了一些你应用程序的信息。

val conf = new SparkConf().setAppName(appName).setMaster(master)
new SparkContext(conf)

appName 参数是你程序的名字，它会显示在 cluster UI 上。master 是 Spark, Mesos 或 YARN 集群的 URL，或运行在本地模式时，使用专用字符串 “local”。在实践中，当应用程序运行在一个集群上时，你并不想要把 master 硬编码到你的程序中，你可以用 spark-submit 启动你的应用程序的时候传递它。然而，你可以在本地测试和单元测试中使用 “local” 运行 Spark 进程。

使用 Shell

在 Spark shell 中，有一个专有的 SparkContext 已经为你创建好。在变量中叫做 sc。你自己创建的 SparkContext 将无法工作。可以用 --master 参数来设置 SparkContext 要连接的集群，用 --jars 来设置需要添加到 classpath 中的 JAR 包，如果有多个 JAR 包使用逗号分割符连接它们。例如：在一个拥有 4 核的环境上运行 bin/spark-shell，使用：

$ ./bin/spark-shell --master local[4]

或在 classpath 中添加 code.jar，使用：

$ ./bin/spark-shell --master local[4] --jars code.jar

执行 spark-shell --help 获取完整的选项列表。在这之后，调用 spark-shell 会比 spark-submit 脚本更为普遍。

Spark 共享变量 >

分类导航

关注微信下载离线手册

bootwiki移动版

bootwiki

(群号：472910771)

jQuery教程 | Photoshop教程 | Word教程 | PPT教程 | Sketch草图大师 | Maya教程 | 易语言教程 | CorelDraw教程 | ASP.NET | Redis数据库 | IntelliJ IDEA教程 | PyCharm | Linux自学 | Matlab教程 | 菜鸟教程