×

Samza 入门

Samza 你好Samza 下载Samza 功能预览

Samza 详细介绍

Samza 背景Samza 概念Samza 结构

Samza 与其他流处理项目比较

Samza 比较介绍Samza MUPD8Samza 与 StormSamza 与 Spark Streaming

Samza API

Samza API概述

Samza 核心

Samza ContainerSamza 流Samza 序列化Samza 定期检查Samza 状态管理Samza 窗口功能Samza 协调器流Samza 事件循环Samza 指标Samza JMX

Samza 作业部署

Samza JobRunnerSamza 配置Samza 打包Samza YARN工作Samza 记录Samza 再处理Samza Web UI和REST APISamza 分离框架和作业部署

Samza YARN

Samza Application MasterSamza YARN执行隔离Samza 主机关联和 YARNSamza YARN资源本地化Samza YARN安全Samza 写入HDFSSamza 从HDFS文件读取

Samza 相关操作

Samza 安全Samza Kafka自动创建主题

Samza REST服务

Samza REST服务概观Samza REST服务资源Samza REST服务监视器

Samza 附录

附录一 工作资源附录二 任务资源附录三 远程调试附录四 从HDFS部署Samza工作附录五 部署Samza Job到CDH附录六 在多节点YARN中运行附录七 在没有联网的情况下运行附录八 Samza REST入门附录九 Async API和多线程指南附录十 代码附录十一 Samza配置参考

Samza YARN工作


当您在您的工作配置中定义 job.factory.class = org.apache.samza.job.yarn.YarnJobFactory 时,Samza 将使用 YARN 来执行您的工作。YarnJobFactory 将使用HADOOP_YARN_HOMErun-job.sh 执行的机器上的环境变量来获取适当的 YARN 配置,这将定义 YARN 资源管理器的位置。YarnJob 将与资源管理器一起工作,使您的工作在 YARN 群集上启动。

如果您想使用 YARN 来运行 Samza 工作,您还需要定义 Samza 工作包的位置。

例如,你可能会说:

yarn.package.path=http://my.http.server/jobs/ingraphs-package-0.0.55.tgz

此 .tgz 文件遵循 Packaging 页面上概述的约定(它具有 bin / run-am.sh 和 bin / run-container.sh)。YARN NodeManagers 将负责将该 .tgz 文件下载到相应的计算机上,并将其解压缩。从那里,YARN 将为 Samza 应用主程序和 SamzaContainer 分别执行 run -am.sh 或 run-container.sh。

如果要在特定 YARN 队列中运行 Samza 作业,而不是默认队列,则可以在作业的配置中设置 yarn.queue 的属性。

例如,使用以下属性设置:

yarn.queue=root.adhoc

Samza 作业将在 root.adhoc 队列中运行。


分类导航

关注微信下载离线手册

bootwiki移动版 bootwiki
(群号:472910771)