拓扑会通过 Nimbus 分发给 supervisor, 那么 Nimbus 内部是怎么操作的?
这里以本地模式为例, 对拓扑的提交过程做一个分析.
参考资料:
理解storm拓扑并行度
疑问:
- 在zk上建立task信息,这些信息是用来做什么的?
- notifyTopologyActionListener 做了什么?
启动
TODO …
命令的入口
所有命令的入口, 都是由 ServiceHandler 实现的, com.alibaba.jstorm.daemon.nimbus.ServiceHandler#submitTopologyWithOpts.
配置校验
判断拓扑是否已存在/重名/重复提交
标准化conifg
标准化topology (finalize component’s task parallism)
校验topology结构
- 校验 bolt/spout 的id 和 name
- 校验 bolt 的输入是否为空
拷贝代码二进制文件到集群
在zk上建立task信息 (supervisor会持续监控保存在zk的任务)
- 为bolt/spout等创建对应的 TaskInfo (多并行度的bolt/spout会创建出多个TaskInfo)
com.alibaba.jstorm.cluster.Common#mkTaskMaker - 注意, jstorm 的 setNumTasks 其实是无效的, 只有 paralleism 并行度会起作用.(见 jstorm作者之一cody的回答: https://stackoverflow.com/a/34316700/6275014 )
- 为bolt/spout等创建对应的 TaskInfo (多并行度的bolt/spout会创建出多个TaskInfo)
StartTopologyEvent.pushEvent,
- 然后会异步地去执行 com.alibaba.jstorm.daemon.nimbus.TopologyAssign#mkAssignment
- com.alibaba.jstorm.schedule.default_assign.TaskScheduler#assign:
将task分配给worker, 在这里做了一些定制化, 如有的task要求分配在不同的worker上等. - 创建好 Assign 后, 会发布到 zk 上.
- com.alibaba.jstorm.schedule.default_assign.TaskScheduler#assign:
- 然后会异步地去执行 com.alibaba.jstorm.daemon.nimbus.TopologyAssign#mkAssignment
notifyTopologyActionListener