深入理解Spark：核心思想与源码分析. 3.13　创建DAGSchedulerSource和BlockManagerSource

3.13　创建DAGSchedulerSource和BlockManagerSource

在创建DAGSchedulerSource、BlockManagerSource之前首先调用taskScheduler的post-StartHook方法，其目的是为了等待backend就绪，见代码清单3-53。postStartHook的实现见代码清单3-54。

创建DAGSchedulerSource和BlockManagerSource的过程类似于ExecutorSource，只不过DAGSchedulerSource测量的信息是stage. failedStages、stage. runningStages、stage. waiting-Stages、stage. allJobs、stage. activeJobs，BlockManagerSource测量的信息是memory. maxMem_MB、memory. remainingMem_MB、memory. memUsed_MB、memory.
diskSpace-Used_MB。

代码清单3-53　创建DAGSchedulerSource和BlockManagerSource

taskScheduler.postStartHook()

private val dagSchedulerSource = new
DAGSchedulerSource(this.dagScheduler)

private val blockManagerSource = new
BlockManagerSource(SparkEnv.get.blockManager)

private def initDriverMetrics() {

SparkEnv.get.metricsSystem.registerSource(dagSchedulerSource)

SparkEnv.get.metricsSystem.registerSource(blockManagerSource)

}

initDriverMetrics()

代码清单3-54　postStartHook的实现

override def postStartHook() {

waitBackendReady()

}

private def waitBackendReady(): Unit = {

if (backend.isReady) {

return

}

while (!backend.isReady) {

synchronized {

this.wait(100)

}

时间： 2025-01-23 10:10:43

深入理解Spark：核心思想与源码分析. 3.13　创建DAGSchedulerSource和BlockManagerSource

深入理解Spark：核心思想与源码分析. 3.13　创建DAGSchedulerSource和BlockManagerSource的相关文章

《深入理解Spark:核心思想与源码分析》——3.1节SparkContext概述

《深入理解Spark:核心思想与源码分析》——2.3节Spark基本设计思想

《深入理解Spark:核心思想与源码分析》——第1章环境准备

《深入理解Spark:核心思想与源码分析》——第3章SparkContext的初始化

《深入理解Spark:核心思想与源码分析》——1.4节Spark源码编译与调试

《深入理解Spark:核心思想与源码分析》——1.5节小结

《深入理解Spark:核心思想与源码分析》——2.2节Spark基础知识

《深入理解Spark:核心思想与源码分析》——3.6节创建任务调度器TaskScheduler

《深入理解Spark:核心思想与源码分析》——2.4节Spark基本架构

《深入理解Spark:核心思想与源码分析》——3.7节创建和启动DAGScheduler

深入理解Spark：核心思想与源码分析. 3.13 创建DAGSchedulerSource和BlockManagerSource

深入理解Spark：核心思想与源码分析. 3.13 创建DAGSchedulerSource和BlockManagerSource的相关文章

深入理解Spark：核心思想与源码分析. 3.13　创建DAGSchedulerSource和BlockManagerSource

深入理解Spark：核心思想与源码分析. 3.13　创建DAGSchedulerSource和BlockManagerSource的相关文章