【每日一题】介绍一下Spark SQL解析过程?
问题分析
核心问题回答
-
Analysis:主要利用 Catalog 信息将 Unresolved Logical Plan 解析成 Analyzed logical plan -
Logical Optimizations:利用一些 Rule (规则)将 Analyzed logical plan 解析成 Optimized Logical Plan -
Physical Planning:前面的 logical plan 不能被 Spark 执行,而这个过程是把 logical plan 转换成多个物理执行计划 -
physical plans:在多个执行计划中选择最佳的 physical plan -
Code Generation:这个过程会把 SQL 查询生成 Java 字节码