Flink-分布式的冯诺伊曼机器
什么是“流数据”?
究其本质,是对数据在“时间”维度的管理。而什么又是“有状态计算”?再究其本质,是对数据在“空间”维度的管理。一个“时间”,一个“空间”,足以让Flink框架解决“流”计算过程中的所有问题。
那Flink针对于流计算中的这两种复杂性,分别做了怎样的设计呢?
针对流数据“时间”维度方面的管理,Flink 的 DataStream 与提供了窗口管理相关的 API,包括 Window 和 WindowAll。其中 Window 是针对KeyedStream,而 WindowAll 是针对非 KeyedStream。
觉得不错,请点个在看呀