.

ApachePyFlink核心技术揭秘

皮肤病治疗 http://pf.39.net/bdfyy/bdfyw/160303/4779923.html

今天我们有4个部分的内容分享,首先我们快速了解一下PyFlink的使命愿景,然后重点介绍PyFlink的核心技术点,最后是和大家快速介绍PyFlink的未来规划和现有的应用案例。那么我们开始今天的第一部分,PyFlink的使命愿景。

首先,ApacheFlink是一个有状态的分布式流式计算框架。可以作用在有限和无限的数据集合之上。

那么业界对有限和无限数据集合上进行流式计算处理,有2种典型的架构,一个是Micro-Batching的模式,也就是将流看成是批的特例。那么另一种就是ApacheFlink的架构模式,纯流的架构模式,将批看成是流的特例。纯流的设计将计算的延时做到了极致。

那么Flink这种分布式亚秒级延时的能力如何暴露给用户呢?Flink提供了SQL,DataStream和ProcessFunction多层API供用户选择,但是非常遗憾的是只能提供给Java用户群体。

那么,如果将Flink的能力进行放大,面向更多的用户群体将是一件非常有意义的事情,那么如何在在Flink上进行多语言的支持呢?增加哪些语言的支持呢?

我们在进行PyFlink的工作之前进行了一些调研,我们发现Python语言在年的活跃程度超过了Java语言,并且是一个持续上升的趋势。

那么我们再进一步了解,为什么Python语言如此备受


转载请注明:http://www.abachildren.com/hbyx/3782.html

  • 上一篇文章:
  • 下一篇文章: 没有了