个人笔记：Flink 全面深入研究（一文就够了）

发布时间：2024年01月11日

大数据计算分为离线计算和实时计算，其中离线计算就是我们通常说的批计算，代表技术是Hadoop MapReduce、Hive等；实时计算也被称作流计算，代表技术是Storm、Spark Streaming、Flink等。本文系统地介绍了流式计算的相关知识，并着重介绍了Flink的实现原理细节，便于大家快速地理解和掌握流式计算，并基于Flink完成业务开发。

大家想了解更多大数据相关内容请移驾我的课堂：
大数据相关课程
剖析及实践企业级大数据
数据架构规划设计
大厂架构师知识梳理：剖析及实践数据建模

1、流式计算和批处理

批处理在大数据世界有着悠久的历史。早期的大数据处理基本上是批处理的天下。批处理主要操作大容量的静态数据集，并在计算过程完成之后返回结果。所以批处理面对的数据集通常具有以下特征：

有界：批处理数据集代表数据的有限集合
持久：数据通常存储在可重复获取的持久存储设备中
就绪：数据在计算之前已经就绪，不会发生变化

文章来源:https://blog.csdn.net/gyshun/article/details/135519446
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！