程序员开发实例大全宝库

网站首页 > 编程文章 正文

2018尚硅谷大数据技术之Flume(尚硅谷大数据教程)

zazugpt 2024-11-07 13:34:21 编程文章 13 ℃ 0 评论

Flume是一种分布式,可靠和可用的服务,用于高效收集,聚合和移动大量日志数据。 它具有基于流数据流的简单灵活的架构。 它具有可靠的可靠性机制和许多故障转移和恢复机制的强大和容错能力。 它使用一个简单的可扩展数据模型,允许在线分析应用程序。

Flume是Cloudera公司开发的用于实时收集服务器(apache/ngnix等)日志数据的框架,Flume很多时候和storm以及spark streaming等流式处理框架结合使用。

Flume优势列举:

1. Flume可以将应用产生的数据存储到任何集中存储器中,比如HDFS,HBase

2. 当收集数据的速度超过将写入数据时,也就是当收集信息遇到峰值时,这时候收集的信息非常大,甚至超过了系统的写入数据能力,这时候,Flume会在数据生产者和数据收容器间做出调整,保证其能够在两者之间提供平稳的数据。

3. 提供上下文路由特征

4. Flume的管道是基于事务,保证了数据在传送和接收时的一致性.

5. Flume是可靠的,容错性高的,可升级的,易管理的,并且可定制的。

Flume学习文档目录:

基于上述优秀特性,尚硅谷教育的老师将Flume的学习要点、常见问题以及项目实战使用技巧融汇为一篇内容详实的文档,秉承让天下没有难学的技术的理念,通过尚硅谷官方微信号(发送“大数据flume”)免费获取本文档。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表