flume和logstash区别tank的区别

冬奥会 | 林黛玉 | 供暖 | 混凝土 | 服装面料 | exo | 人口 | 坐月子 | 国家队 | 牙齿美白 | 玄幻小说 | 美杜莎 | 家庭 | 金平区 | 牙齿矫正 | 伊宁市 | 滦州市 | 男士护肤 | 法国 | 大城市 | 威士忌 | 梦想改造家 | 旅游推荐 | 孙悟空 | 机箱 | 周易 | 武术 | ISIS（伊斯兰国） | 艺考 | 骊威 | 温州市 | 易经 | 单片机 | 运动损伤 | 大白菜 | 爽肤水 | 电路设计 | 米酒 | 城市 | 韩国旅游 | 杭州生活 | 新风系统 | 机动车辆保险 | 戚继光 | 唇膏 | 寺庙 | 政府 | 貂蝉 | 咖啡馆 | 葫芦 | 动画制作 | 巴中市 | 美术生 | 房贷 | 意大利 | 暑假 | 香港购物 | 五粮液 | 台风 | 酱油 | 展会 | 名言 | 第三者 | 高三 | 徽州区 | 烹饪学校 | 三菱商事 | 梵蒂冈 | 红木艺术 | 螃蟹 | 自行车选购 | 内黄县 | 成都美食 | 果酒 | 少儿英语 | 酸奶 | 呼和浩特市 | 糕点 | 昌平区 | 宝洁（P&G） | 天气 | 任天堂 | 赛欧 | 火影忍者 | 英国 | 卫生间 | 葡萄 | 双色球 | 印度 | 赋 | 宇宙 | 智商 | 李白 | 延安市 | 合生元 | 洗面奶 | 青年旅舍 | 商标 | 西藏大学 | 抽脂 | 网盘 | 电梯 | 岳阳县 | 歌词 | 旅游线路 | 案件 | 卡通 | 卡地亚（Cartier） | 长春市 | 大红袍 | 少数民族 | 韭菜 | 通辽市 | 西点 | 铜陵市 | 魏无羡 | 食品 | 精酿啤酒 | 乾隆 | 肺炎 | 鲤鱼 | 显示器 | 论文写作 | 婴儿喂养 | 紫檀 | 牛初乳 | 郭德纲 | 老挝 | 中学 | 孝感市 | 嘉兴市 | 进贤县 | 祛痘印 | 鸭绿江 | 前端开发 | 中国教育 | 卫生巾 | 科幻 | 兰蔻（lancome） | 潮牌 | 视频剪辑 | 诛仙 | 余杭区 | 趣味 | 本田（honda） | 福州市 | 酱料 | 礼仪 | 纪录片 | 专升本 | 雪碧 | 写字楼 | 宜昌市 | 辣条 | gucci | 美容化妆 | 身材 | 泾川县 | 亲情 | 菠萝 | 安庆市 | 三国人物 | 朋友关系 | 恋爱心理 | 家装 | 新泰市 | logo设计 | 中国银行 | 大三学生 | 鱼丸 | 方便面 | 机车 | 红木家具 | 咖啡机 | 骨折 | 雅马哈 | 大城县 | 化妆技巧 | 海蛇 | 王建国 | 吸尘器 | 大学生创业 | 埇桥区 | 星座（占星） | 德国 | 陶瓷 | 城市生活 | 姓氏 | 孩子 | 肖战 | 电压 | 糖尿病 | 文景之治 | 江门市 | 铜仁市 | 果冻 | 海西蒙古族藏族自治州 | 狗粮 | 庐山 | 黑暗料理 |

你的位置：网站首页 >> 频道首页 >>tank >>flume和logstash区别tank的区别

flume和logstash区别tank的区别

来源：蜘蛛抓取(WebSpider) 时间：2018-11-20 12:53 标签：

随着大数据越来越被重视数据采集的挑战变的尤为突出。今天为大家介绍几款数据采集平台：

任何完整的大数据平台一般包括以下的几个过程：

数据采集-->数据存储-->数據处理-->数据展现(可视化，报表和监控)

其中数据采集是所有数据系统必不可少的，随着大数据越来越被重视数据采集的挑战也变的尤为突出。这其中包括：

如何保证数据采集的可靠性的性能

我们今天就来看看当前可用的六款数据采集的产品重点关注它们是如何做到高可靠，高性能和高扩展

Logstash的部署架构如下图，当然这只是一种部署的选项

几乎在大部分的情况下ELK作为一个栈是被同时使用的。所有当你的數据系统使用ElasticSearch的情况下logstash是首选。

Scribe是Facebook开发的数据(日志)收集系统已经多年不维护，同样的就不多说了。

以上的所有系统都是开源的在商业化的大数据平台产品中，Splunk提供完整的数据采金数据存储，数据分析和处理以及数据展现的能力。

Splunk是一个分布式的机器数据平台主要有三个角色：

Search Head负责数据的搜索和处理，提供搜索时的信息抽取
Indexer负责数据的存储和索引
Forwarder，负责数据的收集清洗，变形并发送给Indexer

Splunk内置了对Syslog，TCP/UDPSpooling的支持，同时用户可以通过开发 Input和Modular Input的方式来获取特定的数据。在Splunk提供的软件仓库里有很多成熟的数据采集应用例如AWS，数据庫(DBConnect)等等可以方便的从云或者是数据库中获取数据进入Splunk的数据平台做分析。

这里要注意的是Search Head和Indexer都支持Cluster的配置，也就是高可用高扩展的，但是Splunk现在还没有针对Farwarder的Cluster的功能也就是说如果有一台Farwarder的机器出了故障，数据收集也会随之中断并不能把正在运行的数据采集任务Failover到其咜的 Farwarder上。

我们简单讨论了几种流行的数据收集平台它们大都提供高可靠和高扩展的数据收集。大多平台都抽象出了输入输出和中间的緩冲的架构。利用分布式的网络连接大多数平台都能实现一定程度的扩展性和高可靠性。

其中FlumeFluentd是两个被使用较多的产品。如果你用ElasticSearchLogstash吔许是首选，因为ELK栈提供了很好的集成Chukwa和Scribe由于项目的不活跃，不推荐使用

Splunk作为一个优秀的商业产品，它的数据采集还存在一定的限制相信Splunk很快会开发出更好的数据收集的解决方案。

flume和logstash区别tank的区别

我要回帖

随机推荐