`
BigCat2013
  • 浏览: 52695 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Apache Kafka 集群环境搭建

阅读更多

Apache Kafka 是一个高吞吐量分布式消息系统,由LinkedIn开源。引用官网对kafka的介绍:“Apache Kafka is publish-subscribe messaging rethought as a distributed commit log.”  “publish-subscribe”是kafka设计的核心思想,也是kafka最具特色的地方。publish在kakfa中是一个producer的角色,subscribe是consumer,就像我们生活中的一样,生产商生产出来的产品,消费者一般不能够直接去工厂购买,还需要一个代理经销商,所以同样的在kafka的生态系统中,有一个broker的角色。所以kafka的生态系统大致可以表述如下:

"producer——>broker<——consumer"

大致的介绍就这么多,具体的大家可以移步官网:http://kafka.apache.org/ 

接下来是老生常谈的问题:为什么要用kafka?kafka适用什么样的场景?我先和大家分享一下自己再项目中的使用总结,有其他想法的同学欢迎补充:

 使用kafka的理由:

1.分布式,高吞吐量,速度快(kafka是直接通过磁盘存储,线性读写,速度快:避免了数据在JVM内存和系统内存之间的复制,减少耗性能的对象创建和垃圾回收)

2.同时支持实时和离线两种解决方案(相信很多项目都有类似的需求,这也是Linkedin的官方架构,我们是一部分数据通过storm做实时计算处理,一部分到hadoop做离线分析)。

3.open source (open source 谁不喜欢呢)

4.源码由scala编写,可以运行在JVM上(笔者对scala很有好感,函数式语言一直都挺帅的,spark也是由scala写的,看来以后有空得刷刷scala)

使用场景:

笔者主要是用来做日志分析系统,其实Linkedin也是这么用的,可能是因为kafka对可靠性要求不是特别高,除了日志,网站的一些浏览数据应该也适用。(只要原始数据不需要直接存DB的都可以)

 

下面就简单的介绍一下kafka集群的搭建过程:

 

准备环境:至少3台的linux server(笔者是准备了5台redhat版本的cloud server)

 

第一步: 安装JDK/JRE

第二步: 安装Zookeeper(kafka自带有zookeeper服务,但是建议大家最好单独建立一个zookeeper集群,可以和其他应用共享,也便于管理)

zookeeper的安装,大家可以参考我的另一篇博文:http://bigcat2013.iteye.com/blog/2175538

第三步:下载kafka :http://kafka.apache.org/downloads.html(最好下载scala预编译好的package,例如我下的是kafka_2.10-0.8.1.1.tgz,意思就是用scala 2.10预编译好的0.8.1.1版本)

第四步:上传安装包到服务器(可以通过WinSCP等)

第五步:使用 "tar -xzvf  kafka_2.10-0.8.1.1.tgz "来 解压安装包 :

解压后的目录结构:


 第六步:修改配置文件

简答配置的话修改/config/server.properties 就可以了

需要配置的属性有:broker.id(标示当前server在集群中的id,从0开始),port,host.name(当前的server host name),zookeeper.connect(连接的zookeeper集群),log.dirs(log的存储目录,记得对应的去建立这个目录)等,其他的一些配置可以看相应的注释:


 

 

 第七步:通过“scp -r ”把配置好的kafka目录copy到其他几台server上:


 

第八步:修改每台server对应的配置文件,主要是修改其中的broker.id 和 host.name 属性:

broker.id从0开始递增,每台server必须唯一

 

第九步: 先启动zookeeper集群,再启动kakfa集群

kafka启动命令: sudo nohup ./bin/kafka-server-start.sh config/server.properties &

 

第十步:集群启动成功后,可以试着创建topic,在一台server上创建producer,另外一台创建consumer,从producer上发送信息,看consumer是否能接收到,以验证集群对否成功。

 创建topic :  sudo ./bin/kafka-topics.sh -zookeeper server1:2181,server2:2181,server3:2181 -topic test -replication-factor 2 -partitions 5 -create

 查看topic:sudo ./bin/kafka-topics.sh -zookeeper server1:2181,server2:2181,server3:2181 -list

 创建producer:sudo ./bin/kafka-console-producer.sh -broker-list kafkaServer1:9092,kafkaServer2:9092,kafkaServer3:9092 -topic test

 创建consumer:sudo ./bin/kafka-console-consumer.sh -zookeeper server1:2181,server2:2181,server3:2181 - from-begining -topic test

 

通过在创建好的producer控制台输入信息,在consumer的控制台检测输出来测试,如果可以同步接受到信息就说明简单的kakfa 集群搭好了,另外可以根据项目的实际需求进一步做配置。

 

 

  • 大小: 83.7 KB
  • 大小: 56.9 KB
  • 大小: 34.4 KB
  • 大小: 124.8 KB
  • 大小: 57 KB
1
3
分享到:
评论
2 楼 BigCat2013 2015-01-19  
string2020 写道
上面写的使用场景太抽象了,求其他的使用场景

比如您有什么样的需求?我可以帮您分析分析
1 楼 string2020 2015-01-16  
上面写的使用场景太抽象了,求其他的使用场景

相关推荐

    Apache Kafka实战.pdf--有新特性的介绍-强烈推荐

    第3章详细介绍了Kafka集群环境的搭建;第4、5章深入探讨了Kafka客户端的使用方法;第6章带领读者一览Kafka内部设计原理;第7~9章以实例的方式讲解了Kafka集群的管理、监控与调优;第10章介绍了Kafka新引入的流式处理...

    centos7下Redis哨兵集群和kafka集群和zookeeper集群搭建

    centos7下Redis哨兵集群和kafka集群和zookeeper集群搭建 http://blog.csdn.net/gaowenhui2008/article/details/71516901 https://cwiki.apache.org/confluence/display/KAFKA/Clients

    kafka-ui:用于Apache Kafka管理的开源Web GUI

    Kafka UI – Kafka的免费Web UI Kafka UI是一个免费的开源Web UI,用于监视和管理Apache Kafka集群。 Kafka UI是一个简单的工具,可让您观察到数据流,帮助更快地查找和排除问题并提供最佳性能。 它轻巧的仪表板使您...

    Apache Kafka 企业级消息队列

    Apache Kafka 企业级消息队列的原理、基本架构、搭建 Kafka 集群、操作集群的两种方式、Apache Kafka 原理、消费策略、负载均衡等。

    集群搭建与部署手册,结合实际工作。

    一. Zookeeper集群搭建部署 二. apache-storm集群搭建部署 三. Kafka集群搭建部署 安装部署过程均图文并茂,简单易懂,实际按步骤操作即可。

    hadoop-Apache2.7.3+Spark2.0集群搭建

    该文档主要介绍了hadoop、hive、hbase、kafka、Spark系统集群搭建,有环境准备说明、集群环境各配置文件配置、具体项目实例,可参考

    hadoop集群搭建所需软件包.txt

    hbase-2.1.3-bin.tar.gz,hadoop-3.1.2.tar.gz,hadoop-2.7.4.tar.gz,flink-1.7.2-bin-hadoop27-scala_2.11.tgz,apache-hive-3.1.1-bin.tar.gz,apache-hive-2.3.5-bin.tar.gz,以及一些推荐的集群搭建配置文件,...

    spark环境安装(Hadoop HA+Hbase+phoneix+kafka+flume+zookeeper+spark+scala)

    亲手在Centos7上安装,所用软件列表 apache-flume-1.8.0-bin.tar.gz ...kafka_2.12-1.0.0.tgz scala-2.12.4.tar.gz scala-2.12.4.tgz spark-2.2.0-bin-hadoop2.7.tgz spark-2.2.0.tgz zookeeper-3.4.11.tar.gz

    Kafka原理、集群、监控企业实战

    本课程详细讲解原理,以及集群搭建,使用Python/Java操作Kafka、并采用Prometheus监控Kafka,结合Grafana绘制出Kafka的监控大盘。 之前有报名过 《ELK/ELFK企业PB级日志系统实战》的同学建议学习本门课程 温馨提示...

    kafaka集群搭建

    kafaka集群搭建 1、JDK可以使用Centos7自带的JDK 2、准备安装包 官网下载地址:http://kafka.apache.org/downloads.html

    搭建Hadoop集群所需的tar包.zip

    由于资源大小限制,本资源只包含hadoop+hbase+kafka+zookeeper+apache-flume,本资源用来实践尚硅谷教程的《电信客服》项目是够用的,个人实践有效

    flink-1.13.1-bin-scala-2.11以及hadoop连接器、kafka连接器

    官网下载太慢!flink集群搭建 包括: 1.flink-1.13.1-bin-scala-2.11 2.hadoop连接器jar包flink-shaded-hadoop-2-uber-2.7.5-10.0 3.kafka连接器jar包flink-connector-kafka_2.11-1.13.1

    hadoop集群搭建所需软件(linux下的文件.zip)

    apache-hive-2.1.1-bin.tar(1).gz、eclipse-jee-indigo-SR2-linux-gtk.tar.gz、hadoop-2.7.5.tar.gz、hbase-1.2.4-bin.tar.gz、jdk-8u111-linux-x64.tar.gz、kafka_2.11-0.10.0.0.tgz、mysql-5.6.21.tar.gz、...

    centos7.5分布式平台搭建.docx

    11.11. Ambari集群搭建(所有agent节点机器操作) 38 11.11.1. 安装agent 38 11.11.2. 部署Agent 39 11.11.3. 创建集群: 39 11.11.4. 存储库地址配置: 40 11.11.5. 节点配置: 40 11.11.6. 节点验证: 41 11.11.7....

    Java思维导图xmind文件+导出图片

    Kafka基于Zookeeper搭建高可用集群实战 kafka消息处理过程剖析 Java客户端实现Kafka生产者与消费者实例 kafka的副本机制及选举原理剖析 基于kafka实现应用日志实时上报统计分析 RabbitMQ 初步认识RabbitMQ及...

    MQ之ActiveMQ.mmap

    自己做的尚硅谷周阳老师ActiveMQ课程脑图,其中自己所用做案例的环境搭建都是基于docker与老师课程不一样。脑图内容涵盖视频的99%的笔记,含有自己编写的代码文件,外加了自己对一些问题的测试与回答。 消息中间件...

    基于海量数据的消息队列的性能对比与优化方案 (2016年)

    在各大技术公司的团队中,使用最频繁的三种消息队列分别是:Apache Kafka,阿里巴巴的 Rocket-MQ,Rabbit-MQ。本文首先先介绍了上述三个分布式消息队列的基本概念、架构特性以及实现原理,基于这些然后分别简单介绍它们的...

    【推荐】最强大数据学习与最佳实践资料合集(基础+架构+数仓+治理+案例)(100份).zip

    Hadoop开源相关,Flink,Kylin等集群搭建2021 KylinCloud+Hudi实践 三、数仓篇 传统数仓与大数据数仓区别 模板-事实表梳理 模板-维度梳理 模板-业务梳理 模板-指标体系梳理 模板1-数据仓库项目计划 模板2-命名规范 ...

    【重磅】史上最全的阿里云分享的云原生技术学习资料合集(120份).zip

    基于 DLedger 构建高可用的 Apache RocketMQ 集群 基于 RocketMQ + Knative 驱动云原生 Serverless 应用 基于 RocketMQ Prometheus Exporter 打造定制化 DevOps 平台 快速交付云原生应用的 3 种发布策略详解 流量太...

Global site tag (gtag.js) - Google Analytics