“Kafka介绍”的版本间的差异

2022年8月15日 (一) 13:19的版本

Kafka 是最初由领英（Linkedin）公司开发，是一个分布式、支持分区的（partition）、多副本的(replica)，基于 ZooKeeper 协调的分布式消息系统，它的最大的特性就是可以实时的处理大量数据以满足各种需求场景：

比如基于 hadoop 的批处理系统、低延迟的实时系统、Storm/Spark流式处理引擎，web/nginx日志、访问日志，消息服务等等，用 scala 语言编写，LinkedIn 于2010年贡献给了 Apache 基金会并成为顶级开源项目。

日志收集：一个公司可以用 Kafka 收集各种服务的 log，通过 Kafka 以统一接囗服务的方式开放给各种 consumer，例如 hadoop、Hbase、Solr等。

消息系统：解耦和生产者和消费者、缓存消息等。

用户活动跟踪：Kafka 经常被用来记录 Web 用户或者 app 用户的各种活动，如浏览网页、搜索、点击等活动，这些活动信息被各个服务器发布到 Kafka 的 topic 中，然后订阅者通过订阅这些 topic 来做实时的监控分析，或者装载到hadoop、数据仓库中做离线分析和挖掘。

运营指标：Kafka 也经常用来记录运营监控数据。包括收集各种分布式应用的数据，生产各种操作的集中反馈，比如报警和报告。

@@ 第2行： / 第2行： @@
 比如基于 hadoop 的批处理系统、低延迟的实时系统、Storm/Spark流式处理引擎，web/nginx日志、访问日志，消息服务等等，用 scala 语言编写，LinkedIn 于2010年贡献给了 Apache 基金会并成为顶级开源项目。
+=== Kafka 的使用场景 ===
+日志收集：一个公司可以用 Kafka 收集各种服务的 log，通过 Kafka 以统一接囗服务的方式开放给各种 consumer，例如 hadoop、Hbase、Solr等。
+消息系统：解耦和生产者和消费者、缓存消息等。
+用户活动跟踪：Kafka 经常被用来记录 Web 用户或者 app 用户的各种活动，如浏览网页、搜索、点击等活动，这些活动信息被各个服务器发布到 Kafka 的 topic 中，然后订阅者通过订阅这些 topic 来做实时的监控分析，或者装载到hadoop、数据仓库中做离线分析和挖掘。
+运营指标：Kafka 也经常用来记录运营监控数据。包括收集各种分布式应用的数据，生产各种操作的集中反馈，比如报警和报告。