400-650-7353

精品课程

什么是Apache Kafka? Apache Kafka是什么?

发布: 大数据培训 发布时间:2021-08-02 19:03:50

推荐答案
品牌型号:联想 YOGA 14c/系统版本:windows7

Apache Kafka是一个分布式数据流处理平台,可以实时发布、订阅、存储和处理数据流。它设计为处理多种来源的数据流,并将它们交付到多个消费者。简而言之,它可以移动大量数据,不仅是从A点移到B点,而是能从A到Z的多个点移到任何您想要的位置,并且可以同时进行。

Apache Kafka 可以取代传统的企业级消息传递系统。它最初是Linkedin为处理每天1.4万亿条消息而开发的一个内部系统,现已成为应用于各式各样企业需求的开源数据流处理解决方案。

Kafka主要有两类用途:构建能让系统或应用之间可靠地获取数据的实时流数据管道;构建转换或响应流数据的实时流应用

Kafka有四个核心API,分别为:

Producer API:该接口允许应用发布一个流数据到一个或多个topics。

Consumer API:该接口允许应用订阅一个或多个topics然后处理这些topics中的流数据。

Streams API:该接口允许应用作为一个流处理器(stream processor) ,从一个或多个topics 的输入流中消费数据,然后转换并生产数据到一个或多个topics的输出流中。

Connector API:该接口允许构建和运行可重用的生产者(Producer)或者消费者(Consumer),这些生产者或消费者讲Kafka中的topics和现有的应用或者数据系统(如数据库)连接起来。比如一个connector 可以连接到一个关系型数据库从而可以捕捉到数据表中的任何变化,然后进行响应的处理。
 

其它答案
冰阔落2020-06-22 18:56:36

Apache Kafka是一个分布式发布—订阅消息系统和一个强大的队列,可以处理大量的数据,并使你能够将消息从一个端点传递到另一个端点。Kafka适合离线和在线消息消费。Kafka消息保留在磁盘上,并在群集内复制以防止数据丢失。Kafka构建在ZooKeeper同步服务之上。它与Apache Storm和Spark非常好地集成,用于实时流式数据分析。

Kafka 是一个分布式消息队列,具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消息,消费者从队列里取消息进行业务逻辑。一般在架构设计中起到解耦、削峰、异步处理的作用。

中公旗下IT培训品牌

  • 中公教育品牌

     中公教育是一家中国领先的全品类职业教育机构,提供超过100个品类的综合职业就业培训服务。公司在全国超过1000个直营网点展开经营,深度覆盖300多个地级市,并正在快速向数千个县城和高校扩张。

  • 完善就业体系

    通过阶段性授课机制,和每阶段的定期考核,先让学员能够学会所学内容,才能找打合适工作。最后一个阶段为就业课程,从技术和面试两个方面加深就业能力,并且还有不定期的双选会供大家选择。

  • 全程面授+实战技术

    线下课程全程是师资面对面教学,不会存在上课只对着大屏幕上课的情况,有问题都可以在课上得到解答。并且优就业通过自主研发大纲和学习路线,并且定期更新课程所学技术,让大家所学技术不落伍。

中公优就业专业职业规划老师

为您详细答疑解惑,更能领取免费课程

相关问题

更多课程

专业课程老师将第一时间为您解答

立即答疑
修改
优就业:ujiuye

关注中公优就业官方微信

  • 关注微信回复关键词“大礼包”,领80G学习资料