homework-jianmu/08-kafka.md at e5fe2d33a4152ea243f1a7cc3b51bdf71c82ce3f

5.7 KiB

Raw Blame History

title	sidebar_label
Kafka	Kafka

本节讲述如何通过 Explorer 界面创建数据迁移任务, 从 Kafka 迁移数据到当前 TDengine 集群。

功能概述

Apache Kafka 是一个用于流处理、实时数据管道和大规模数据集成的开源分布式流系统。

TDengine 可以高效地从 Kafka 读取数据并将其写入 TDengine，以实现历史数据迁移或实时数据流入库。

创建任务

1. 新增数据源

在数据写入页面中，点击 +新增数据源 按钮，进入新增数据源页面。

2. 配置基本信息

在名称中输入任务名称，如：“test_kafka”；

在类型下拉列表中选择 Kafka。

代理是非必填项，如有需要，可以在下拉框中选择指定的代理，也可以先点击右侧的 +创建新的代理

在 目标数据库 下拉列表中选择一个目标数据库，也可以先点击右侧的 +创建数据库 按钮

3. 配置连接信息

bootstrap-server，例如：192.168.1.92。

服务端口，例如：9092。

多个 broker 地址时，在连接配置右下增加 新增 Broker 按钮，成对增加 bootstrap-server 和服务端口。

4. 配置 SASL 认证机制

如果服务端开启了 SASL 认证机制，此处需要启用 SASL 并配置相关内容，目前支持 PLAIN/SCRAM-SHA-256/GSSAPI 三种认证机制，请按实际情况进行选择。

5. 配置 SSL 证书

如果服务端开启了 SSL 加密认证,此处需要启用 SSL 并配置相关内容。

6. 配置采集信息

在 采集配置 区域填写采集任务相关的配置参数。

在 超时时间 中填写超时时间。当从 Kafka 消费不到任何数据，超过 timeout 后，数据采集任务会退出。默认值是 0 ms。当 timeout 设置为 0 时，会一直等待，直到有数据可用，或者发生错误。

在主题中填写要消费的 Topic 名称。可以配置多个 Topic ， Topic 之间用逗号分隔。例如：tp1,tp2。

在 Client ID 中填写客户端标识，填写后会生成带有 taosx 前缀的客户端 ID （例如，如果填写的标识为 foo，则生成的客户端 ID 为 taosxfoo）。如果打开末尾处的开关，则会把当前任务的任务 ID 拼接到 taosx 之后，输入的标识之前（生成的客户端 ID 形如 taosx100foo）。连接到同一个 Kafka 集群的所有客户端 ID 必须保证唯一。

在 消费者组 ID 中填写消费者组标识，填写后会生成带有 taosx 前缀的消费者组 ID （例如，如果填写的标识为 foo，则生成的消费者组 ID 为 taosxfoo）。如果打开末尾处的开关，则会把当前任务的任务 ID 拼接到 taosx 之后，输入的标识之前（生成的消费者组 ID 形如 taosx100foo）。

在 Offset 的下拉列表中选择从哪个 Offset 开始消费数据。有三个选项：Earliest、Latest、ByTime(ms)。默认值为Earliest。