33 KiB
title | sidebar_label | toc_max_heading_level |
---|---|---|
数据订阅 | 数据订阅 | 4 |
import Tabs from "@theme/Tabs"; import TabItem from "@theme/TabItem";
TDengine 提供了类似于消息队列产品的数据订阅和消费接口。在许多场景中,采用 TDengine 的时序大数据平台,无须再集成消息队列产品,从而简化应用程序设计并降低运维成本。本章介绍各语言连接器数据订阅的相关 API 以及使用方法。 数据订阅的基础知识请参考 数据订阅
创建主题
请用 taos shell 或者 参考 执行 SQL 章节用程序执行创建主题的 SQL:CREATE TOPIC IF NOT EXISTS topic_meters AS SELECT ts, current, voltage, phase, groupid, location FROM meters
上述 SQL 将创建一个名为 topic_meters 的订阅。使用该订阅所获取的消息中的每条记录都由此查询语句 SELECT ts, current, voltage, phase, groupid, location FROM meters
所选择的列组成。
注意 在 TDengine 连接器实现中,对于订阅查询,有以下限制。
- 查询语句限制:订阅查询只能使用 select 语句,并不支持其他类型的SQL,如订阅库,订阅超级表(非 select 方式),insert、update 或 delete 等。
- 原始始数据查询:订阅查询只能查询原始数据,而不能查询聚合或计算结果。
- 时间顺序限制:订阅查询只能按照时间正序查询数据。
创建消费者
TDengine 消费者的概念跟 Kafka 类似,消费者通过订阅主题来接收数据流。消费者可以配置多种参数,如连接方式、服务器地址、自动提交 Offset 等以适应不同的数据处理需求。有的语言连接器的消费者还支持自动重连和数据传输压缩等高级功能,以确保数据的高效和稳定接收。
创建参数
创建消费者的参数较多,非常灵活的支持了各种连接类型、 Offset 提交方式、压缩、重连、反序列化等特性。各语言连接器都适用的通用基础配置项如下表所示:
参数名称 | 类型 | 参数说明 | 备注 |
---|---|---|---|
td.connect.ip |
string | 服务端的 IP 地址 | |
td.connect.user |
string | 用户名 | |
td.connect.pass |
string | 密码 | |
td.connect.port |
integer | 服务端的端口号 | |
group.id |
string | 消费组 ID,同一消费组共享消费进度 | 必填项。最大长度:192。 每个topic最多可建立 100 个 consumer group |
client.id |
string | 客户端 ID | 最大长度:192 |
auto.offset.reset |
enum | 消费组订阅的初始位置 | earliest : default(version < 3.2.0.0);从头开始订阅; latest : default(version >= 3.2.0.0);仅从最新数据开始订阅; none : 没有提交的 offset 无法订阅 |
enable.auto.commit |
boolean | 是否启用消费位点自动提交,true: 自动提交,客户端应用无需commit;false:客户端应用需要自行commit | 默认值为 true |
auto.commit.interval.ms |
integer | 消费记录自动提交消费位点时间间隔,单位为毫秒 | 默认值为 5000 |
msg.with.table.name |
boolean | 是否允许从消息中解析表名, 不适用于列订阅(列订阅时可将 tbname 作为列写入 subquery 语句)(从3.2.0.0版本该参数废弃,恒为true) | 默认关闭 |
enable.replay |
boolean | 是否开启数据回放功能 | 默认关闭 |
session.timeout.ms |
integer | consumer 心跳丢失后超时时间,超时后会触发 rebalance 逻辑,成功后该 consumer 会被删除(从3.3.3.0版本开始支持) | 默认值为 12000,取值范围 [6000, 1800000] |
max.poll.interval.ms |
integer | consumer poll 拉取数据间隔的最长时间,超过该时间,会认为该 consumer 离线,触发rebalance 逻辑,成功后该 consumer 会被删除(从3.3.3.0版本开始支持) | 默认值为 300000,[1000,INT32_MAX] |
下面是各语言连接器创建参数:
Java 连接器创建消费者的参数为 Properties, 可以设置的参数列表请参考 消费者参数
其他参数请参考上文通用基础配置项。
创建消费者支持属性列表:
ws.url
:WebSocket 连接地址。ws.message.channelLen
:WebSocket 消息通道缓存长度,默认 0。ws.message.timeout
:WebSocket 消息超时时间,默认 5m。ws.message.writeWait
:WebSocket 写入消息超时时间,默认 10s。ws.message.enableCompression
:WebSocket 是否启用压缩,默认 false。ws.autoReconnect
:WebSocket 是否自动重连,默认 false。ws.reconnectIntervalMs
:WebSocket 重连间隔时间毫秒,默认 2000。ws.reconnectRetryCount
:WebSocket 重连重试次数,默认 3。
其他参数见上表。
Rust 连接器创建消费者的参数为 DSN, 可以设置的参数列表请参考 [DSN](../../reference/connector/rust/#dsn) 其他参数请参考上文通用基础配置项。 提供了 `WS_URL` 参数来表示连接到的服务器地址,其他参数同通用基础配置项。 创建消费者支持属性列表:useSSL
:是否使用 SSL 连接,默认为 false。token
:连接 TDengine cloud 的 token。ws.message.enableCompression
:是否启用 WebSocket 压缩,默认为 false。ws.autoReconnect
:是否自动重连,默认为 false。ws.reconnect.retry.count
:重连次数,默认为 3。ws.reconnect.interval.ms
:重连间隔毫秒时间,默认为 2000。
其他参数见上表。
- WebSocket 连接: 因为使用 dsn,不需要 `td.connect.ip`,`td.connect.port`,`td.connect.user` 和 `td.connect.pass` 四个配置项,其余同通用配置项。 - 原生连接: 同通用基础配置项。 不支持WebSocket 连接
介绍各语言连接器使用 WebSocket 连接方式创建消费者。指定连接的服务器地址,设置自动提交,从最新消息开始消费,指定 group.id
和 client.id
等信息。有的语言的连接器还支持反序列化参数。
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:create_consumer}}
{{#include docs/examples/python/tmq_websocket_example.py:create_consumer}}
```go
{{#include docs/examples/go/tmq/ws/main.go:create_consumer}}
```
{{#include docs/examples/rust/restexample/examples/tmq.rs:create_consumer_dsn}}
{{#include docs/examples/rust/restexample/examples/tmq.rs:create_consumer_ac}}
{{#include docs/examples/node/websocketexample/tmq_example.js:create_consumer}}
```csharp
{{#include docs/examples/csharp/wssubscribe/Program.cs:create_consumer}}
```
```c
{{#include docs/examples/c-ws/tmq_demo.c:create_consumer_1}}
```
{{#include docs/examples/c-ws/tmq_demo.c:create_consumer_2}}
调用 build_consumer
函数尝试获取消费者实例 tmq
。成功则打印成功日志,失败则打印失败日志。
不支持
原生连接
介绍各语言连接器使用原生连接方式创建消费者。指定连接的服务器地址,设置自动提交,从最新消息开始消费,指定 group.id
和 client.id
等信息。有的语言的连接器还支持反序列化参数。
{{#include docs/examples/java/src/main/java/com/taos/example/ConsumerLoopFull.java:create_consumer}}
{{#include docs/examples/python/tmq_native.py:create_consumer}}
```go
{{#include docs/examples/go/tmq/native/main.go:create_consumer}}
```
```rust
{{#include docs/examples/rust/nativeexample/examples/tmq.rs:create_consumer_dsn}}
```
{{#include docs/examples/rust/nativeexample/examples/tmq.rs:create_consumer_ac}}
不支持
```csharp
{{#include docs/examples/csharp/subscribe/Program.cs:create_consumer}}
```
{{#include docs/examples/c/tmq_demo.c:create_consumer_1}}
{{#include docs/examples/c/tmq_demo.c:create_consumer_2}}
调用 build_consumer
函数尝试获取消费者实例 tmq
。成功则打印成功日志,失败则打印失败日志。
不支持
订阅消费数据
消费者订阅主题后,可以开始接收并处理这些主题中的消息。订阅消费数据的示例代码如下:
WebSocket 连接
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:poll_data_code_piece}}
subscribe
方法的参数含义为:订阅的主题列表(即名称),支持同时订阅多个主题。poll
每次调用获取一个消息,一个消息中可能包含多个记录。ResultBean
是我们自定义的一个内部类,其字段名和数据类型与列的名称和数据类型一一对应,这样根据value.deserializer
属性对应的反序列化类可以反序列化出ResultBean
类型的对象。
{{#include docs/examples/python/tmq_websocket_example.py:subscribe}}
subscribe
方法的参数含义为:订阅的主题列表(即名称),支持同时订阅多个主题。poll
每次调用获取一个消息,一个消息中可能包含多个记录。records
包含了多个 block 块, 每个块中可能包含多个记录。
{{#include docs/examples/rust/restexample/examples/tmq.rs:consume}}
- 消费者可订阅一个或多个
TOPIC
,一般建议一个消费者只订阅一个TOPIC
。 - TMQ 消息队列是一个 futures::Stream 类型,可以使用相应 API 对每个消息进行消费,并通过
.commit
进行已消费标记。 Record
是我们自定义的一个结构体,其字段名和数据类型与列的名称和数据类型一一对应,这样可以通过serde
反序列化出Record
类型的对象。
{{#include docs/examples/node/websocketexample/tmq_seek_example.js:subscribe}}
```csharp
{{#include docs/examples/csharp/wssubscribe/Program.cs:subscribe}}
```
```c
{{#include docs/examples/c-ws/tmq_demo.c:build_topic_list}}
```
{{#include docs/examples/c-ws/tmq_demo.c:basic_consume_loop}}
{{#include docs/examples/c-ws/tmq_demo.c:msg_process}}
{{#include docs/examples/c-ws/tmq_demo.c:subscribe_3}}
订阅消费数据步骤:
- 调用
ws_build_topic_list
函数创建一个主题列表topic_list
。 - 如果
topic_list
为NULL
,表示创建失败,函数返回-1
。 - 使用
ws_tmq_subscribe
函数订阅tmq
指定的主题列表。如果订阅失败,打印错误信息。 - 销毁主题列表
topic_list
以释放资源。 - 调用
basic_consume_loop
函数开始基本的消费循环,处理订阅的消息。
原生连接
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:poll_data_code_piece}}
subscribe
方法的参数含义为:订阅的主题列表(即名称),支持同时订阅多个主题。poll
每次调用获取一个消息,一个消息中可能包含多个记录。ResultBean
是我们自定义的一个内部类,其字段名和数据类型与列的名称和数据类型一一对应,这样根据value.deserializer
属性对应的反序列化类可以反序列化出ResultBean
类型的对象。
{{#include docs/examples/python/tmq_native.py:subscribe}}
subscribe
方法的参数含义为:订阅的主题列表(即名称),支持同时订阅多个主题。poll
每次调用获取一个消息,一个消息中可能包含多个记录。records
包含了多个 block 块, 每个块中可能包含多个记录。
{{#include docs/examples/rust/restexample/examples/tmq.rs:consume}}
- 消费者可订阅一个或多个
TOPIC
,一般建议一个消费者只订阅一个TOPIC
。 - TMQ 消息队列是一个 futures::Stream 类型,可以使用相应 API 对每个消息进行消费,并通过
.commit
进行已消费标记。 Record
是我们自定义的一个结构体,其字段名和数据类型与列的名称和数据类型一一对应,这样可以通过serde
反序列化出Record
类型的对象。
{{#include docs/examples/c/tmq_demo.c:basic_consume_loop}}
{{#include docs/examples/c/tmq_demo.c:msg_process}}
{{#include docs/examples/c/tmq_demo.c:subscribe_3}}
订阅消费数据步骤:
- 调用
build_topic_list
函数创建一个主题列表topic_list
。 - 如果
topic_list
为NULL
,表示创建失败,函数返回-1
。 - 使用
tmq_subscribe
函数订阅tmq
指定的主题列表。如果订阅失败,打印错误信息。 - 销毁主题列表
topic_list
以释放资源。 - 调用
basic_consume_loop
函数开始基本的消费循环,处理订阅的消息。
指定订阅的 Offset
消费者可以指定从特定 Offset 开始读取分区中的消息,这允许消费者重读消息或跳过已处理的消息。下面展示各语言连接器如何指定订阅的 Offset。
WebSocket 连接
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:consumer_seek}}
- 使用 consumer.poll 方法轮询数据,直到获取到数据为止。
- 对于轮询到的第一批数据,打印第一条数据的内容,并获取当前消费者的分区分配信息。
- 使用 consumer.seekToBeginning 方法将所有分区的偏移量重置到开始位置,并打印成功重置的消息。
- 再次使用 consumer.poll 方法轮询数据,并打印第一条数据的内容。
{{#include docs/examples/python/tmq_websocket_example.py:assignment}}
```go
{{#include docs/examples/go/tmq/ws/main.go:seek}}
```
{{#include docs/examples/rust/nativeexample/examples/tmq.rs:seek_offset}}
- 通过调用 consumer.assignments() 方法获取消费者当前的分区分配信息,并记录初始分配状态。
- 遍历每个分区分配信息,对于每个分区:提取主题(topic)、消费组ID(vgroup_id)、当前偏移量(current)、起始偏移量(begin)和结束偏移量(end)。 记录这些信息。
- 调用 consumer.offset_seek 方法将偏移量设置到起始位置。如果操作失败,记录错误信息和当前分配状态。
- 在所有分区的偏移量调整完成后,再次获取并记录消费者的分区分配信息,以确认偏移量调整后的状态。
{{#include docs/examples/node/websocketexample/tmq_seek_example.js:offset}}
```csharp
{{#include docs/examples/csharp/wssubscribe/Program.cs:seek}}
```
```c
{{#include docs/examples/c-ws/tmq_demo.c:consume_repeatly}}
```
- 通过
ws_tmq_get_topic_assignment
函数获取特定主题的分配信息,包括分配的数量和具体分配详情。 - 如果获取分配信息失败,则打印错误信息并返回。
- 对于每个分配,使用
ws_tmq_offset_seek
函数将消费者的偏移量设置到最早的偏移量。 - 如果设置偏移量失败,则打印错误信息。
- 释放分配信息数组以释放资源。
- 调用
basic_consume_loop
函数开始新的消费循环,处理消息。
原生连接
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:consumer_seek}}
- 使用 consumer.poll 方法轮询数据,直到获取到数据为止。
- 对于轮询到的第一批数据,打印第一条数据的内容,并获取当前消费者的分区分配信息。
- 使用 consumer.seekToBeginning 方法将所有分区的偏移量重置到开始位置,并打印成功重置的消息。
- 再次使用 consumer.poll 方法轮询数据,并打印第一条数据的内容。
{{#include docs/examples/python/tmq_native.py:assignment}}
```go
{{#include docs/examples/go/tmq/native/main.go:seek}}
```
{{#include docs/examples/rust/nativeexample/examples/tmq.rs:seek_offset}}
- 通过调用 consumer.assignments() 方法获取消费者当前的分区分配信息,并记录初始分配状态。
- 遍历每个分区分配信息,对于每个分区:提取主题(topic)、消费组ID(vgroup_id)、当前偏移量(current)、起始偏移量(begin)和结束偏移量(end)。 记录这些信息。
- 调用 consumer.offset_seek 方法将偏移量设置到起始位置。如果操作失败,记录错误信息和当前分配状态。
- 在所有分区的偏移量调整完成后,再次获取并记录消费者的分区分配信息,以确认偏移量调整后的状态。
- 通过
tmq_get_topic_assignment
函数获取特定主题的分配信息,包括分配的数量和具体分配详情。 - 如果获取分配信息失败,则打印错误信息并返回。
- 对于每个分配,使用
tmq_offset_seek
函数将消费者的偏移量设置到最早的偏移量。 - 如果设置偏移量失败,则打印错误信息。
- 释放分配信息数组以释放资源。
- 调用
basic_consume_loop
函数开始新的消费循环,处理消息。
提交 Offset
当消费者读取并处理完消息后,它可以提交 Offset,这表示消费者已经成功处理到这个 Offset 的消息。Offset 提交可以是自动的(根据配置定期提交)或手动的(应用程序控制何时提交)。
当创建消费者时,属性 enable.auto.commit
为 false 时,可以手动提交 offset。
注意:手工提交消费进度前确保消息正常处理完成,否则处理出错的消息不会被再次消费。自动提交是在本次 poll
消息时可能会提交上次消息的消费进度,因此请确保消息处理完毕再进行下一次 poll
或消息获取。
WebSocket 连接
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:commit_code_piece}}
{{#include docs/examples/python/tmq_websocket_example.py:commit_offset}}
```go
{{#include docs/examples/go/tmq/ws/main.go:commit_offset}}
```
```rust
{{#include docs/examples/rust/restexample/examples/tmq.rs:consumer_commit_manually}}
```
可以通过 consumer.commit
方法来手工提交消费进度。
{{#include docs/examples/node/websocketexample/tmq_example.js:commit}}
```csharp
{{#include docs/examples/csharp/wssubscribe/Program.cs:commit_offset}}
```
```c
{{#include docs/examples/c-ws/tmq_demo.c:manual_commit}}
```
可以通过 ws_tmq_commit_sync
函数来手工提交消费进度。
原生连接
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:commit_code_piece}}
{{#include docs/examples/python/tmq_native.py:commit_offset}}
```go
{{#include docs/examples/go/tmq/native/main.go:commit_offset}}
```
```rust
{{#include docs/examples/rust/restexample/examples/tmq.rs:consumer_commit_manually}}
```
可以通过 consumer.commit
方法来手工提交消费进度。
不支持
{{#include docs/examples/csharp/subscribe/Program.cs:commit_offset}}
```c
{{#include docs/examples/c/tmq_demo.c:manual_commit}}
```
可以通过 tmq_commit_sync
函数来手工提交消费进度。
取消订阅和关闭消费
消费者可以取消对主题的订阅,停止接收消息。当消费者不再需要时,应该关闭消费者实例,以释放资源和断开与 TDengine 服务器的连接。
WebSocket 连接
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:unsubscribe_data_code_piece}}
{{#include docs/examples/python/tmq_websocket_example.py:unsubscribe}}
```go
{{#include docs/examples/go/tmq/ws/main.go:close}}
```
```rust
{{#include docs/examples/rust/restexample/examples/tmq.rs:unsubscribe}}
```
注意:消费者取消订阅后已经关闭,无法重用,如果想订阅新的 topic
, 请重新创建消费者。
{{#include docs/examples/node/websocketexample/tmq_example.js:unsubscribe}}
```csharp
{{#include docs/examples/csharp/wssubscribe/Program.cs:close}}
```
```c
{{#include docs/examples/c-ws/tmq_demo.c:unsubscribe_and_close}}
```
不支持
原生连接
{{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:unsubscribe_data_code_piece}}
{{#include docs/examples/python/tmq_native.py:unsubscribe}}
```go
{{#include docs/examples/go/tmq/native/main.go:close}}
```
```rust
{{#include docs/examples/rust/restexample/examples/tmq.rs:unsubscribe}}
```
注意:消费者取消订阅后已经关闭,无法重用,如果想订阅新的 topic
, 请重新创建消费者。
不支持
{{#include docs/examples/csharp/subscribe/Program.cs:close}}
```c
{{#include docs/examples/c/tmq_demo.c:unsubscribe_and_close}}
```
不支持
完整示例
WebSocket 连接
完整代码示例
```java {{#include docs/examples/java/src/main/java/com/taos/example/WsConsumerLoopFull.java:consumer_demo}} ```注意:这里的 value.deserializer 配置参数值应该根据测试环境的包路径做相应的调整。
完整代码示例
```python {{#include docs/examples/python/tmq_websocket_example.py}} ```完整代码示例
```go {{#include docs/examples/go/tmq/ws/main.go}} ```完整代码示例
```rust {{#include docs/examples/rust/restexample/examples/tmq.rs}} ```完整代码示例
```js {{#include docs/examples/node/websocketexample/tmq_example.js}} ```完整代码示例
```csharp {{#include docs/examples/csharp/wssubscribe/Program.cs}} ```完整代码示例
```c {{#include docs/examples/c-ws/tmq_demo.c}} ```原生连接
完整代码示例
```java {{#include docs/examples/java/src/main/java/com/taos/example/ConsumerLoopFull.java:consumer_demo}} ```注意:这里的 value.deserializer 配置参数值应该根据测试环境的包路径做相应的调整。