homework-jianmu/docs/zh/14-reference/01-components/01-taosd.md

43 KiB
Raw Blame History

title sidebar_label toc_max_heading_level
taosd 参考手册 taosd 4

taosd 是 TDengine 数据库引擎的核心服务,其配置文件默认是 /etc/taos/taos.cfg 但也可以指定不同路径的配置文件。本节详细介绍 taosd 的命令行参数及配置文件中的配置参数。

命令行参数

taosd 命令行参数如下

  • -a <json file>:指定一个 JSON 文件,其中包含服务启动时的各项配置参数,其格式形如 {"fqdn":"td1"},关于配置参数的细节请参考下一节
  • -c <directory>:指定配置文件所在目录
  • -s打印 SDB 信息
  • -C: 打印配置信息
  • -e: 指定环境变量,其格式形如 -e 'TAOS_FQDN=td1'
  • -k: 获取机器码
  • -dm: 启用内存调度
  • -V: 打印版本信息

配置参数

:::note 配置文件参数修改后,需要重启taosd服务,或客户端应用才能生效。

:::

连接相关

参数名称 支持版本 参数含义
firstEp taosd 启动时,主动连接的集群中首个 dnode 的 end point默认值 localhost:6030
secondEp taosd 启动时,如果 firstEp 连接不上,尝试连接集群中第二个 dnode 的 endpoint无默认值
fqdn taosd 监听的服务地址,默认为所在服务器上配置的第一个 hostname
serverPort taosd 监听的端口,默认值 6030
compressMsgSize 是否对 RPC 消息进行压缩;-1所有消息都不压缩0所有消息都压缩N (N>0):只有大于 N 个字节的消息才压缩;默认值 -1
shellActivityTimer 客户端向 mnode 发送心跳的时长,单位为秒,取值范围 1-120默认值 3
numOfRpcSessions RPC 支持的最大连接数,取值范围 100-100000默认值 30000
numOfRpcThreads RPC 线程数目,默认值为 CPU 核数的一半
numOfTaskQueueThreads dnode 处理 RPC 消息的线程数
statusInterval dnode 与 mnode 之间的心跳间隔
rpcQueueMemoryAllowed dnode 允许的 rpc 消息占用的内存最大值,单位 bytes取值范围 104857600-INT64_MAX默认值 服务器内存的 1/10
resolveFQDNRetryTime FQDN 解析失败时的重试次数
timeToGetAvailableConn 获得可用连接的最长等待时间,取值范围 10-50000000单位为毫秒默认值 500000
maxShellConns 允许创建的最大链接数
maxRetryWaitTime 重连最大超时时间
shareConnLimit 3.3.4.3 后 内部参数,一个链接可以共享的查询数目,取值范围 1-256默认值 10
readTimeout 3.3.4.3 后 内部参数,最小超时时间,取值范围 64-604800单位为秒默认值 900

监控相关

参数名称 支持版本 参数含义
monitor 是否收集监控数据并上报0关闭1:打开;默认值 0
monitorFqdn taosKeeper 服务所在服务器的 FQDN默认值 无
monitorPort taosKeeper 服务所监听的端口号,默认值 6043
monitorInterval 监控数据库记录系统参数CPU/内存)的时间间隔,单位是秒,取值范围 1-200000 ,默认值 30
monitorMaxLogs 缓存的待上报日志条数
monitorComp 是否采用压缩方式上报监控日志时
monitorLogProtocol 是否打印监控日志
monitorForceV2 是否使用 V2 版本协议上报
telemetryReporting 是否上传 telemetry0不上传1上传默认值 1
telemetryServer telemetry 服务器地址
telemetryPort telemetry 服务器端口编号
telemetryInterval telemetry 上传时间间隔,单位为秒,默认 43200
crashReporting 是否上传 crash 信息0不上传1上传默认值 1

查询相关

参数名称 支持版本 参数含义
countAlwaysReturnValue count/hyperloglog 函数在输入数据为空或者 NULL 的情况下是否返回值0返回空行1返回默认值 1该参数设置为 1 时,如果查询中含有 INTERVAL 子句或者该查询使用了 TSMA 时,且相应的组或窗口内数据为空或者 NULL对应的组或窗口将不返回查询结果注意此参数客户端和服务端值应保持一致
tagFilterCache 是否缓存标签过滤结果
maxNumOfDistinctRes 允许返回的 distinct 结果最大行数,默认值 10 万,最大允许值 1 亿
queryBufferSize 暂不生效
queryRspPolicy 查询响应策略
filterScalarMode 强制使用标量过滤模式0关闭1开启默认值 0
queryPlannerTrace 内部参数,查询计划是否输出详细日志
queryNodeChunkSize 内部参数,查询计划的块大小
queryUseNodeAllocator 内部参数,查询计划的分配方法
queryMaxConcurrentTables 内部参数,查询计划的并发数目
queryRsmaTolerance 内部参数,用于判定查询哪一级 rsma 数据时的容忍时间,单位为毫秒
enableQueryHb 内部参数,是否发送查询心跳消息
pqSortMemThreshold 内部参数,排序使用的内存阈值

区域相关

参数名称 支持版本 参数含义
timezone 时区;缺省从系统中动态获取当前的时区设置
locale 系统区位信息及编码格式,缺省从系统中获取
charset 字符集编码,缺省从系统中获取

:::info

  1. 为应对多时区的数据写入和查询问题TDengine 采用 Unix 时间戳(Unix Timestamp)来记录和存储时间戳。Unix 时间戳的特点决定了任一时刻不论在任何时区产生的时间戳均一致。需要注意的是Unix 时间戳是在客户端完成转换和记录。为了确保客户端其他形式的时间转换为正确的 Unix 时间戳,需要设置正确的时区。

在 Linux/macOS 中,客户端会自动读取系统设置的时区信息。用户也可以采用多种方式在配置文件设置时区。例如:

timezone UTC-8
timezone GMT-8
timezone Asia/Shanghai

均是合法的设置东八区时区的格式。但需注意Windows 下并不支持 timezone Asia/Shanghai 这样的写法,而必须写成 timezone UTC-8

时区的设置对于查询和写入 SQL 语句中非 Unix 时间戳的内容(时间戳字符串、关键词 now 的解析)产生影响。例如:

SELECT count(*) FROM table_name WHERE TS<'2019-04-11 12:01:08';

在东八区SQL 语句等效于

SELECT count(*) FROM table_name WHERE TS<1554955268000;

在 UTC 时区SQL 语句等效于

SELECT count(*) FROM table_name WHERE TS<1554984068000;

为了避免使用字符串时间格式带来的不确定性,也可以直接使用 Unix 时间戳。此外,还可以在 SQL 语句中使用带有时区的时间戳字符串例如RFC3339 格式的时间戳字符串2013-04-12T15:52:01.123+08:00 或者 ISO-8601 格式时间戳字符串 2013-04-12T15:52:01.123+0800。上述两个字符串转化为 Unix 时间戳不受系统所在时区的影响。

  1. TDengine 为存储中文、日文、韩文等非 ASCII 编码的宽字符,提供一种专门的字段类型 nchar。写入 nchar 字段的数据将统一采用 UCS4-LE 格式进行编码并发送到服务器。需要注意的是,编码正确性是客户端来保证。因此,如果用户想要正常使用 nchar 字段来存储诸如中文、日文、韩文等非 ASCII 字符,需要正确设置客户端的编码格式。

客户端的输入的字符均采用操作系统当前默认的编码格式,在 Linux/macOS 系统上多为 UTF-8部分中文系统编码则可能是 GB18030 或 GBK 等。在 docker 环境中默认的编码是 POSIX。在中文版 Windows 系统中,编码则是 CP936。客户端需要确保正确设置自己所使用的字符集即客户端运行的操作系统当前编码字符集才能保证 nchar 中的数据正确转换为 UCS4-LE 编码格式。

在 Linux/macOS 中 locale 的命名规则为:<语言>_<地区>.<字符集编码> 如zh_CN.UTF-8zh 代表中文CN 代表大陆地区UTF-8 表示字符集。字符集编码为客户端正确解析本地字符串提供编码转换的说明。Linux/macOS 可以通过设置 locale 来确定系统的字符编码,由于 Windows 使用的 locale 中不是 POSIX 标准的 locale 格式,因此在 Windows 下需要采用另一个配置参数 charset 来指定字符编码。在 Linux/macOS 中也可以使用 charset 来指定字符编码。

  1. 如果配置文件中不设置 charset在 Linux/macOS 中taos 在启动时候,自动读取系统当前的 locale 信息,并从 locale 信息中解析提取 charset 编码格式。如果自动读取 locale 信息失败,则尝试读取 charset 配置,如果读取 charset 配置也失败,则中断启动过程。

在 Linux/macOS 中locale 信息包含了字符编码信息,因此正确设置了 Linux/macOS 的 locale 以后可以不用再单独设置 charset。例如

locale zh_CN.UTF-8

在 Windows 系统中,无法从 locale 获取系统当前编码。如果无法从配置文件中读取字符串编码信息taos 默认设置为字符编码为 CP936。其等效在配置文件中添加如下配置

charset CP936

如果需要调整字符编码,请查阅当前操作系统使用的编码,并在配置文件中正确设置。

在 Linux/macOS 中,如果用户同时设置了 locale 和字符集编码 charset并且 locale 和 charset 的不一致,后设置的值将覆盖前面设置的值。

locale zh_CN.UTF-8
charset GBK

则 charset 的有效值是 GBK。

charset GBK
locale zh_CN.UTF-8

charset 的有效值是 UTF-8。

:::

存储相关

参数名称 支持版本 参数含义
dataDir 数据文件目录,所有的数据文件都将写入该目录,默认值 /var/lib/taos
tempDir 指定所有系统运行过程中的临时文件生成的目录,默认值 /tmp
minimalDataDirGB dataDir 指定的时序数据存储目录所需要保留的最小空间,单位 GB默认值 2
minimalTmpDirGB tempDir 所指定的临时文件目录所需要保留的最小空间,单位 GB默认值 1
minDiskFreeSize 3.1.1.0 后 当某块磁盘上的可用空间小于等于这个阈值时,该磁盘将不再被选择用于生成新的数据文件,单位为字节,取值范围 52428800-1073741824默认值为 52428800企业版参数
s3MigrateIntervalSec 3.3.4.3 后 本地数据文件自动上传 S3 的触发周期单位为秒。最小值600最大值100000。默认值 3600企业版参数
s3MigrateEnabled 3.3.4.3 后 是否自动进行 S3 迁移,默认值为 0表示关闭自动 S3 迁移,可配置为 1企业版参数
s3Accesskey 3.3.4.3 后 冒号分隔的用户 SecretId:SecretKey例如 AKIDsQmwsfKxTo2A6nGVXZN0UlofKn6JRRSJ:lIdoy99ygEacU7iHfogaN2Xq0yumSm1E企业版参数
s3Endpoint 3.3.4.3 后 用户所在地域的 COS 服务域名,支持 http 和 httpsbucket 的区域需要与 endpoint 保持一致,否则无法访问;企业版参数
s3BucketName 3.3.4.3 后 存储桶名称,减号后面是用户注册 COS 服务的 AppId其中 AppId 是 COS 特有AWS 和阿里云都没有,配置时需要作为 bucket name 的一部分,使用减号分隔;参数值均为字符串类型,但不需要引号;例如 test0711-1309024725企业版参数
s3PageCacheSize 3.3.4.3 后 S3 page cache 缓存页数目,取值范围 4-1048576单位为页默认值 4096企业版参数
s3UploadDelaySec 3.3.4.3 后 data 文件持续多长时间不再变动后上传至 S3取值范围 1-2592000 (30天单位为秒默认值 60企业版参数
cacheLazyLoadThreshold 内部参数,缓存的装载策略

集群相关

参数名称 支持版本 参数含义
supportVnodes dnode 支持的最大 vnode 数目,取值范围 0-4096默认值 CPU 核数的 2 倍 + 5
numOfCommitThreads 落盘线程的最大数量,取值范围 0-1024默认值为 4
numOfMnodeReadThreads mnode 的 Read 线程数目,取值范围 0-1024默认值为 CPU 核数的四分之一(不超过 4
numOfVnodeQueryThreads vnode 的 Query 线程数目,取值范围 0-1024默认值为 CPU 核数的两倍(不超过 16
numOfVnodeFetchThreads vnode 的 Fetch 线程数目,取值范围 0-1024默认值为 CPU 核数的四分之一(不超过 4
numOfVnodeRsmaThreads vnode 的 Rsma 线程数目,取值范围 0-1024默认值为 CPU 核数的四分之一(不超过 4
numOfQnodeQueryThreads qnode 的 Query 线程数目,取值范围 0-1024默认值为 CPU 核数的两倍(不超过 16
numOfSnodeSharedThreads snode 的共享线程数目,取值范围 0-1024默认值为 CPU 核数的四分之一(不小于 2不超过 4
numOfSnodeUniqueThreads snode 的独占线程数目,取值范围 0-1024默认值为 CPU 核数的四分之一(不小于 2不超过 4
ratioOfVnodeStreamThreads 流计算使用 vnode 线程的比例,取值范围 0.01-4默认值 4
ttlUnit ttl 参数的单位,取值范围 1-31572500单位为秒默认值 86400
ttlPushInterval ttl 检测超时频率,取值范围 1-100000单位为秒默认值 10
ttlChangeOnWrite ttl 到期时间是否伴随表的修改操作改变0不改变1改变默认值为 0
ttlBatchDropNum ttl 一批删除子表的数目,最小值为 0默认值 10000
retentionSpeedLimitMB 数据在不同级别硬盘上迁移时的速度限制,取值范围 0-1024单位 MB默认值 0表示不限制
maxTsmaNum 集群内可创建的TSMA个数取值范围 0-3默认值 3
tmqMaxTopicNum 订阅最多可建立的 topic 数量;取值范围 1-10000默认值为 20
tmqRowSize 订阅数据块的最大记录条数,取值范围 1-1000000默认值 4096
audit 审计功能开关;企业版参数
auditInterval 审计数据上报的时间间隔;企业版参数
auditCreateTable 是否针对创建子表开启申计功能;企业版参数
encryptAlgorithm 数据加密算法;企业版参数
encryptScope 加密范围;企业版参数
enableWhiteList 白名单功能开关;企业版参数
syncLogBufferMemoryAllowed 一个 dnode 允许的 sync 日志缓存消息占用的内存最大值,单位 bytes取值范围 104857600-INT64_MAX默认值 服务器内存的 1/103.1.3.2/3.3.2.13 版本开始生效
syncElectInterval 内部参数,用于同步模块调试
syncHeartbeatInterval 内部参数,用于同步模块调试
syncHeartbeatTimeout 内部参数,用于同步模块调试
syncSnapReplMaxWaitN 内部参数,用于同步模块调试
syncSnapReplMaxWaitN 内部参数,用于同步模块调试
arbHeartBeatIntervalSec 内部参数,用于同步模块调试
arbCheckSyncIntervalSec 内部参数,用于同步模块调试
arbSetAssignedTimeoutSec 内部参数,用于同步模块调试
mndSdbWriteDelta 内部参数,用于 mnode 模块调试
mndLogRetention 内部参数,用于 mnode 模块调试
skipGrant 内部参数,用于授权检查
trimVDbIntervalSec 内部参数,用于删除过期数据
ttlFlushThreshold 内部参数ttl 定时器的频率
compactPullupInterval 内部参数,数据重整定时器的频率
walFsyncDataSizeLimit 内部参数WAL 进行 FSYNC 的阈值
transPullupInterval 内部参数mnode 执行事务的重试间隔
mqRebalanceInterval 内部参数,消费者再平衡的时间间隔
uptimeInterval 内部参数,用于记录系统启动时间
timeseriesThreshold 内部参数,用于统计用量
udf 是否启动 UDF 服务0不启动1启动默认值为 0
udfdResFuncs 内部参数,用于 UDF 结果集设置
udfdLdLibPath 内部参数,表示 UDF 装载的库路径

流计算参数

参数名称 支持版本 参数含义
disableStream 流计算的启动开关
streamBufferSize 控制内存中窗口状态缓存的大小,默认值为 128MB
streamAggCnt 内部参数,并发进行聚合计算的数目
checkpointInterval 内部参数checkponit 同步间隔
concurrentCheckpoint 内部参数,是否并发检查 checkpoint
maxStreamBackendCache 内部参数,流计算使用的最大缓存
streamSinkDataRate 内部参数,用于控制流计算结果的写入速度

日志相关

参数名称 支持版本 参数含义
logDir 日志文件目录,运行日志将写入该目录,默认值 /var/log/taos
minimalLogDirGB 日志文件夹所在磁盘可用空间大小小于该值时,停止写日志,单位 GB默认值 1
numOfLogLines 单个日志文件允许的最大行数,默认值 10,000,000
asyncLog 日志写入模式0同步1异步默认值 1
logKeepDays 日志文件的最长保存时间,单位:天,默认值 0意味着无限保存日志文件不会被重命名也不会有新的日志文件滚动产生但日志文件的内容有可能会不断滚动取决于日志文件大小的设置当设置为大于 0 的值时,当日志文件大小达到设置的上限时会被重命名为 taosdlog.yyy其中 yyy 为日志文件最后修改的时间戳,并滚动产生新的日志文件
slowLogThreshold 3.3.3.0 后 慢查询门限值,大于等于门限值认为是慢查询,单位秒,默认值 3
slowLogMaxLen 3.3.3.0 后 慢查询日志最大长度,取值范围 1-16384默认值 4096
slowLogScope 3.3.3.0 后 慢查询记录类型,取值范围 ALL/QUERY/INSERT/OTHERS/NONE默认值 QUERY
slowLogExceptDb 3.3.3.0 后 指定的数据库不上报慢查询,仅支持配置换一个数据库
debugFlag 运行日志开关131输出错误和警告日志135输出错误、警告和调试日志143输出错误、警告、调试和跟踪日志默认值 131 或 135 (取决于不同模块)
tmrDebugFlag 定时器模块的日志开关,取值范围同上
uDebugFlag 共用功能模块的日志开关,取值范围同上
rpcDebugFlag rpc 模块的日志开关,取值范围同上
qDebugFlag query 模块的日志开关,取值范围同上
dDebugFlag dnode 模块的日志开关,取值范围同上
vDebugFlag vnode 模块的日志开关,取值范围同上
mDebugFlag mnode 模块的日志开关,取值范围同上
azDebugFlag 3.3.4.3 后 S3 模块的日志开关,取值范围同上
sDebugFlag sync 模块的日志开关,取值范围同上
tsdbDebugFlag tsdb 模块的日志开关,取值范围同上
tqDebugFlag tq 模块的日志开关,取值范围同上
fsDebugFlag fs 模块的日志开关,取值范围同上
udfDebugFlag udf 模块的日志开关,取值范围同上
smaDebugFlag sma 模块的日志开关,取值范围同上
idxDebugFlag index 模块的日志开关,取值范围同上
tdbDebugFlag tdb 模块的日志开关,取值范围同上
metaDebugFlag meta 模块的日志开关,取值范围同上
stDebugFlag stream 模块的日志开关,取值范围同上
sndDebugFlag snode 模块的日志开关,取值范围同上

调试相关

参数名称 支持版本 参数含义
enableCoreFile crash 时是否生成 core 文件0不生成1生成默认值 1
configDir 配置文件所在目录
scriptDir 内部测试工具的脚本目录
assert 断言控制开关,默认值 0
randErrorChance 内部参数,用于随机失败测试
randErrorDivisor 内部参数,用于随机失败测试
randErrorScope 内部参数,用于随机失败测试
safetyCheckLevel 内部参数,用于随机失败测试
experimental 内部参数,用于一些实验特性
simdEnable 3.3.4.3 后 内部参数,用于测试 SIMD 加速
AVX512Enable 3.3.4.3 后 内部参数,用于测试 AVX512 加速
rsyncPort 内部参数,用于调试流计算
snodeAddress 内部参数,用于调试流计算
checkpointBackupDir 内部参数,用于恢复 snode 数据
enableAuditDelete 内部参数,用于测试审计功能
slowLogThresholdTest 内部参数,用于测试慢日志
bypassFlag 3.3.4.5 后 内部参数用于短路测试0正常写入1写入消息在 taos 客户端发送 RPC 消息前返回2写入消息在 taosd 服务端收到 RPC 消息后返回4写入消息在 taosd 服务端写入内存缓存前返回8写入消息在 taosd 服务端数据落盘前返回;默认值 0

压缩参数

参数名称 支持版本 参数含义
fPrecision 设置 float 类型浮点数压缩精度 ,取值范围 0.1 ~ 0.00000001 ,默认值 0.00000001 , 小于此值的浮点数尾数部分将被截断
dPrecision 设置 double 类型浮点数压缩精度 , 取值范围 0.1 ~ 0.0000000000000001 默认值 0.0000000000000001 小于此值的浮点数尾数部分将被截取
lossyColumn 3.3.0.0 前 对 float 和/或 double 类型启用 TSZ 有损压缩;取值范围 float/double/none默认值 none表示关闭无损压缩
ifAdtFse 在启用 TSZ 有损压缩时,使用 FSE 算法替换 HUFFMAN 算法FSE 算法压缩速度更快但解压稍慢追求压缩速度可选用此算法0关闭1打开默认值为 0
maxRange 内部参数,用于有损压缩设置
curRange 内部参数,用于有损压缩设置
compressor 内部参数,用于有损压缩设置

补充说明

  1. 在 3.2.0.0 ~ 3.3.0.0(不包含)版本生效,启用该参数后不能回退到升级前的版本
  2. TSZ 压缩算法是通过数据预测技术完成的压缩,所以更适合有规律变化的数据
  3. TSZ 压缩时间会更长一些,如果您的服务器 CPU 空闲多,存储空间小的情况下适合选用
  4. 示例:对 float 和 double 类型都启用有损压缩
lossyColumns     float|double
  1. 配置需重启服务生效,重启如果在 taosd 日志中看到以下内容,表明配置已生效:
   02/22 10:49:27.607990 00002933 UTL  lossyColumns     float|double

taosd 监控指标

taosd 会将监控指标上报给 taosKeeper这些监控指标会被 taosKeeper 写入监控数据库,默认是 log 库,可以在 taoskeeper 配置文件中修改。以下是这些监控指标的详细介绍。

taosd_cluster_basic 表

taosd_cluster_basic 表记录集群基础信息。

field type is_tag comment
ts TIMESTAMP timestamp
first_ep VARCHAR 集群 first ep
first_ep_dnode_id INT 集群 first ep 的 dnode id
cluster_version VARCHAR tdengine version。例如3.0.4.0
cluster_id VARCHAR TAG cluster id

taosd_cluster_info 表

taosd_cluster_info 表记录集群信息。

field type is_tag comment
_ts TIMESTAMP timestamp
cluster_uptime DOUBLE 当前 master 节点的uptime。单位
dbs_total DOUBLE database 总数
tbs_total DOUBLE 当前集群 table 总数
stbs_total DOUBLE 当前集群 stable 总数
dnodes_total DOUBLE 当前集群 dnode 总数
dnodes_alive DOUBLE 当前集群 dnode 存活总数
mnodes_total DOUBLE 当前集群 mnode 总数
mnodes_alive DOUBLE 当前集群 mnode 存活总数
vgroups_total DOUBLE 当前集群 vgroup 总数
vgroups_alive DOUBLE 当前集群 vgroup 存活总数
vnodes_total DOUBLE 当前集群 vnode 总数
vnodes_alive DOUBLE 当前集群 vnode 存活总数
connections_total DOUBLE 当前集群连接总数
topics_total DOUBLE 当前集群 topic 总数
streams_total DOUBLE 当前集群 stream 总数
grants_expire_time DOUBLE 认证过期时间,企业版有效,社区版为 DOUBLE 最大值
grants_timeseries_used DOUBLE 已用测点数
grants_timeseries_total DOUBLE 总测点数,开源版本为 DOUBLE 最大值
cluster_id VARCHAR TAG cluster id

taosd_vgroups_info 表

taosd_vgroups_info 表记录虚拟节点组信息。

field type is_tag comment
_ts TIMESTAMP timestamp
tables_num DOUBLE vgroup 中 table 数量
status DOUBLE vgroup 状态, 取值范围 unsynced = 0, ready = 1
vgroup_id VARCHAR TAG vgroup id
database_name VARCHAR TAG vgroup 所属的 database 名字
cluster_id VARCHAR TAG cluster id

taosd_dnodes_info 表

taosd_dnodes_info 记录 dnode 信息。

field type is_tag comment
_ts TIMESTAMP timestamp
uptime DOUBLE dnode uptime单位
cpu_engine DOUBLE taosd cpu 使用率,从 /proc/<taosd_pid>/stat 读取
cpu_system DOUBLE 服务器 cpu 使用率,从 /proc/stat 读取
cpu_cores DOUBLE 服务器 cpu 核数
mem_engine DOUBLE taosd 内存使用率,从 /proc/<taosd_pid>/status 读取
mem_free DOUBLE 服务器可用内存,单位 KB
mem_total DOUBLE 服务器内存总量,单位 KB
disk_used DOUBLE data dir 挂载的磁盘使用量,单位 bytes
disk_total DOUBLE data dir 挂载的磁盘总容量,单位 bytes
system_net_in DOUBLE 网络吞吐率,从 /proc/net/dev 中读取的 received bytes。单位 byte/s
system_net_out DOUBLE 网络吞吐率,从 /proc/net/dev 中读取的 transmit bytes。单位 byte/s
io_read DOUBLE io 吞吐率,从 /proc/<taosd_pid>/io 中读取的 rchar 与上次数值计算之后,计算得到速度。单位 byte/s
io_write DOUBLE io 吞吐率,从 /proc/<taosd_pid>/io 中读取的 wchar 与上次数值计算之后,计算得到速度。单位 byte/s
io_read_disk DOUBLE 磁盘 io 吞吐率,从 /proc/<taosd_pid>/io 中读取的 read_bytes。单位 byte/s
io_write_disk DOUBLE 磁盘 io 吞吐率,从 /proc/<taosd_pid>/io 中读取的 write_bytes。单位 byte/s
vnodes_num DOUBLE dnode 上 vnodes 数量
masters DOUBLE dnode 上 master node 数量
has_mnode DOUBLE dnode 是否包含 mnode取值范围 包含=1,不包含=0
has_qnode DOUBLE dnode 是否包含 qnode取值范围 包含=1,不包含=0
has_snode DOUBLE dnode 是否包含 snode取值范围 包含=1,不包含=0
has_bnode DOUBLE dnode 是否包含 bnode取值范围 包含=1,不包含=0
error_log_count DOUBLE error 总数
info_log_count DOUBLE info 总数
debug_log_count DOUBLE debug 总数
trace_log_count DOUBLE trace 总数
dnode_id VARCHAR TAG dnode id
dnode_ep VARCHAR TAG dnode endpoint
cluster_id VARCHAR TAG cluster id

taosd_dnodes_status 表

taosd_dnodes_status 表记录 dnode 状态信息。

field type is_tag comment
_ts TIMESTAMP timestamp
status DOUBLE dnode 状态,取值范围 ready=1offline =0
dnode_id VARCHAR TAG dnode id
dnode_ep VARCHAR TAG dnode endpoint
cluster_id VARCHAR TAG cluster id

taosd_dnodes_log_dir 表

taosd_dnodes_log_dir 表记录 log 目录信息。

field type is_tag comment
_ts TIMESTAMP timestamp
avail DOUBLE log 目录可用空间。单位 byte
used DOUBLE log 目录已使用空间。单位 byte
total DOUBLE log 目录空间。单位 byte
name VARCHAR TAG log 目录名,一般为 /var/log/taos/
dnode_id VARCHAR TAG dnode id
dnode_ep VARCHAR TAG dnode endpoint
cluster_id VARCHAR TAG cluster id

taosd_dnodes_data_dir 表

taosd_dnodes_data_dir 表记录 data 目录信息。

field type is_tag comment
_ts TIMESTAMP timestamp
avail DOUBLE data 目录可用空间。单位 byte
used DOUBLE data 目录已使用空间。单位 byte
total DOUBLE data 目录空间。单位 byte
level VARCHAR TAG 0、1、2 多级存储级别
name VARCHAR TAG data 目录,一般为 /var/lib/taos
dnode_id VARCHAR TAG dnode id
dnode_ep VARCHAR TAG dnode endpoint
cluster_id VARCHAR TAG cluster id

taosd_mnodes_info 表

taosd_mnodes_info 表记录 mnode 角色信息。

field type is_tag comment
_ts TIMESTAMP timestamp
role DOUBLE mnode 角色, 取值范围 offline = 0,follower = 100,candidate = 101,leader = 102,error = 103,learner = 104
mnode_id VARCHAR TAG master node id
mnode_ep VARCHAR TAG master node endpoint
cluster_id VARCHAR TAG cluster id

taosd_vnodes_role 表

taosd_vnodes_role 表记录虚拟节点角色信息。

field type is_tag comment
_ts TIMESTAMP timestamp
vnode_role DOUBLE vnode 角色,取值范围 offline = 0,follower = 100,candidate = 101,leader = 102,error = 103,learner = 104
vgroup_id VARCHAR TAG dnode id
dnode_id VARCHAR TAG dnode id
database_name VARCHAR TAG vgroup 所属的 database 名字
cluster_id VARCHAR TAG cluster id

taosd_sql_req 表

taosd_sql_req 记录服务端 sql 请求信息。

field type is_tag comment
_ts TIMESTAMP timestamp
count DOUBLE sql 数量
result VARCHAR TAG sql的执行结果取值范围 Success, Failed
username VARCHAR TAG 执行sql的user name
sql_type VARCHAR TAG sql类型取值范围 inserted_rows
dnode_id VARCHAR TAG dnode id
dnode_ep VARCHAR TAG dnode endpoint
vgroup_id VARCHAR TAG dnode id
cluster_id VARCHAR TAG cluster id

taos_sql_req 表

taos_sql_req 记录客户端 sql 请求信息。

field type is_tag comment
_ts TIMESTAMP timestamp
count DOUBLE sql 数量
result VARCHAR TAG sql的执行结果取值范围 Success, Failed
username VARCHAR TAG 执行sql的user name
sql_type VARCHAR TAG sql类型取值范围 select, insertdelete
cluster_id VARCHAR TAG cluster id

taos_slow_sql 表

taos_slow_sql 记录客户端慢查询信息。

field type is_tag comment
_ts TIMESTAMP timestamp
count DOUBLE sql 数量
result VARCHAR TAG sql的执行结果取值范围 Success, Failed
username VARCHAR TAG 执行sql的user name
duration VARCHAR TAG sql执行耗时取值范围 3-10s,10-100s,100-1000s,1000s-
cluster_id VARCHAR TAG cluster id

日志相关

TDengine 通过日志文件记录系统运行状态,帮助用户监控系统运行情况,排查问题,这里主要介绍 taosc 和 taosd 两个系统日志的相关说明。

TDengine 的日志文件主要包括普通日志和慢日志两种类型。

  1. 普通日志行为说明
    1. 同一台机器上可以起多个客户端进程,所以客户端日志命名方式为 taoslogX.Y其中 X 为序号,为空或者 0 到 9Y 为后缀 0 或者 1。

    2. 同一台机器上只能有一个服务端进程。所以服务端日志命名方式为 taosdlog.Y其中 Y 为后缀, 0 或者 1。

      序号和后缀确定规则如下(假设日志路径为 /var/log/taos/

      1. 确定序号:使用 10 个序号作为日志命名方式,/var/log/taos/taoslog0.Y - /var/log/taos/taoslog9.Y依次检测每个序号是否使用找到第一个没使用的序号作为该进程的日志文件使用的序号。 如果 10 个序号都被进程使用,不使用序号,即 /var/log/taos/taoslog.Y进程都往相同的文件里写序号为空
      2. 确定后缀0 或者 1。比如确定序号为 3备选的日志文件名就为 /var/log/taos/taoslog3.0 /var/log/taos/taoslog3.1。如果两个文件都不存在用后缀 0一个存在一个不存在用存在的后缀。两个都存在用修改时间最近的那个后缀。
    3. 如果日志文件超过配置的条数 numOfLogLines会切换后缀名继续写日志比如/var/log/taos/taoslog3.0 写够了,切换到 /var/log/taos/taoslog3.1 继续写日志。/var/log/taos/taoslog3.0 会添加时间戳后缀重命名并压缩存储(异步线程操作)。

    4. 通过配置 logKeepDays 控制日志文件保存几天,几天之外的日志会被删除。比如配置为 1则一天之前的日志会在新日志压缩存储时检测删除。不是自然天。

系统除了记录普通日志以外,对于执行时间超过配置时间的 SQL 语句,会被记录到慢日志中。慢日志文件主要用于分析系统性能,排查性能问题。

  1. 慢日志行为说明
    1. 慢日志一方面会记录到本地慢日志文件中,另一方面会通过 taosAdapter 发送到 taosKeeper 进行结构化存储(需打开 monitorr 开关)。
    2. 慢日志文件存储规则为:
      1. 慢日志文件一天一个,如果当天没有慢日志,没有当天的文件。
      2. 文件名为 taosSlowLog.yyyy-mm-ddtaosSlowLog.2024-08-02日志存储路径通过 logDir 配置。
      3. 多个客户端的日志存储在相应日志路径下的同一个 taosSlowLog.yyyy.mm.dd 文件里。
      4. 慢日志文件不自动删除,不压缩。
      5. 使用和普通日志文件相同的三个参数 logDir, minimalLogDirGB, asyncLog。另外两个参数 numOfLogLineslogKeepDays 不适用于慢日志。