12 KiB
| title | description |
|---|---|
| 系统监控 | 监控 TDengine 的运行状态 |
TDengine 通过 taosKeeper 将服务器的 CPU、内存、硬盘空间、带宽、请求数、磁盘读写速度等信息定时写入指定数据库。TDengine 还将重要的系统操作(比如登录、创建、删除数据库等)日志以及各种错误报警信息进行记录。系统管理员可以从 CLI 直接查看这个数据库,也可以在 WEB 通过图形化界面查看这些监测信息。
这些监测信息的采集缺省是打开的,但可以修改配置文件里的选项 monitor 将其关闭或打开。
TDinsight - 使用监控数据库 + Grafana 对 TDengine 进行监控的解决方案
我们提供了一个自动化脚本 TDinsight.sh 对 TDinsight 进行部署。
下载 TDinsight.sh:
wget https://github.com/taosdata/grafanaplugin/raw/master/dashboards/TDinsight.sh
chmod +x TDinsight.sh
准备:
-
TDengine Server 信息:
- TDengine RESTful 服务:对本地而言,可以是
http://localhost:6041,使用参数-a。 - TDengine 用户名和密码,使用
-u-p参数设置。
- TDengine RESTful 服务:对本地而言,可以是
-
Grafana 告警通知
-
使用已经存在的 Grafana Notification Channel
uid,参数-E。该参数可以使用curl -u admin:admin localhost:3000/api/alert-notifications |jq来获取。./TDinsight.sh -a http://localhost:6041 -u root -p taosdata -E <notifier uid>
-
运行程序并重启 Grafana 服务,打开面板:http://localhost:3000/d/tdinsight。
log 库
TDinsight dashboard 数据来源于 log 库(存放监控数据的默认db,可以在 taoskeeper 配置文件中修改,具体参考 taoskeeper 文档)。taoskeeper 启动后会自动创建 log 库,并将监控数据写入到该数据库中。
taosd_cluster_basic 表
taosd_cluster_basic 表记录集群基础信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| first_ep | VARCHAR | 集群 first ep | |
| first_ep_dnode_id | INT | 集群 first ep 的 dnode id | |
| cluster_version | VARCHAR | tdengine version。例如:3.0.4.0 | |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_cluster_info 表
taosd_cluster_info 表记录集群信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| cluster_uptime | DOUBLE | 当前 master 节点的uptime。单位:秒 | |
| dbs_total | DOUBLE | database 总数 | |
| tbs_total | DOUBLE | 当前集群 table 总数 | |
| stbs_total | DOUBLE | 当前集群 stable 总数 | |
| dnodes_total | DOUBLE | 当前集群 dnode 总数 | |
| dnodes_alive | DOUBLE | 当前集群 dnode 存活总数 | |
| mnodes_total | DOUBLE | 当前集群 mnode 总数 | |
| mnodes_alive | DOUBLE | 当前集群 mnode 存活总数 | |
| vgroups_total | DOUBLE | 当前集群 vgroup 总数 | |
| vgroups_alive | DOUBLE | 当前集群 vgroup 存活总数 | |
| vnodes_total | DOUBLE | 当前集群 vnode 总数 | |
| vnodes_alive | DOUBLE | 当前集群 vnode 存活总数 | |
| connections_total | DOUBLE | 当前集群连接总数 | |
| topics_total | DOUBLE | 当前集群 topic 总数 | |
| streams_total | DOUBLE | 当前集群 stream 总数 | |
| grants_expire_time | DOUBLE | 认证过期时间,企业版有效,社区版为 DOUBLE 最大值 | |
| grants_timeseries_used | DOUBLE | 已用测点数 | |
| grants_timeseries_total | DOUBLE | 总测点数,开源版本为 DOUBLE 最大值 | |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_vgroups_info 表
taosd_vgroups_info 表记录虚拟节点组信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| tables_num | DOUBLE | vgroup 中 table 数量 | |
| status | DOUBLE | vgroup 状态, 取值范围:unsynced = 0, ready = 1 | |
| vgroup_id | VARCHAR | TAG | vgroup id |
| database_name | VARCHAR | TAG | vgroup 所属的 database 名字 |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_dnodes_info 表
taosd_dnodes_info 记录 dnode 信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| uptime | DOUBLE | dnode uptime,单位:秒 | |
| cpu_engine | DOUBLE | taosd cpu 使用率,从 /proc/<taosd_pid>/stat 读取 |
|
| cpu_system | DOUBLE | 服务器 cpu 使用率,从 /proc/stat 读取 |
|
| cpu_cores | DOUBLE | 服务器 cpu 核数 | |
| mem_engine | DOUBLE | taosd 内存使用率,从 /proc/<taosd_pid>/status 读取 |
|
| mem_free | DOUBLE | 服务器可用内存,单位 KB | |
| mem_total | DOUBLE | 服务器内存总量,单位 KB | |
| disk_used | DOUBLE | data dir 挂载的磁盘使用量,单位 bytes | |
| disk_total | DOUBLE | data dir 挂载的磁盘总容量,单位 bytes | |
| system_net_in | DOUBLE | 网络吞吐率,从 /proc/net/dev 中读取的 received bytes。单位 byte/s |
|
| system_net_out | DOUBLE | 网络吞吐率,从 /proc/net/dev 中读取的 transmit bytes。单位 byte/s |
|
| io_read | DOUBLE | io 吞吐率,从 /proc/<taosd_pid>/io 中读取的 rchar 与上次数值计算之后,计算得到速度。单位 byte/s |
|
| io_write | DOUBLE | io 吞吐率,从 /proc/<taosd_pid>/io 中读取的 wchar 与上次数值计算之后,计算得到速度。单位 byte/s |
|
| io_read_disk | DOUBLE | 磁盘 io 吞吐率,从 /proc/<taosd_pid>/io 中读取的 read_bytes。单位 byte/s |
|
| io_write_disk | DOUBLE | 磁盘 io 吞吐率,从 /proc/<taosd_pid>/io 中读取的 write_bytes。单位 byte/s |
|
| vnodes_num | DOUBLE | dnode 上 vnodes 数量 | |
| masters | DOUBLE | dnode 上 master node 数量 | |
| has_mnode | DOUBLE | dnode 是否包含 mnode,取值范围:包含=1,不包含=0 | |
| has_qnode | DOUBLE | dnode 是否包含 qnode,取值范围:包含=1,不包含=0 | |
| has_snode | DOUBLE | dnode 是否包含 snode,取值范围:包含=1,不包含=0 | |
| has_bnode | DOUBLE | dnode 是否包含 bnode,取值范围:包含=1,不包含=0 | |
| error_log_count | DOUBLE | error 总数 | |
| info_log_count | DOUBLE | info 总数 | |
| debug_log_count | DOUBLE | debug 总数 | |
| trace_log_count | DOUBLE | trace 总数 | |
| dnode_id | VARCHAR | TAG | dnode id |
| dnode_ep | VARCHAR | TAG | dnode endpoint |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_dnodes_status 表
taosd_dnodes_status 表记录 dnode 状态信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| status | DOUBLE | dnode 状态,取值范围:ready=1,offline =0 | |
| dnode_id | VARCHAR | TAG | dnode id |
| dnode_ep | VARCHAR | TAG | dnode endpoint |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_dnodes_log_dir 表
taosd_dnodes_log_dir 表记录 log 目录信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| avail | DOUBLE | log 目录可用空间。单位 byte | |
| used | DOUBLE | log 目录已使用空间。单位 byte | |
| total | DOUBLE | log 目录空间。单位 byte | |
| name | VARCHAR | TAG | log 目录名,一般为 /var/log/taos/ |
| dnode_id | VARCHAR | TAG | dnode id |
| dnode_ep | VARCHAR | TAG | dnode endpoint |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_dnodes_data_dir 表
taosd_dnodes_data_dir 表记录 data 目录信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| avail | DOUBLE | data 目录可用空间。单位 byte | |
| used | DOUBLE | data 目录已使用空间。单位 byte | |
| total | DOUBLE | data 目录空间。单位 byte | |
| level | VARCHAR | TAG | 0、1、2 多级存储级别 |
| name | VARCHAR | TAG | data 目录,一般为 /var/lib/taos |
| dnode_id | VARCHAR | TAG | dnode id |
| dnode_ep | VARCHAR | TAG | dnode endpoint |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_mnodes_info 表
taosd_mnodes_info 表记录 mnode 角色信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| role | DOUBLE | mnode 角色, 取值范围:offline = 0,follower = 100,candidate = 101,leader = 102,error = 103,learner = 104 | |
| mnode_id | VARCHAR | TAG | master node id |
| mnode_ep | VARCHAR | TAG | master node endpoint |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_vnodes_role 表
taosd_vnodes_role 表记录虚拟节点角色信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| vnode_role | DOUBLE | vnode 角色,取值范围:offline = 0,follower = 100,candidate = 101,leader = 102,error = 103,learner = 104 | |
| vgroup_id | VARCHAR | TAG | dnode id |
| dnode_id | VARCHAR | TAG | dnode id |
| database_name | VARCHAR | TAG | vgroup 所属的 database 名字 |
| cluster_id | VARCHAR | TAG | cluster id |
taosd_sql_req 表
taosd_sql_req 记录授权信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| count | DOUBLE | sql 数量 | |
| result | VARCHAR | TAG | sql的执行结果,取值范围:Success, Failed |
| username | VARCHAR | TAG | 执行sql的user name |
| sql_type | VARCHAR | TAG | sql类型,取值范围:inserted_rows |
| dnode_id | VARCHAR | TAG | dnode id |
| dnode_ep | VARCHAR | TAG | dnode endpoint |
| vgroup_id | VARCHAR | TAG | dnode id |
| cluster_id | VARCHAR | TAG | cluster id |
taos_sql_req 表
taos_sql_req 记录授权信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| count | DOUBLE | sql 数量 | |
| result | VARCHAR | TAG | sql的执行结果,取值范围:Success, Failed |
| username | VARCHAR | TAG | 执行sql的user name |
| sql_type | VARCHAR | TAG | sql类型,取值范围:select, insert,delete |
| cluster_id | VARCHAR | TAG | cluster id |
taos_slow_sql 表
taos_slow_sql 记录授权信息。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| count | DOUBLE | sql 数量 | |
| result | VARCHAR | TAG | sql的执行结果,取值范围:Success, Failed |
| username | VARCHAR | TAG | 执行sql的user name |
| duration | VARCHAR | TAG | sql执行耗时,取值范围:3-10s,10-100s,100-1000s,1000s- |
| cluster_id | VARCHAR | TAG | cluster id |
keeper_monitor 表
keeper_monitor 记录 taoskeeper 监控数据。
| field | type | is_tag | comment |
|---|---|---|---|
| ts | TIMESTAMP | timestamp | |
| cpu | DOUBLE | cpu 使用率 | |
| mem | DOUBLE | 内存使用率 | |
| identify | NCHAR | TAG |
taosadapter_restful_http_request_total 表
taosadapter_restful_http_request_total 记录 taosadapter rest 请求信息,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
| field | type | is_tag | comment |
|---|---|---|---|
| _ts | TIMESTAMP | timestamp | |
| gauge | DOUBLE | 监控指标值 | |
| client_ip | NCHAR | TAG | client ip |
| endpoint | NCHAR | TAG | taosadpater endpoint |
| request_method | NCHAR | TAG | request method |
| request_uri | NCHAR | TAG | request uri |
| status_code | NCHAR | TAG | status code |
taosadapter_restful_http_request_fail 表
taosadapter_restful_http_request_fail 记录 taosadapter rest 请求失败信息,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
| field | type | is_tag | comment |
|---|---|---|---|
| _ts | TIMESTAMP | timestamp | |
| gauge | DOUBLE | 监控指标值 | |
| client_ip | NCHAR | TAG | client ip |
| endpoint | NCHAR | TAG | taosadpater endpoint |
| request_method | NCHAR | TAG | request method |
| request_uri | NCHAR | TAG | request uri |
| status_code | NCHAR | TAG | status code |
taosadapter_restful_http_request_in_flight 表
taosadapter_restful_http_request_in_flight 记录 taosadapter rest 实时请求信息,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
| field | type | is_tag | comment |
|---|---|---|---|
| _ts | TIMESTAMP | timestamp | |
| gauge | DOUBLE | 监控指标值 | |
| endpoint | NCHAR | TAG | taosadpater endpoint |
taosadapter_restful_http_request_summary_milliseconds 表
taosadapter_restful_http_request_summary_milliseconds 记录 taosadapter rest 请求汇总信息,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
| field | type | is_tag | comment |
|---|---|---|---|
| _ts | TIMESTAMP | timestamp | |
| count | DOUBLE | ||
| sum | DOUBLE | ||
| 0.5 | DOUBLE | ||
| 0.9 | DOUBLE | ||
| 0.99 | DOUBLE | ||
| 0.1 | DOUBLE | ||
| 0.2 | DOUBLE | ||
| endpoint | NCHAR | TAG | taosadpater endpoint |
| request_method | NCHAR | TAG | request method |
| request_uri | NCHAR | TAG | request uri |
taosadapter_system_mem_percent 表
taosadapter_system_mem_percent 表记录 taosadapter 内存使用情况,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
| field | type | is_tag | comment |
|---|---|---|---|
| _ts | TIMESTAMP | timestamp | |
| gauge | DOUBLE | 监控指标值 | |
| endpoint | NCHAR | TAG | taosadpater endpoint |
taosadapter_system_cpu_percent 表
taosadapter_system_cpu_percent 表记录 taosadapter cpu 使用情况,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
| field | type | is_tag | comment |
|---|---|---|---|
| _ts | TIMESTAMP | timestamp | |
| gauge | DOUBLE | 监控指标值 | |
| endpoint | NCHAR | TAG | taosadpater endpoint |