diff --git a/docs/zh/06-advanced/06-data-analysis/index.md b/docs/zh/06-advanced/06-data-analysis/index.md index c4f0bd8eda..464acf7bec 100644 --- a/docs/zh/06-advanced/06-data-analysis/index.md +++ b/docs/zh/06-advanced/06-data-analysis/index.md @@ -128,13 +128,17 @@ log-level = DEBUG ``` +**提示** +请勿设置 `daemonize` 参数,该参数会导致 uWSGI 与 systemctl 冲突,从而无法正常启动。 + + ## ANode 基本操作 ### 管理 ANode 创建 ANode 的 SQL 语法如下: ```sql CREATE ANODE {node_url} ``` -node_url 是提供服务的 ANode 的 IP 和 PORT, 例如:`create anode 'http://localhost:6050'`。启动 ANode 以后如果不注册到 TDengine 集群中,无法提供正常的服务。 +node_url 是提供服务的 ANode 的 IP 和 PORT, 例如:`create anode 'http://localhost:6050'`。启动 ANode 以后如果不注册到 TDengine 集群中,无法提供正常的服务。不建议 ANode 注册到两个或多个集群中。 查看 ANode 列出集群中所有的数据分析节点,包括其 `FQDN`, `PORT`, `STATUS`。 @@ -153,8 +157,74 @@ UPDATE ANODE {node_id} UPDATE ALL ANODES ``` -删除集群中的 ANode 的 SQL 语法如下: +删除集群中的 ANode 语法如下: ```sql DROP ANODE {anode_id} ``` -删除 ANode 不等于停止相应的进程。 +删除 ANode 只是将 ANode 从 TDengine 集群中删除,管理 ANode 的启停仍然需要使用`systemctl`命令。 + +### 时序数据分析功能 + +#### 时序数据异常检测 +异常窗口寻找时间序列中可能出现异常的多个时间区间,可基于此窗口边界,对数据进行聚合或标量查询。 + +```SQL +SELECT {aggregate_function} +FROM {subquery} +WHERE {filer_condition} +ANOMALY_WINDOW(column, options) +``` + +**语法说明** +1. column:进行时序数据异常检测的输入数据列,当前只支持单列输入,且只能是数值类型,不能是字符类型(例如:`NCHAR` `VARCHAR` `VARBINARY`等类型),**不支持函数表达式**。 +2. options:调用异常检测的算法,及与算法相关的参数。采用 逗号分隔的K/V字符串表示,其中的字符串不需要使用单引号、双引号、或转意号等符号,不能使用中文及其他宽字符。例如:`algo=ksigma, k=2` 表示进行异常检测的算法是 ksigma,该算法接受的输入参数是 2。 + +全部支持的参数列表如下: +|参数|含义|默认值| +|---|---|---| +|algo|异常检测调用的算法|iqr| +|wncheck|对输入数据列是否进行白噪声检查|取值为0或者1,默认值为 1,表示进行白噪声检查| + +异常检测的返回结果以窗口的形式呈现,因此窗口查询相关的伪列在这种场景下仍然可用。可以使用的伪列如下: +1. _WSTART: 异常窗口开始时间戳 +2. _WEND:异常窗口结束时间戳 +3. _WDURATION:异常窗口持续时间 + +**示例** + + + +**使用说明** +1. 异常检测的结果可以作为外层查询的子查询输入,在 `select` 子句中使用的聚合函数或标量函数与其他类型的窗口查询相同。 +2. 输入数据默认进行白噪声检查,如果检查结果是输入数据是白噪声,将不会有任何(异常)窗口信息返回。 + + +#### 时序数据预测 +数据预测以一段训练数据作为输入,预测接下来若干时间点的后续运行结果。其调用的语法如下: +```SQL +SELECT {pseudo_column}, forecast(column, options) from {subquery} where [where_clause] +``` + +**语法说明** +1. forecast:关键字 +2. column:预测的时序数据列。与异常检测相同,只支持数值类型输入。 +3. options:异常检测函数的参数,使用规则与 anomaly_window 相同 + +|参数|含义|默认值| +|---|---|---| +|algo|预测分析使用的算法|holtwinters| +|wncheck|白噪声(white noise data)检查|默认值为 1,0 表示不进行检查| +|conf|预测数据的置信区间范围 ,取值范围[0, 100]|95| +|every|预测数据的采样间隔|输入数据的采样间隔| +|start|预测结果的开始时间戳|无| +|rows|预测结果的记录数|无| + +预测查询结果新增了三个伪列,具体如下: +1. _FROWTS:预测结果的时间戳 +2. _FLOW:置信区间下界 +3. _FHIGH:置信区间上界。对于没有置信区间的预测算法,其置信区间同预测结果。 + +**示例** + + +**使用说明**