Merge pull request #28730 from taosdata/doc/analysis

doc: refactor docs.
This commit is contained in:
Shengliang Guan 2024-11-11 17:31:50 +08:00 committed by GitHub
commit 7231580169
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194
12 changed files with 16 additions and 5 deletions

View File

@ -3,7 +3,6 @@ title: "安装部署"
sidebar_label: "安装部署"
---
## 安装部署
### 环境准备
ANode 要求节点上准备有 Python 3.10 及以上版本,以及相应的 Python 包自动安装组件 Pip同时请确保能够正常连接互联网。

View File

@ -6,6 +6,7 @@ sidebar_label: "数据分析预处理"
## 时序数据分析功能
在针对时序数据进行高级分析之前首先进行数据的白噪声检查White Noise Data check, WND。白噪声时序数据可以简单地认为是随机数构成的时序数据序列这种类型的序列没有分析的价值因此会直接返回空的结果。整体的流程如下图所示。
<img src="./pic/activity.png" width="560" alt="流程图" />
### 白噪声检查

View File

@ -1,3 +1,7 @@
---
title: 预测算法
description: 预测算法
---
#### 时序数据预测
数据预测以一段训练数据作为输入,预测接下来一个连续时间区间内,时序数据的趋势。

View File

@ -1,8 +1,14 @@
---
title: 异常检测算法
description: 异常检测算法
---
#### 时序数据异常检测
异常检测是针对输入的时序数据,使用预设或用户指定的算法确定时间序列中**可能**出现异常的时间序列点,对于时间序列中若干个连续的异常点,将自动合并成为一个连续的(闭区间)异常窗口。对于只有单个点的场景,异常窗口窗口退化成为一个起始时间和结束时间相同的点。
异常检测生成的异常窗口受检测算法和算法参数的共同影响,对于异常窗口范围内的数据,可以应用 TDengine 提供的聚合和标量函数进行查询或变换处理。
对于输入时间序列 (1, 20), (2, 22), (3, 91), (4, 120), (5, 18), (6, 19)。系统检测到 (3, 91), (4, 120) 为异常点,那么返回的异常窗口是闭区间 [3, 4]。
<img src="../pic/anomaly-detection.png" width="560" alt="异常检测" />
##### 语法
@ -60,4 +66,4 @@ Query OK, 1 row(s) in set (0.028946s)
- grubbs
- lof
- shesd
- tac
- tac

View File

@ -12,10 +12,11 @@ TDgpt 运行在部署于 TDengine 集群中的 Analysis Node (ANode)中。每个
<img src="./pic/data-analysis.png" width="560" alt="TDgpt架构图" />
通过注册指令语句,将 ANode 注册到 MNode 中就加入到 TDengine 集群,查询会按需向其请求数据分析服务。请求服务通过 VNode 直接向 ANode 发起,用户则可以通过 SQL 语句直接调用 ANode 提供的服务。
通过注册指令语句,将 ANode 注册到 MNode 中就加入到 TDengine 集群,查询会**按需**向其请求数据分析服务。ANode 不直接接收用户的数据分析请求。用户可通过SQL语句间接使用 ANode 提供的分析服务。
TDgpt 提供的高级数据分析功能分为时序数据异常检测和时序数据预测两类。
TDgpt 提供的高级数据分析功能分为时序数据异常检测和时序数据预测两类。
时序数据异常检测的结果采用异常窗口的形式提供,即分析系统自动将连续的异常数据以时间窗口的形式返回,其使用方式与 TDengine 中其他类型的时间窗口类似。特别地,可以将异常时序数据窗口视作为一种特殊的**事件窗口Event Window**,因此事件窗口可应用的查询操作均可应用在异常窗口上。如下图所示,分析平台将返回时序数据异常窗口 [10:51:30, 10:54:40] (红色背景部分数据)。
时序数据预测是基于输入的时间序列数据,采用用户给定(或默认算法)输出输入数据之后的时间序列数据的预测值数据,预测产生的时序数据点需要由用户指定。
<img src="./pic/anomaly-detection.png" width="560" alt="异常检测" />

View File

Before

Width:  |  Height:  |  Size: 46 KiB

After

Width:  |  Height:  |  Size: 46 KiB

View File

Before

Width:  |  Height:  |  Size: 309 KiB

After

Width:  |  Height:  |  Size: 309 KiB

View File

Before

Width:  |  Height:  |  Size: 58 KiB

After

Width:  |  Height:  |  Size: 58 KiB