From 05e5c543a0ce4c7780dba413990c41e450bb1880 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E8=8B=A5=E5=A6=82=E6=84=8F?= <43609390+ruyiluo@users.noreply.github.com> Date: Thu, 19 Dec 2024 16:27:25 +0800 Subject: [PATCH] Update ch4.1.md MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 更新错别字 --- docs/ch04/ch4.1.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/ch04/ch4.1.md b/docs/ch04/ch4.1.md index 01d43fa8..0f868c79 100644 --- a/docs/ch04/ch4.1.md +++ b/docs/ch04/ch4.1.md @@ -830,7 +830,7 @@ - embedding如何设置维度?越大越好还是越小越好? - 维度越低越粗糙,拟合能力就有限; - - 阅读越高越细致,但是需要更多数据集才能训练,但是容易维度灾难,而且容易过拟合; + - 维度越高越细致,但是需要更多数据集才能训练,但是容易维度灾难,而且容易过拟合; - 个人经验是需要结合特征的取值和分布、特征实际的业务意义、问题规模、经验参数,反复调参迭代、优化得到; - transformer中计算attention除于根号d的作用