From 2f5301af842003b7bfb7851939fd365c6b612105 Mon Sep 17 00:00:00 2001 From: snowflowersnowflake <33081329+snowflowersnowflake@users.noreply.github.com> Date: Fri, 17 Jun 2022 16:05:24 +0800 Subject: [PATCH] Update ch20.md --- _docs/Bias and Variance/ch20.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/_docs/Bias and Variance/ch20.md b/_docs/Bias and Variance/ch20.md index a5e661a..bdaa0e2 100644 --- a/_docs/Bias and Variance/ch20.md +++ b/_docs/Bias and Variance/ch20.md @@ -3,7 +3,7 @@ title: 偏差和方差:误差的两大来源 permalink: /docs/ch20/ --- -假设你的训练集、开发集和测试集都来自相同的分布,那么每次你都应该试图去获取更多的训练数据,因为这样能单独提高性能,对吗? +假设你的训练集、开发集和测试集都服从同样的分布,那么每次你都应该试图去获取更多的训练数据,因为这样能单独提高性能,对吗? 拥有更多的数据是无害的,然而它并不总是如我们期望的那样有帮助。有时获取更多的数据可能是在浪费时间。那么,何时才应该添加数据呢?