K折交叉验证的步骤是什么?

K折交叉验证的主要步骤为:
i、将数据随机分成K等份
将所有样本随机分成K个相同大小的集合。
通常K取值5或10。

ii、循环验证
对于每一份:

  1. 用其余K-1份数据作为训练集
  2. 用这一份数据作为验证集
  3. 训练模型,计算模型在验证集上的指标
  4. 重复1-3,直到所有K份数据都用做验证集一次

iii、平均效果
将K次验证的平均效果作为最终的效果。

iv、模型适用性
K折交叉验证可以验证模型在多个数据集上的适用性。
避免由单个数据集划分带来的偏差。

v、利用全部数据
K折交叉验证可以有效地利用所有数据。
每份数据既用于训练又用于测试。

vi、数据增强
K折交叉验证可以重复K次,有利于数据增强。
通过在不同的K个数据集上训练,可以增强模型。

总的来说,K折交叉验证的主要步骤为:

  1. 将所有数据随机分成K份
  2. 每次使用K-1份数据进行训练
  3. 使用1份数据测试
  4. 不断循环直到K次
  5. 计算K次平均效果
  6. 验证模型在不同数据集上的适用性
  7. 更好地利用所有数据
  8. 对K折重复,有利于数据增强

其中:

  1. 数据分成K份
  2. K次验证,平均效果
  3. 避免数据集偏差
  4. 更充分利用数据
  5. 增加模型鲁棒性