Skip to content

模型选择

🕒 Published at:
训练误差和泛化误差
  • 训练误差:模型在训练数据上的误差
  • 泛化误差:模型在新数据上的误差
验证数据集和测试数据集
  • 验证数据集:一个用来评估模型好坏的数据集,例如拿出50%的训练数据,⭐不要和训练数据混在一起(模考?调整超参数,可能虚高,因为在验证数据集上调出来的精度,不一定能够代表在新数据上的泛化能力)
  • 测试数据集:只用一次的数据集,例如未来的考试,出价房子的实际成交价(高考)
K-则交叉验证
  • 在没有足够多数据时使用(这是常态)
  • 算法:
    • 将训练数据集分割成k块
    • For i = 1,...,K
      • 使用第i块作为验证数据集,其余作为训练数据集
    • 报告K个验证误差的平均
  • 常用K=5或10
参数和超参数
  • 参数:模型在训练过程中自动学习和更新的变量,是模型从数据中学到的,例如w和b,数量通常很大
  • 超参数:在模型训练开始前手动设置的变量,用于控制模型的结构或训练过程,例如与训练过程相关的学习率(learning rate)、批量大小(batch size)、epochs

过拟合和欠拟合

模型容量的高低,数据的简单复杂

简单复杂
正常欠拟合
过拟合正常
  • 模型容量:拟合各种函数的能力,低容量的模型难以拟合训练数据,高容量的模型可以记住所有的训练数据

给定一个模型种类,有两个主要因素:参数个数,参数值的选择范围

VC维
  • 统计学习理论的一个核心思想
  • 对于一个分类模型,VC等于一个最大的数据集的大小,不管如何给定标号,都存在一个模型对它进行完美分类,表示一个函数集能够打散的最大样本数目
  • 例如:在二维平面上,线性分类器的VC维是3
  • 可以衡量训练误差和泛化误差之间的间隔,但在深度学习很少使用
数据复杂度
  • 样本个数
  • 每个样本的元素数
  • 时间、空间结构
  • 多样性