(1) 为简便起见,该数据集来自斯坦福大学华裔教授吴恩达的机器学习公开课。
(2) 本章使用前一种形式,其等价的后一种形式将在后续神经网络或深度模型中使用。
(3) 这个概念来自线性代数,n个无关组可构成一个n维空间。
(4) 误差可分解成方差和偏倚两项之和,即e2=σ2+B2,其中方差过大引起的误差可通过加大训练样本来减小。但偏倚主要是模型不恰当引起的,如果误差过大主要是因为偏倚,则无论怎么加大样本都不能有效减少误差。
(5) 这个变换函数的反函数被称为连接函数,后面的广义线性模型会对此做进一步解释。
(6) 由于广义线性模型和一般线性模型首字母均是GLM,本书约定复数形式的GLMs为广义线性模型的缩写,单数形式的GLM为一般线性模型的缩写。
(7) 更一般的形式应该是线性预测部分、连接函数和方差函数(描述方差如何依赖于均值)三部分组成,本书不考虑方差随均值变化的情况。