术语表

属性

数据集中某一列的名称/标签。通常被称为变量,有时在文献中被称为特征,但我们对属性和特征进行了具体区分。

特征

一个属性和该属性的可能值的组合。

实例

一个数据实例是一个数据集的一个数据条目/记录/样本。

元数据

描述实际数据集的信息/数据。

数据清洗

一个数据处理程序,将数据转换成符合机器学习工具要求的格式。包括处理缺失的数据。

N元

一个N元函数是一个需要N个参数的函数。

内省

检查一个预测模型,获得对其工作方式的感知。