这节课主要介绍机器学习问题的一些分类。
Learning with Different Output Space $\mathcal{Y}$
按照数据的输出,可以把 ML 分为以下几类:
- 二类别分类问题:$\mathcal{Y} \in \{0, 1\}$
- 多类别分类问题:$\mathcal{Y} \in \{0, 1, \cdots, K\}$
- 回归问题:$\mathcal{Y} \in R$
- 结构学习
Learning with Different Data Label $y_n$
按照数据的标签,可以把 ML 分为以下几类:
- supervised: 所有 $x_n$ 都具有 $y_n$
- unsupervised: 所有 $x_n$ 都没有 $y_n$
- semi-supervised: 一些 $x_n$ 具有 $y_n$
Learning with Different Protocol $f$
按照数据的传输方式,可以把 ML 分为以下几类:
- batch: 一次性把所有的数据给算法
- online: 连续的数据,一次处理一个数据
- active: 机器通过主动询问某些问题来学习
Learning with Different Input Space $\mathcal{X}$
按照数据的输入,可以把 ML 分为以下几类:
- concrete: 精细的、复杂的、有序的,已经完成预处理的数据
- raw: 原始的,未经处理或者经过很少处理的数据
- abstract:抽象的,无法轻易表明含义的数据