机器学习——机器学习基础与数学工具|白晔晔晔Daily

写在开始之前：本笔记内容是基于西北工业大学2026春季学期本科模式识别与机器学习内容以及全班同学的笔记内容整理而成，在此感谢主讲老师朱老师以及各位助教的辛苦付出，也感谢各位同学帮助我整理这份笔记！

机器学习的核心目标，是从数据中学习到输入到输出的映射规律，从而实现对未知数据的预测与决策。机器学习的本质是寻找最优预测函数的过程：预测函数 f 接收输入 x，并产生对应的输出 y，即 y = f(x)。我们的目标是在所有可能的函数中，找到最贴合数据规律的最优映射关系。

1. 机器学习基本定义与损失函数

- 机器学习的核心定义（函数族与参数空间）

- 损失函数与最优参数的数学表达

- 均方误差（MSE）

2. 信息熵、交叉熵与 KL 散度

- 自信息（Self-information）

- 信息熵（Shannon Entropy）

- 交叉熵（Cross-Entropy）

- KL 散度（Kullback-Leibler Divergence）

- 熵、交叉熵、KL 散度的核心关系

3. NumPy 核心原理与应用

- NumPy 的核心对象：ndarray 与 ufunc