跳到主要内容

选修模块:经典 ML 补充算法

模块定位

这些算法在很多中小数据任务里仍然很有价值,学它们是为了补全判断工具箱。

学习目标

  • 理解 经典机器学习补充 模块在整条学习路径里的定位
  • 知道本模块每一节课分别解决什么问题
  • 明确适合先学哪些、后学哪些
  • 用一个最小示例快速建立直觉

一、这个模块在解决什么问题?

1.1 模块定位

经典机器学习补充 不是为了“多学一点内容”,而是为了补上某类经常决定工程上限的能力。

你可以先把它理解成一组专题工具箱:

  • 遇到相关项目时再回来看
  • 不必一次学完
  • 但一旦进入对应场景,它们会非常有价值

1.2 建议学习顺序

比较稳妥的学习方式通常是:

  1. 先看总览,知道每节课大概做什么
  2. 先做最基础、最能马上派上用场的主题
  3. 再进入更偏工程或更偏项目的内容

二、本模块包含哪些主题?

2.1 章节清单

文件主题
01-svm.md-svm
02-knn.mdK 近邻
03-naive-bayes.md-naive-bayes
04-lda.md-lda

2.2 应该怎么使用这份模块?

一个很实用的策略是:

  • 先用主线课程把整体跑通
  • 遇到专项需求时,再回到选修模块精修

这样不会因为专题太多而丢掉主线节奏。


三、一个最小可运行示例

运行提示
pip install numpy scikit-learn
import numpy as np
from sklearn.svm import SVC

X = np.array([[0, 0], [1, 1], [1, 0], [0, 1]])
y = np.array([0, 1, 1, 0])

clf = SVC(kernel="linear")
clf.fit(X, y)
print(clf.predict([[0.8, 0.9]]))

3.2 这个示例想让你抓住什么?

这一小段代码不是为了覆盖整个模块,而是为了帮你迅速建立一个“这个模块到底在做什么”的感觉。

阅读时优先看三件事:

  • 输入是什么
  • 中间过程发生了什么
  • 输出如何对应到实际项目

四、学习建议

4.1 如果时间有限,优先学什么?

优先学那些会在后续项目里高频出现、能立刻帮你降成本或提效率的主题。

4.2 常见误区

  • 看到是选修就完全不学
  • 一上来想把所有选修全刷完
  • 只看概念,不跑最小示例

小结

这份总览页的作用是给你一张地图。真正学模块时,不必追求“全都懂”,而是要知道什么时候该回来、先补哪一块。