常见机器学习算法简介：回归、分类与聚类

机器学习说到底，不就三件事：

别背术语，别管定义，先看问题怎么解决。

干嘛的？

模型输出一个连续数值。你丢个样本进去，它告诉你大概是多少。

应用场景：

代码风格示例：

python 复制代码

from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

注意点：

模型选择建议：

干嘛的？

模型判断输入属于哪个"类"，就像做选择题一样，A、B、C三选一。

应用场景：

代码风格示例：

python 复制代码

from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

注意点：

模型选择建议：

干嘛的？

模型自己发现数据结构，把相似的放一堆，没标签也能干。

应用场景：

代码风格示例：

python 复制代码

from sklearn.cluster import KMeans

model = KMeans(n_clusters=3)
model.fit(X)
labels = model.labels_

注意点：

模型选择建议：

学机器学习不是看你会几个模型，而是看你知道什么时候用哪个模型，用什么数据喂进去。

下一篇我接着写《模型评估指标怎么选？怎么解释？》，这一步你要是乱选，模型再准也白搭。