Python实战:机器学习算法

本文将详细介绍Python中常用的机器学习算法,包括线性回归、逻辑回归、决策树、随机森林、支持向量机等。

一、引言

机器学习是人工智能的一个重要分支,它使计算机能够从数据中学习并做出决策。Python作为一门流行的编程语言,拥有丰富的机器学习库,如Scikit-learn、TensorFlow、Keras等,可以方便地进行机器学习的实践。

二、线性回归

线性回归是一种用于预测连续值的监督学习算法。在Python中,可以使用Scikit-learn库的LinearRegression类进行线性回归。

python 复制代码
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 创建数据集
X = [[1, 1], [1, 2], [2, 2], [2, 3]]
y = [1, 2, 2, 3]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建线性回归模型
model = LinearRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print("Mean squared error: ", mse)

三、逻辑回归

逻辑回归是一种用于预测二元分类标签的监督学习算法。在Python中,可以使用Scikit-learn库的LogisticRegression类进行逻辑回归。

python 复制代码
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# 创建数据集
X = [[0.5, 0.5], [0.75, 0.75], [1.0, 1.0], [1.25, 1.25]]
y = [0, 0, 1, 1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建逻辑回归模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy: ", accuracy)

四、决策树

决策树是一种用于分类和回归的监督学习算法。在Python中,可以使用Scikit-learn库的DecisionTreeClassifier类进行分类决策树。

python 复制代码
from sklearn.tree import DecisionTreeClassifier
# 创建数据集
X = [[2, 3], [3, 3], [3, 4], [5, 4]]
y = [0, 0, 1, 1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建决策树分类模型
model = DecisionTreeClassifier()
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy: ", accuracy)

五、随机森林

随机森林是一种集成学习算法,它由多个决策树组成。在Python中,可以使用Scikit-learn库的RandomForestClassifier类进行随机森林分类。

python 复制代码
from sklearn.ensemble import RandomForestClassifier
# 创建数据集
X = [[2, 3], [3, 3], [3, 4], [5, 4]]
y = [0, 0, 1, 1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建随机森林分类模型
model = RandomForestClassifier(n_estimators=10)
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy: ", accuracy)

六、支持向量机

支持向量机是一种用于分类和回归的监督学习算法。在在Python中,可以使用Scikit-learn库的SVC类进行支持向量机分类。

python 复制代码
from sklearn.svm import SVC
# 创建数据集
X = [[2, 3], [3, 3], [3, 4], [5, 4]]
y = [0, 0, 1, 1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建支持向量机分类模型
model = SVC(kernel='linear')
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy: ", accuracy)

七、总结

本文详细介绍了Python中常用的机器学习算法,包括线性回归、逻辑回归、决策树、随机森林、支持向量机等。在实际应用中,选择合适的机器学习算法非常重要。通常需要根据数据的特点和问题的需求来选择合适的算法。此外,模型的训练和优化也是机器学习中的关键环节,需要不断地调整参数和超参数,以获得更好的性能。在未来的学习中,我们可以进一步探索更多的机器学习算法,如神经网络、聚类算法、降维算法等,并深入了解它们的原理和应用。通过不断的学习和实践,我们可以更好地掌握机器学习技术,为解决实际问题提供有力的支持。

相关推荐
No0d1es16 分钟前
电子学会青少年软件编程(C/C++)5级等级考试真题试卷(2024年6月)
c语言·c++·算法·青少年编程·电子学会·五级
WBluuue41 分钟前
数学建模:智能优化算法
python·机器学习·数学建模·爬山算法·启发式算法·聚类·模拟退火算法
赴3351 小时前
矿物分类案列 (一)六种方法对数据的填充
人工智能·python·机器学习·分类·数据挖掘·sklearn·矿物分类
大模型真好玩1 小时前
一文深度解析OpenAI近期发布系列大模型:意欲一统大模型江湖?
人工智能·python·mcp
RPA+AI十二工作室1 小时前
亚马逊店铺绩效巡检_影刀RPA源码解读
chrome·python·rpa·影刀
一车小面包1 小时前
机器学习--决策树
决策树·机器学习
大阳1232 小时前
线程(基本概念和相关命令)
开发语言·数据结构·经验分享·算法·线程·学习经验
小艳加油2 小时前
Python机器学习与深度学习;Transformer模型/注意力机制/目标检测/语义分割/图神经网络/强化学习/生成式模型/自监督学习/物理信息神经网络等
python·深度学习·机器学习·transformer
weixin_307779133 小时前
VS Code配置MinGW64编译GNU 科学库 (GSL)
开发语言·c++·vscode·算法
Silence zero4 小时前
day43_2025-08-17
人工智能·深度学习·机器学习