导航
如果你刚刚入门机器学习,会接触到了非常多的概念。比如人工智能,机器学习,深度学习,神机网络,强化学习,各种算法等等。首先了解这些知识点所在的层级,以便进一步的深入学习。
一、 人工智能,机器学习,深度学习和传统学习
人工智能是一种模拟人类智能 的技术或系统。
机器学习是一种人工智能的分支,机器学习的核心思想是让机器从数据中学习模式,从而能够在未见过的数据上做出预测或决策。(注:我的理解是通过使用计算机或其它机器来实现人工智能的方法)
深度学习深度学习是机器学习的一种子领域,即是众多机器学习算法中的一种,它专注于使用深层神经网络来解决复杂的模式识别和特征提取任务。因为它在解决许多复杂的模式识别和数据分析任务中取得了显著的成就,所以被总是被单独提起,甚至作为很多书籍特意讲解深度学习。
机器学习除了著名的深度学习意外,还有以下一些常见算法,它们也被称为传统算法:
线性回归 (Linear Regression):用于建立输入特征与输出之间的线性关系,用于预测连续值输出。
逻辑回归 (Logistic Regression):用于分类问题,将输入特征映射到二元分类或多元分类输出。
决策树 (Decision Trees):基于特征的条件分割数据,用于分类和回归任务。
随机森林 (Random Forest):由多个决策树组成的集成方法,用于提高分类和回归的准确性。
支持向量机 (Support Vector Machines,SVM):寻找超平面来分隔不同类别的数据点,用于分类和回归问题。
朴素贝叶斯 (Naive Bayes):基于贝叶斯定理的概率方法,用于文本分类和其他分类任务。
K近邻算法 (K-Nearest Neighbors,KNN):通过找到最接近新数据点的K个训练样本来进行分类或回归。
K均值聚类 (K-Means Clustering):将数据分为K个不同的簇,用于无监督聚类任务。
主成分分析 (Principal Component Analysis,PCA):用于降维,将数据映射到较低维度的空间,保留主要特征。
线性判别分析 (Linear Discriminant Analysis,LDA):用于降维和分类,将数据投影到可以最大程度区分不同类别的子空间。
提升算法 (Boosting):通过迭代训练多个弱分类器,将它们组合成一个强分类器,如AdaBoost。
贝叶斯网络(Bayesian Networks):用于建模变量之间的概率关系,进行概率推理和预测。
我们在学习机器学习,其实就是在学习机器学习和应用这些算法。
二、数学基础
机器学习需要一定的高校的数学基础,即数学三大件,高数,线代,概率论。你可以在学习机器学习之前,先补充相关的知识,这里非常推荐3Blue1brown 的视频,他简明扼要,使用3D图像的方式展示数学的本质,在开始某门数学之前,我非常建议先看完他的事情,对核心有一个大致的了解,对以后的深入学习是事倍功半的:
3BlueBrown 视频合集列表
如果你已经在职,或者是不想重头开始学习数学,那么你或许可以和我一样,先开始看机器学习的算法,比如线性回归开始,遇到不理解的数学再开始查阅资料学习。比如在线性回归中,你会遇到矩阵的概念,如果你发现你不理解什么是矩阵,或者只是有一个非常模糊的概念,或者忘记如何运算,那么你可以搜索矩阵,这样就可以补充这块是数学知识。
另外,你可能会参考某一个本机器学习的教材或某一本书籍,如果某一章节你难以看懂,那就将主要主要在把主题放到搜索引擎上,看到更多的人是如何解释这个算法的。
目前对于常见的算法,已经有非常多的教程。你很可能换了二三个视频以后,发现茅塞顿开。
三、编程语言
理论上我们可以使用任何编程语言,但是目前最受欢迎的是python,所以如果你想学习机器学习,我也建议你学习python语言,他的基础语法非常简单,可能一周就可以掌握了。
接下来,我们从线性回归这个简单的机器学习开始作为入门,使用python来作为我们第一个机器学习的算法和实践。