机器学习：机器学习项目的完整周期

宋一诺332024-12-03 20:03

建立一个有价值的机器学习系统时，需要考虑和计划哪些步骤？

以语音识别为例演示机器学习项目的全周期：机器学习项目的第一步是对项目进行范围划分 ，即决定什么是项目和你想做什么，然后是收集数据 ，所以决定需要什么数据来训练你的机器学习系统，并为数据获取标签，这就是数据收集，在进行初始数据收集后，就可以开始训练模型 ，所以在这里，将训练一个语音识别系统，并进行错误分析 ，并迭代改进模型 ，进行误差分析或进行偏差方差分析，决定是否要收集更多的数据或者收集更多特定类型的数据，错误分析是为了提高学习算法的性能，重复这个过程，从训练模型到误差分析。收集更多数据，直到最终认为模型足够好，然后在生产环境中部署，让用户可以使用它，当部署一个系统时，还希望确保继续监视系统的性能，并维护系统以防止性能变差，使它的性能恢复，有时并不像希望的那样有效，所以再次进行训练再次改进它，甚至获取更多的数据。

在训练了一个高性能的机器学习模型后，部署模型的一种常见方法是使用机器学习模型，在一个服务器中实现，将调用一个推理服务器，它的工作是把你的机器学习模型（你训练的模型）做出预测，一个推理服务器，它让模型根据输入反复做出预测，所以这是一个常见的模式，取决于实现的应用程序。需要根据所需的应用规模来决定使用什么样的软件工程，推理服务器能够做出可靠有效的预测，对于某些应用程序，部署过程可能需要一定数量的软件工程，如果只是在笔记本电脑或者一两个服务上运行它，也许不需要太多的软件工程，机器学习中有一个不断增长的领域叫做MLOPS，这代表机器学习操作，这是指构建、部署和维护机器学习系统，做所有这些事情，以确保机器学习模型是可靠的，并有良好的损耗监测，然后对模型进行适当的更新。