机器学习:机器学习项目的完整周期

建立一个有价值的机器学习系统时,需要考虑和计划哪些步骤?

以语音识别为例演示机器学习项目的全周期:机器学习项目的第一步是对项目进行范围划分 ,即决定什么是项目和你想做什么,然后是收集数据 ,所以决定需要什么数据来训练你的机器学习系统,并为数据获取标签,这就是数据收集,在进行初始数据收集后,就可以开始训练模型 ,所以在这里,将训练一个语音识别系统,并进行错误分析 ,并迭代改进模型 ,进行误差分析或进行偏差方差分析,决定是否要收集更多的数据或者收集更多特定类型的数据,错误分析是为了提高学习算法的性能,重复这个过程,从训练模型到误差分析。收集更多数据,直到最终认为模型足够好,然后在生产环境中部署,让用户可以使用它,当部署 一个系统时,还希望确保继续监视系统的性能,并维护系统以防止性能变差,使它的性能恢复,有时并不像希望的那样有效,所以再次进行训练再次改进它,甚至获取更多的数据。

在训练了一个高性能的机器学习模型后,部署模型的一种常见方法是使用机器学习模型,在一个服务器中实现,将调用一个推理服务器,它的工作是把你的机器学习模型(你训练的模型)做出预测,一个推理服务器,它让模型根据输入反复做出预测,所以这是一个常见的模式,取决于实现的应用程序。需要根据所需的应用规模来决定使用什么样的软件工程,推理服务器能够做出可靠有效的预测,对于某些应用程序,部署过程可能需要一定数量的软件工程,如果只是在笔记本电脑或者一两个服务上运行它,也许不需要太多的软件工程,机器学习中有一个不断增长的领域叫做MLOPS,这代表机器学习操作,这是指构建、部署和维护机器学习系统,做所有这些事情,以确保机器学习模型是可靠的,并有良好的损耗监测,然后对模型进行适当的更新。

相关推荐
爱研究的小牛1 小时前
Runway 技术浅析(七):视频技术中的运动跟踪
人工智能·深度学习·计算机视觉·目标跟踪·aigc
DieYoung_Alive1 小时前
搭建深度学习框架+nn.Module
人工智能·深度学习·yolo
GOTXX1 小时前
修改训练策略,无损提升性能
人工智能·计算机视觉·目标跟踪
被制作时长两年半的个人练习生2 小时前
【pytorch】pytorch的缓存策略——计算机分层理论的另一大例证
人工智能·pytorch·python
霖大侠2 小时前
Adversarial Learning forSemi-Supervised Semantic Segmentation
人工智能·算法·机器学习
lexusv8ls600h2 小时前
AI - 如何构建一个大模型中的Tool
人工智能·langchain·llm
CQU_JIAKE3 小时前
3.29【机器学习】第五章作业&实现
人工智能·算法·机器学习
知来者逆3 小时前
LlaSMol—— 建立一个大型、高质量的指令调整数据集 SMolInstruct 用于开发一个化学任务的大语言模型
人工智能·gpt·语言模型·自然语言处理·llm·生物制药
数据猎手小k3 小时前
GEOBench-VLM:专为地理空间任务设计的视觉-语言模型基准测试数据集
人工智能·语言模型·自然语言处理·数据集·机器学习数据集·ai大模型应用
CQU_JIAKE3 小时前
3.27【机器学习】第五章作业&代码实现
人工智能·算法