图解人工智能(19)机器学习基本流程

讨论一下,在机器学习中,为什么对模型的测试不能在训练数据上进行,而是需要一个独立的测试集?

由于过拟合现象的存在,在训练数据上测试的性能再好,也不能反映在未知数据集上的性能。

另一方面,当一个系统实际部署时,遇到的绝大多数是没有见过的数据,

因此,只有在未知数据(即测试集)上测出的结果才能代表系统在实际运行中的性能。

相关推荐
aqi009 小时前
15天学会AI应用开发(十)把文本嵌入模型换成国产模型
人工智能·python·ai编程
MobotStone9 小时前
为什么在AI时代,“好奇心”成了最值钱的能力?
人工智能
武子康10 小时前
调查研究-200 llama.cpp b9754:一次很小但很关键的 Agent 工具调用修复
人工智能·agent·llama
Ralph_Salar10 小时前
从0到1搭建AI智能支付风控助手Stage1-RAG知识库升级 — 元数据让检索更精准
人工智能
武子康10 小时前
调查研究-199 MCP Zero-Touch OAuth:为什么它是 MCP 进入企业生产的关键门槛?
人工智能·agent·mcp
冬奇Lab10 小时前
每日一个开源项目(第144篇):ai-website-cloner-template - 一条命令、多 Agent 并行,把任意网站逆向成 Next.js 代码
前端·人工智能·开源
冬奇Lab10 小时前
AI 原生组织不是买工具,而是让等待消失
人工智能·工作流引擎
半个落月10 小时前
从数据集划分理解大模型的数据工程
人工智能
用户82997929439311 小时前
一文带你彻底搞懂claude code中的上下文压缩
人工智能