机器学习

田井中律.12 分钟前
人工智能·机器学习
知识图谱(四)之LSTM+CRFCRF指的是在预测标签的时候会考虑全局的依赖关系,适用于序列标注等结构化预测任务马尔可夫性指的是只考虑最近预测值依赖当前的状态,和更早的状态无关.
Hcoco_me17 分钟前
人工智能·深度学习·算法·机器学习·chatgpt·机器人
大模型面试题74:在使用GRPO训练LLM时,训练数据有什么要求?GRPO(群体相对策略优化)的核心是 “多答案对比选优”,训练数据的好坏直接决定模型能不能学会“挑出好答案”。咱们从小白能懂的基础要求,一步步讲到GRPO专属的进阶要求,保证深入浅出。
人工智能培训38 分钟前
人工智能·深度学习·机器学习·大模型·aigc·ai工程师证书·ai证书
AIGC技术与进展(2)AIGC(人工智能生成内容)核心价值是通过文本、图像、音频、视频等多模态内容的自动化生成,实现降本增效、创意激发、个性化规模化交付,并推动产业模式与社会价值的双重升级,已成为企业数字化转型与内容生态重构的核心引擎。以下从核心价值维度、行业落地与社会价值展开说明。
Coding茶水间1 小时前
人工智能·深度学习·yolo·目标检测·机器学习
基于深度学习的交通事故检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)基于深度学习的交通事故检测系统演示与介绍目录视频演示1. 前言2. 项目演示2.1 用户登录界面2.2 新用户注册
人工干智能2 小时前
人工智能·机器学习
KFold时,两个关联“编号”的迭代器:`folds.split(...)` 和 `enumerate(...)`学校对一个年级进行分班时,需要班级编号以及各同学的位号,你对数据集进行K折时,也面临这一问题:样本位于第几折第几条?有趣的是:你让为很复杂的一件事,却一句话就可以解决: enumerate(folds.split(....))
Turboex邮件分享2 小时前
人工智能·机器学习·数据分析
邮件系统的未来趋势:AI、机器学习与大数据分析的融合应用随着人工智能与大数据技术的快速发展,传统的邮件系统正在向智能化、高效化演进。过去以规则驱动为核心的邮件处理机制,正在被更具适应性的算法模型所替代。AI与机器学习在邮件分类、垃圾邮件识别、邮件自动化处理等领域展现出强大的能力,而基于邮件的大数据分析也为企业带来用户洞察与精准营销的新机遇。本文将系统分析这些前沿技术在邮件系统中的应用趋势及其实现机制。
爱打代码的小林2 小时前
人工智能·机器学习
机器学习(数据清理)1.我们这里用的是矿物分类的数据表格最后一列为矿物类型共5类A,B,C,D,E作为数据标签,前面的矿物元素构成含量作为数据特征。
光羽隹衡2 小时前
人工智能·机器学习
机器学习——PCA数据降维PCA,全称主成分分析,本质上是一种数据压缩技术。是一种通用的降维工具它的核心目标的是在减少数据维度的同时,尽可能保留原始数据的关键信息。
ACERT3333 小时前
python·算法·机器学习
10.吴恩达机器学习——无监督学习01聚类与异常检测算法从本节开始,正式进入无监督学习课程部分聚类(Clustering)是机器学习领域的一种无监督学习方法,其核心目标是将数据集中的样本划分为若干个子集(称为簇,Cluster),使得同一簇内的样本之间相似度较高,而不同簇之间的样本相似度较低。聚类不需要预先标注的标签数据,而是通过样本自身的特征分布自动发现数据内在的结构模式。
Ai尚研修-贾莲3 小时前
人工智能·深度学习·机器学习·自然科学·时空建模·高维数据预处理·可解释ml/dl
自然科学领域机器学习与深度学习——高维数据预处理—可解释ML/DL—时空建模—不确定性量化-全程AI+Python场景随着观测技术、数值模拟与计算基础设施的迅猛发展,地球系统科学、生态学、环境科学等自然科学领域正迈入“大数据+智能模型”驱动的新阶段。传统的统计建模方法虽具可解释性,却难以应对高维、非线性、多源异构的复杂自然系统;而以机器学习和深度学习为代表的AI技术,正为科学发现提供强大工具。更进一步,以大模型(Foundation Models) 为代表的新型人工智能范式,正在重塑数据密集型科研的边界,为遥感反演、气候模拟、污染物溯源等任务带来前所未有的泛化与迁移潜力。
赵域Phoenix3 小时前
深度学习·机器学习
赵煜的时序建模学习手札——三种路线概览(统计学/机器学习/深度学习)时序建模属实是一个令人困惑的抽象概念,因为它被不分场合的混用 (统计学、机器学习、深度学习),术语定义也较为模糊。
儒雅的晴天3 小时前
机器学习
记录xgboost等基于决策树的集成模型存在的问题最近做基于辐照度的光伏预测,在数据量很少的情况下,采用xgboost遇到一个问题,就是预测值在正午时分全部是一样的,经过多轮测试及与豆包对话找到了原因。
格林威3 小时前
人工智能·opencv·机器学习·计算机视觉·视觉检测·工业相机·堡盟相机
纹理表面缺陷分析:利用频域变换检测织物疵点的 6 种技术,附 OpenCV+Halcon 实战代码!在织物外观检测中,你是否常被这些问题困扰?织物疵点 ≠ 随机斑点 它的本质是:局部破坏了纹理的周期性或方向性,而频域正是描述“重复模式”的天然语言
computersciencer4 小时前
人工智能·机器学习·最小二乘法
详细讲解最小二乘法名称的由来最小二乘法是一种典型的数学优化技术,其目的是通过最小化误差函数(也称为成本函数、损失函数)而求得最优的解。名称中关键的词语就是"最小"、“二乘”,名称的英文为"Least Squares"。所谓最小就是使误差函数最小,"二乘"就是指的平方,因此,最小二乘法又称为最小平方法。
式5164 小时前
人工智能·机器学习
RAG检索增强生成基础(一)RAG基础原理RAG,全称Retrive Augment Generate,检索增强生成。大模型使用RAG技术主要原因在于其所使用的数据集的不完全,比如数据集的非即时性、缺乏专业领域数据等等。
格林威5 小时前
人工智能·opencv·安全·机器学习·计算机视觉·视觉检测·工业相机
线缆外皮破损检测:保障电气安全的 7 个核心策略,附 OpenCV+Halcon 实战代码!在线缆安全质检中,你是否常被这些问题困扰?外皮破损检测 ≠ 简单边缘分析 它要求在复杂光照、弯曲扭转条件下,精准识别裂纹、划伤、剥离、鼓包等多类型缺陷——任何一处破损都可能导致电气安全事故
CCPC不拿奖不改名5 小时前
人工智能·机器学习·语言模型
大语言模型基础:大语言模型核心原理(大语言模型和传统的机器学习的差异)要理解 大语言模型(LLM) 与 传统机器学习(Traditional ML) 的核心差异,我们可以从 学习方式、能力范围、技术架构 等维度用通俗的方式对比:
ldccorpora5 小时前
人工智能·深度学习·算法·机器学习·自然语言处理·语音识别
GALE Phase 1 Distillation Training数据集介绍,官网编号LDC2007T20GALE Phase 1 Distillation Training(LDC2007T20)是 LDC 为 DARPA GALE 计划构建、2007 年发布的信息提炼(Distillation)任务训练数据集,核心用于训练多语言文本 / 语音的信息抽取与知识整合模型,以人工标注的查询 - 事实(nugget)映射为核心特色LDC。以下是详细介绍:
木头程序员5 小时前
图像处理·人工智能·深度学习·机器学习·计算机视觉·语言模型
生成式AI可靠性与可控性技术研究:从真实性到可控编辑摘要:生成式AI技术(以大语言模型LLM、图像生成模型AIGC为代表)的快速迭代,推动了内容创作、智能交互等领域的革新,但同时也面临真实性失真、版权归属模糊、价值观偏差及生成结果不可控等核心问题。本文聚焦生成式AI可靠性与可控性的四大核心方向——生成内容真实性检验、版权溯源、价值观对齐、可控编辑技术,系统剖析各技术的核心原理、主流方案与研究进展,对比大语言模型与图像生成模型的技术差异,探讨当前实践挑战与未来发展路径,为技术研发与工程落地提供参考。
咚咚王者6 小时前
人工智能·python·机器学习
人工智能之核心基础 机器学习 第十五章 数据预处理第十五章 数据预处理💡 关键:⚠️ 注意:填充必须在训练集拟合,再应用于测试集,避免数据泄露!💡 重要原则: 不要盲目删除异常值!先问业务:这是错误数据,还是真实但稀有的情况?