机器学习

冰西瓜60012 分钟前
人工智能·机器学习
从项目入手机器学习——(三)数据预处理(下)自动编码器本文会开始介绍目前机器学习中常用的自动化编码工具。大家可能有疑问,既然有自动化编码,为什么之前还要将手动编码呢?原因在于目前的自动化编码封装的非常好,以至于是完全的黑盒,不理解基础原理的人用起来就不知道它在做什么,因此还是希望大家能掌握了解自动编码在做什么。
ldccorpora33 分钟前
人工智能·深度学习·算法·机器学习·自然语言处理
GALE Phase 1 Chinese Broadcast News Parallel Text - Part 1数据集介绍,官网编号LDC2007T23GALE Phase 1 Chinese Broadcast News Parallel Text - Part 1(LDC2007T23)是 LDC 于 2007 年面向 DARPA GALE 项目发布的中 - 英平行文本语料,核心为中文广播新闻转写文本及其人工英译对,适配机器翻译(MT)训练与评测,是 GALE Phase 1 中文广播新闻平行文本的首期子库。以下是详细介绍:
Hcoco_me3 小时前
人工智能·深度学习·算法·机器学习·vllm
大模型面试题75:讲解一下GRPO的数据回放在GRPO(群体相对策略优化)训练LLM的过程中,数据回放就像学生的错题本+好题本——把之前训练中“表现好的样本”存起来,后续训练时再拿出来反复用,核心目的是防止模型“学了新的,忘了旧的”,同时还能节省计算资源。咱们还是从小白能懂的基础入手,一步步拆明白。
高洁014 小时前
深度学习·算法·机器学习·transformer·知识图谱
AIGC技术与进展(1)AIGC技术与进展(1)一、AIGC的发展历程 二、AIGC的核心技术 三、AIGC的重要进展#智能体搭建#多智能体#VLA#大模型#AI
算法狗24 小时前
人工智能·深度学习·机器学习·语言模型·面试题
大模型面试题:有以下哪些方式可以在 prompt 中插入指令?我整理好的1000+面试题,请看 大模型面试题总结-CSDN博客 或者https://gitee.com/lilitom/ai_interview_questions/blob/master/README.md
嘉嘉嘉7175 小时前
python·深度学习·机器学习
【day 52】神经网络调参指南@浙大疏锦行
gihigo19986 小时前
人工智能·算法·机器学习
竞争性自适应重加权算法竞争性自适应重加权算法(CARS)是一种用于光谱特征选择的有效方法,它结合了竞争性重加权和自适应筛选机制,能够从高维光谱数据中挑选出最具有代表性的特征变量。
renhongxia16 小时前
人工智能·深度学习·学习·机器学习·语言模型·自然语言处理
大型语言模型性能预测器:学习何时在混合人机-人工智能管理系统中升级随着大语言模型日益融入人在回路的内容审核系统,核心挑战在于如何判断何时可以信赖其输出,又何时需要提请人工复审。
田井中律.7 小时前
人工智能·机器学习
知识图谱(四)之LSTM+CRFCRF指的是在预测标签的时候会考虑全局的依赖关系,适用于序列标注等结构化预测任务马尔可夫性指的是只考虑最近预测值依赖当前的状态,和更早的状态无关.
Hcoco_me7 小时前
人工智能·深度学习·算法·机器学习·chatgpt·机器人
大模型面试题74:在使用GRPO训练LLM时,训练数据有什么要求?GRPO(群体相对策略优化)的核心是 “多答案对比选优”,训练数据的好坏直接决定模型能不能学会“挑出好答案”。咱们从小白能懂的基础要求,一步步讲到GRPO专属的进阶要求,保证深入浅出。
人工智能培训7 小时前
人工智能·深度学习·机器学习·大模型·aigc·ai工程师证书·ai证书
AIGC技术与进展(2)AIGC(人工智能生成内容)核心价值是通过文本、图像、音频、视频等多模态内容的自动化生成,实现降本增效、创意激发、个性化规模化交付,并推动产业模式与社会价值的双重升级,已成为企业数字化转型与内容生态重构的核心引擎。以下从核心价值维度、行业落地与社会价值展开说明。
Coding茶水间8 小时前
人工智能·深度学习·yolo·目标检测·机器学习
基于深度学习的交通事故检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)基于深度学习的交通事故检测系统演示与介绍目录视频演示1. 前言2. 项目演示2.1 用户登录界面2.2 新用户注册
人工干智能8 小时前
人工智能·机器学习
KFold时,两个关联“编号”的迭代器:`folds.split(...)` 和 `enumerate(...)`学校对一个年级进行分班时,需要班级编号以及各同学的位号,你对数据集进行K折时,也面临这一问题:样本位于第几折第几条?有趣的是:你让为很复杂的一件事,却一句话就可以解决: enumerate(folds.split(....))
Turboex邮件分享9 小时前
人工智能·机器学习·数据分析
邮件系统的未来趋势:AI、机器学习与大数据分析的融合应用随着人工智能与大数据技术的快速发展,传统的邮件系统正在向智能化、高效化演进。过去以规则驱动为核心的邮件处理机制,正在被更具适应性的算法模型所替代。AI与机器学习在邮件分类、垃圾邮件识别、邮件自动化处理等领域展现出强大的能力,而基于邮件的大数据分析也为企业带来用户洞察与精准营销的新机遇。本文将系统分析这些前沿技术在邮件系统中的应用趋势及其实现机制。
爱打代码的小林9 小时前
人工智能·机器学习
机器学习(数据清理)1.我们这里用的是矿物分类的数据表格最后一列为矿物类型共5类A,B,C,D,E作为数据标签,前面的矿物元素构成含量作为数据特征。
光羽隹衡9 小时前
人工智能·机器学习
机器学习——PCA数据降维PCA,全称主成分分析,本质上是一种数据压缩技术。是一种通用的降维工具它的核心目标的是在减少数据维度的同时,尽可能保留原始数据的关键信息。
ACERT3339 小时前
python·算法·机器学习
10.吴恩达机器学习——无监督学习01聚类与异常检测算法从本节开始,正式进入无监督学习课程部分聚类(Clustering)是机器学习领域的一种无监督学习方法,其核心目标是将数据集中的样本划分为若干个子集(称为簇,Cluster),使得同一簇内的样本之间相似度较高,而不同簇之间的样本相似度较低。聚类不需要预先标注的标签数据,而是通过样本自身的特征分布自动发现数据内在的结构模式。
Ai尚研修-贾莲9 小时前
人工智能·深度学习·机器学习·自然科学·时空建模·高维数据预处理·可解释ml/dl
自然科学领域机器学习与深度学习——高维数据预处理—可解释ML/DL—时空建模—不确定性量化-全程AI+Python场景随着观测技术、数值模拟与计算基础设施的迅猛发展,地球系统科学、生态学、环境科学等自然科学领域正迈入“大数据+智能模型”驱动的新阶段。传统的统计建模方法虽具可解释性,却难以应对高维、非线性、多源异构的复杂自然系统;而以机器学习和深度学习为代表的AI技术,正为科学发现提供强大工具。更进一步,以大模型(Foundation Models) 为代表的新型人工智能范式,正在重塑数据密集型科研的边界,为遥感反演、气候模拟、污染物溯源等任务带来前所未有的泛化与迁移潜力。
赵域Phoenix9 小时前
深度学习·机器学习
赵煜的时序建模学习手札——三种路线概览(统计学/机器学习/深度学习)时序建模属实是一个令人困惑的抽象概念,因为它被不分场合的混用 (统计学、机器学习、深度学习),术语定义也较为模糊。
儒雅的晴天10 小时前
机器学习
记录xgboost等基于决策树的集成模型存在的问题最近做基于辐照度的光伏预测,在数据量很少的情况下,采用xgboost遇到一个问题,就是预测值在正午时分全部是一样的,经过多轮测试及与豆包对话找到了原因。