技术栈
机器学习
qq_28372005
11 分钟前
人工智能
·
机器学习
RecursiveCharacterTextSplitter 核心参数深度指南:chunk_size 与 chunk_overlap 原理、实战、调优全解
在基于大模型的 RAG 检索增强生成、文档智能处理、长文本摘要等实战场景中,RecursiveCharacterTextSplitter 已经成为 LangChain 生态中无可替代的文本分割工具。而决定分割效果、语义完整性、AI 理解准确率的两大核心参数,正是 chunk_size(单块最大长度) 和 chunk_overlap(块间重叠长度)。
SilentSamsara
2 小时前
开发语言
·
人工智能
·
python
·
算法
·
机器学习
迭代器协议:`__iter__` / `__next__` 的完整执行流程
这段代码每个 Python 程序员都写过:输出是三行名字,没有异议。问题是:Python 在执行 for name in names 这一行时,具体做了什么?
逻辑君
2 小时前
人工智能
·
神经网络
·
机器学习
认知神经科学研究报告【20260045】
测试目标:验证系统能否从零开始,自主发现并实现一个能正确执行斐波那契数列计算的8位CPU架构。测试方法:仅给定硬件组件的基本物理性质(如程序计数器能存储地址、寄存器能读写数据、算术单元能执行加法等)和斐波那契测试程序的期望输出(内存地址0x10-0x14依次为0,1,1,2,3)。系统自主搜索组件组合、指令编码和控制逻辑。
源码之家
3 小时前
python
·
机器学习
·
信息可视化
·
数据分析
·
flask
·
课程设计
计算机毕业设计:Python医疗数据分析可视化系统 Flask框架 随机森林 机器学习 疾病数据 智慧医疗 深度学习(建议收藏)✅
博主介绍:✌全网粉丝50W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅
初心未改HD
3 小时前
人工智能
·
机器学习
·
逻辑回归
机器学习之逻辑回归详解
逻辑回归(Logistic Regression)是机器学习中最基础且应用最广泛的分类算法之一。尽管名字中带有“回归”二字,但它实际上是一种经典的分类算法,主要用于解决二分类和多分类问题。本文将从几何回归的原理出发,详细介绍Sigmoid函数、决策边界、损失函数、梯度下降求解等核心概念,并进一步扩展到多分类逻辑回归和正则化技术。最后,通过多个完整的Python代码示例,帮助读者快速掌握逻辑回归的实战技能。
Yuezero_
3 小时前
人工智能
·
算法
·
机器学习
Latent Manifold理论分析
https://arxiv.org/pdf/2603.21085:https://arxiv.org/pdf/2509.20177 《Generative Model Inversion Through the Lens of the Manifold Hypothesis》: MIA 论文指出,生成式反演(Inversion)本质上是通过生成器的雅可比矩阵 JGJ_GJG 将“噪声梯度”投影到“切空间”的过程。指标关联: 如果 PAE 的局部流形连续性好(即 JGJ_GJG 具有平滑的谱分布),那么 D
摸鱼仙人~
3 小时前
人工智能
·
机器学习
·
自动驾驶
自动驾驶经验迁移到AI编码的可行性与方法论研究
从自动驾驶领域提炼成熟的安全工程和开发实践,探索其向“AI 编码”场景(即使用大语言模型辅助软件需求分析、代码生成、测试、部署与维护等全生命周期)的迁移可行性。自动驾驶系统强调安全第一,其设计考虑功能安全(ISO 26262)、预期功能安全(SOTIF/ISO 21448)等要求,通过多传感器融合与冗余保障容错能力、利用仿真场景和闭环验证提升覆盖度,并引入在线监控和远程人机协作来实现“最小风险状态”(Minimal Risk Condition)处置【58†L35-L37】【43†L54-L59】。
硅谷秋水
3 小时前
机器学习
·
计算机视觉
·
语言模型
·
机器人
MotuBrain:一种用于机器人控制的高级世界动作模型
26年4月来自生数公司MotuBrain团队的论文“MotuBrain: An Advanced World Action Model for Robot Control”。
摸鱼仙人~
4 小时前
人工智能
·
机器学习
·
自动驾驶
AI Coding与自动驾驶技术的深度类比及幻觉问题解决方案借鉴
AI coding和自动驾驶是当前AI技术落地最成功、影响最深远的两个领域。它们不仅在技术架构、发展路径上惊人地相似,更面临着几乎相同的核心挑战——AI幻觉与可靠性问题。自动驾驶行业经过十余年的工程化探索,已经形成了一套成熟的解决幻觉和提升准确性的方法论,这些经验对于改良AI coding具有极高的借鉴价值。
Elaine336
4 小时前
人工智能
·
机器学习
·
华为云
机器学习概述
前言 本章内容包括对机器学习基础,发展历程,应用场景,开发流程和经典学习算法分类等概念,并开始系统机器学习的第一步,掌握其涉及的基本概念和术语,并对各个经典机器学习算法进行系统学习。
初心未改HD
4 小时前
人工智能
·
机器学习
·
线性回归
机器学习之线性回归与岭回归详解
线性回归与岭回归是机器学习中最基础、最重要的监督学习算法之一,广泛应用于房价预测、销量分析、金融风控等实际场景。本文从原理出发,详细推导线性回归的假设函数、损失函数、正规方程与梯度下降求解方法,并扩展到多元线性回归与特征缩放;随后介绍岭回归的L2正则化机制及其防止过拟合的原理;最后通过scikit-learn提供多个完整可运行的Python实战示例,涵盖单变量线性回归、多元线性回归、岭回归与普通线性回归对比,以及真实数据集上的综合应用。通过本文,读者可全面掌握线性回归与岭回归的理论与实践,能够在实际项目中
数据门徒
4 小时前
神经网络
·
机器学习
·
支持向量机
神经网络原理 第六章:支持向量机
支持向量机 是在第2章统计学习理论基础上发展起来的一类有教师学习机器。与多层感知器(基于经验风险最小化)不同,SVM遵循结构风险最小化原则,通过最小化经验风险与置信区间之和,旨在获得更好的泛化能力。
情绪总是阴雨天~
4 小时前
人工智能
·
深度学习
·
机器学习
机器学习与深度学习核心问题解决方案:过拟合与样本不均衡
在机器学习和深度学习的实际应用中,过拟合和样本不均衡是两个最常见且最棘手的问题。过拟合会导致模型在训练集上表现优异,但在测试集和真实场景中泛化能力极差;样本不均衡则会使模型偏向于多数类,对少数类的识别效果大打折扣,这在医疗诊断、欺诈检测、异常检测等关键领域可能造成严重后果。
AI科技星
4 小时前
人工智能
·
算法
·
决策树
·
机器学习
·
数学建模
·
数据挖掘
·
机器人
基于代数拓扑与等腰梯形素数对网格【乖乖数学】
作者:乖乖数学定稿归档日期:2026年05月12日体系归属:全域数学·几何数论本文将同胚、同构、同伦、同调等代数拓扑核心理论与初等数论深度结合,构建等腰梯形素数对网格离散拓扑空间,建立网格与数论区间一一对应关系。依托拓扑连通性、规范数论区间嵌套,继承连通性结构构建线性代数空间;以同伦形变刻画偶数等和线演化,利用同调闭链非空交集原理,以代数拓扑底层逻辑弥补传统数论证明在分布估计与逻辑断层上的固有缺陷。
糖炒栗子0326
4 小时前
人工智能
·
笔记
·
机器学习
最小二乘优化笔记:从损失函数、正则项到 BA / 图优化
在进行轻量级sfm拼图开发时联想到神经网络的优化,实际上绝大多数算法问题都可以表述为优化问题。两者的异同点以及最小二乘法优化的一些相关知识记载如下:
AI科技星
4 小时前
人工智能
·
线性代数
·
机器学习
·
量子计算
·
agi
第 24 分册:濒死体验与灵魂出窍·数理修行篇(2026 年 5 月 11 日增补版)
第24分册 濒死体验与灵魂出窍 · 数理修行篇增补:《参同契》及道家诸典籍全域数理解构(典籍定稿增补完整版 · 纳入太乙金华宗旨、性命圭旨、周易参同契、清静经、黄庭经统一数理 框架)
余俊晖
5 小时前
人工智能
·
算法
·
机器学习
图文混合文档的轻量级多模态listwise重排框架:Rank-Nexus
本文介绍的方法Rank-Nexus将Listwise重排序扩展至多模态场景,联合处理文本段落和图像,生成排序。
醉舞经阁半卷书1
5 小时前
开发语言
·
人工智能
·
python
·
深度学习
·
机器学习
·
自然语言处理
LangGraph详解
LangGraph 是 LangChain 生态中专为构建复杂、有状态、支持循环迭代的 AI 工作流而设计的图编排框架,其核心突破在于通过有向循环图(DCG)结构替代传统线性链式流程,解决了多步骤推理、多智能体协作等场景中的动态流程控制问题。与 LangChain 的线性链式调用不同,LangGraph 原生支持条件分支、循环迭代和状态持久化,尤其适用于需要动态调整执行路径的复杂 AI 系统(如多智能体协作、需人工干预的高风险任务)
啦啦啦_9999
5 小时前
机器学习
1. 决策树简介
学习目录: 决策树简介 ID3决策树 C4.5决策树 CART决策树 案例泰坦尼克号生存预测 CART回归树 决策树剪枝 (决策树中用到的比较多的几种树:ID3决策树、C4.5决策树、CART决策树:ID3决策树有弊端,为解决其弊端,设计了C4.5决策树,有C5.0决策树,但其不开源;这两个会理论即可。真正需要掌握的是CART决策树:C-Classify分类、A-and、R-Regression回归、T-Tree即 分类回归树,即这种树既能做分类又能做回归;而ID3决策树、C4.5决策树只能做分类;对CA
Master_oid
5 小时前
深度学习
·
算法
·
机器学习
机器学习41:利用KNN算法实现手写数字识别
本文以手写数字识别任务,展示了使用K近邻(KNN)算法对灰度图像进行分类的完整流程。文章首先介绍了数据集构成(42000张28×28像素的手写数字图像,含784个特征及对应标签),并通过代码演示了数据读取、图像可视化及标签分布统计。随后,对特征进行归一化处理,采用分层采样划分训练集与测试集以避免标签分布失衡,使用KNN分类器进行模型训练与评估,最终准确率达到约96.57%。此外,文章还演示了如何保存训练好的模型并用于识别外部手写数字图片,为KNN算法在图像识别领域的应用提供了可复用的实践范例。