技术栈
机器学习
癫狂的兔子
15 分钟前
python
·
决策树
·
机器学习
【Python】【机器学习】决策树
决策树中的条件顺序有严格要求,调换顺序会导致结果差异极大。类似于上场的首发和替补。根节点(首发)必须是分类效果最强、可以筛选大批量的特征,其后的结点(替补)则是细微调控的特征。 因为概率在0-1之间,所有用对数函数。 通过分类后,希望熵值下降,即不确定性减少。所以要对比熵值下降的多少来判断特征先后顺序。 同一特征判决时,不同情况加权重。 信息增益降序排列,取最大的那个特征作根节点,以此类推。
简佐义的博客
2 小时前
人工智能
·
深度学习
·
算法
·
机器学习
120万细胞大整合(自测+公共数据):scRNA-seq 构建乳腺细胞图谱的完整思路(附生信复现资源)
为什么同样的年龄,有些人患乳腺癌的风险更高?生育经历和基因突变又是如何从细胞层面重塑乳腺环境的?2024年3月28日,《Nature Genetics》杂志发表了来自剑桥大学Walid T. Khaled和John C. Marioni团队的研究,他们通过构建单细胞图谱揭示了成人乳腺在不同生理条件下细胞状态的稳态偏移。今天我们就来拆解一下这篇生信文章:A single-cell atlas enables mapping of homeostatic cellular shifts in the adul
wanghao666455
2 小时前
人工智能
·
机器学习
向量相似度计算全解析
在人工智能和大模型(尤其是我们之前提到的 RAG 检索增强生成)中,把文字、图像变成一段段由数字组成的“向量”后,接下来最重要的一步就是计算这些向量之间的相似度。相似度越高,说明这两段文字或两张图片的意思越相近。
是小蟹呀^
2 小时前
机器学习
·
生成对抗网络
GAN(生成对抗网络):让AI学会“造假”的艺术
大家好,之前我们聊了“生成对抗样本”,有读者问:“生成对抗网络(GAN)里的‘对抗’和那个是一回事吗?”
麦麦大数据
2 小时前
网络
·
人工智能
·
机器学习
·
网络安全
·
入侵检测
F065_基于机器学习的KDD CUP 99网络入侵检测系统实战
关注B站:麦麦大数据 编号: F065摘要:本文介绍了一个基于机器学习的网络入侵检测系统(IDS),采用Vue2 + Flask前后端分离架构,使用KDD CUP 99数据集,支持决策树、KNN、朴素贝叶斯、BP神经网络四种算法,提供单条检测、批量检测、模型训练等核心功能。系统采用香槟金暗色主题设计,具有良好的用户体验。
得一录
3 小时前
python
·
算法
·
机器学习
LoRA(Low-Rank Adaptation)的原理和实现
LoRA 是一种高效微调技术,它的核心思想非常巧妙:冻结预训练模型原有的参数,然后在模型原有的参数矩阵(主要是权重层)旁边,添加一个可训练的、低秩的分解矩阵,通过仅优化这个低秩矩阵来模拟模型参数的更新。
BackCatK Chen
3 小时前
图像处理
·
人工智能
·
机器学习
·
自动驾驶
·
视觉检测
·
能源
·
制造
无方向盘、无踏板!特斯拉Cybercab下线:自动驾驶的终极形态来了?
2026年,特斯拉在得州超级工厂正式下线的Cybercab,用最直观的设计颠覆了人们对汽车的认知——彻底取消方向盘、脚踏板,车内仅保留两座布局+超大后备箱,金色无喷涂车身搭配流线型造型,风阻系数低至0.19(比Model 3低30%)。这款专为Robotaxi场景打造的车型,不仅是特斯拉《秘密宏图》第四篇章的核心落地产品,更标志着自动驾驶从“辅助人类”迈入“完全替代人类”的新时代。
智算菩萨
3 小时前
人工智能
·
机器学习
·
自动驾驶
多模态大模型在自动驾驶感知中的最新应用与挑战
随着人工智能技术的飞速发展,自动驾驶系统正经历着从传统模块化架构向端到端学习范式的深刻变革。在这场技术革命中,多模态大语言模型(Multimodal Large Language Models, MLLMs)凭借其强大的跨模态理解能力、丰富的知识储备以及卓越的推理能力,正在重塑自动驾驶感知系统的技术格局。传统的自动驾驶感知系统主要依赖于激光雷达、摄像头、毫米波雷达等多种传感器的数据融合,通过精心设计的算法模块分别完成目标检测、语义分割、深度估计等任务。然而,这种模块化设计面临着信息孤岛、语义鸿沟以及长尾场
量子-Alex
13 小时前
人工智能
·
深度学习
·
机器学习
【大模型思维链】RAP中如何通过提示词将LLM改造为世界模型
基于论文原文(特别是第3.1节及附录C的提示词示例),以下详细解析如何通过提示工程将大语言模型改造为世界模型:
砚边数影
13 小时前
数据库
·
机器学习
·
kingbase
·
模型推理
·
数据库平替用金仓
·
金仓数据库
模型持久化(二):从 KingbaseES 加载模型,实现离线预测
——别再让模型“睡在库房”,它该上生产线了大家好,我是那个总在凌晨被叫醒、因为线上预测服务挂了,又不得不手动从 KES 里捞出模型临时跑批的老架构。上一期我们把训练好的随机森林序列化存进了电科金仓 KingbaseES 的 BYTEA 字段,解决了“模型去哪儿”的问题。
硅谷秋水
13 小时前
深度学习
·
机器学习
·
计算机视觉
·
语言模型
·
机器人
·
人机交互
多智体机器人系统(MARS)挑战的进展与创新
26年1月来自上交、牛津、中科大、上海AI实验室、CMU、港大、同济、UCSD、港中文深圳分校、中山大学和哈佛的论文“Advances and Innovations in the Multi-Agent Robotic System (MARS) Challenge”。
癫狂的兔子
14 小时前
算法
·
机器学习
·
kmeans
【Python】【机器学习】K-MEANS算法
欧式距离 曼哈顿距离 余弦相似度 A与B表示向量(x1,y1),(x2,y2) 分子为A与B的点乘,分母为二者各自的L2相乘,即将所有维度值的平方相加后开方。 新质心的计算 分别计算到簇内其他点距离均值最小的点作为质心(对于拥有坐标的簇可以计算每个簇坐标的均值作为质心) 比如一个新簇有3个样本:[[1,4], [2,5], [3,6]],得到此簇的新质心=[(1+2+3)/3, (4+5+6)/3]
算法黑哥
15 小时前
深度学习
·
神经网络
·
机器学习
Sharpness-Aware Minimization (SAM,锐度感知最小化)是让损失曲面变平坦,还是引导参数至平坦区域
损失函数的曲面在训练过程中本身不会因优化方法(如SAM)而发生本质性改变,但优化过程会引导模型参数收敛至曲面中更平坦的区域,从而间接影响参数对损失曲面的“感知”方式。 以下是详细分析:
索木木
16 小时前
人工智能
·
深度学习
·
机器学习
·
大模型
·
训练
·
cp
·
切分
大模型训练CP切分(与TP、SP结合)
一. CP并行原理megatron中的context并行(简称CP)与sequence并行(简称SP)不同点在于,SP只针对Layernorm和Dropout输出的activation在sequence维度上进行切分,CP则是对所有的input输入和所有的输出activation在sequence维度上进行切分,可以看成是增强版的SP。之前我有篇文章重点讲了TP、SP、EP技术。本文我讲下长文本的CP技术,以及怎么和TP和SP结合的。
量子-Alex
17 小时前
人工智能
·
深度学习
·
机器学习
【大模型思维链】COT、COT-SC、TOT和RAP四篇经典工作对比分析
研究背景与动机(原文定位:Introduction, Section 1)核心主张(Claims)逐条梳理
lisw05
19 小时前
人工智能
·
机器学习
·
人工智能代理
AI与AI代理:概念、区别与联系!
AI(人工智能)概念:指让机器模拟人类智能的技术,包括学习、推理、感知、语言理解等能力。比如语音助手、图像识别、推荐算法都属于AI范畴。
小雨中_
20 小时前
人工智能
·
python
·
深度学习
·
机器学习
·
分类
·
数据挖掘
2.7 强化学习分类
强化学习(Reinforcement Learning, RL)研究的是:智能体(Agent)在环境(Environment)中通过交互学习策略(Policy),以最大化长期累计回报(Return)。在实际算法与应用中,有几组非常关键的“分类维度”,它们决定了:数据怎么来、学什么、怎么更新、能不能复用旧数据、是否需要环境模型等。
lczdyx
21 小时前
人工智能
·
深度学习
·
机器学习
·
ai
·
大模型
·
反向传播
【胶囊网络】01-2 胶囊网络发展历史与研究现状
胶囊网络的思想并非一蹴而就,而是源于 Hinton 教授对传统 CNN 缺陷的长期思考。Hinton 开始公开质疑 CNN 中池化操作的有效性:
小雨中_
21 小时前
人工智能
·
python
·
深度学习
·
机器学习
·
自然语言处理
2.4 贝尔曼方程与蒙特卡洛方法
在马尔可夫决策过程(MDP)中,一个智能体在时间步 ttt 处于状态 St=sS_t=sSt=s,选择动作 At=aA_t=aAt=a,获得即时奖励 RtR_tRt(或写作 r(s,a)r(s,a)r(s,a)),并以转移概率 p(s′∣s,a)p(s'|s,a)p(s′∣s,a) 到达下一状态 St+1=s′S_{t+1}=s'St+1=s′。策略 π(a∣s)\pi(a|s)π(a∣s) 表示在状态 sss 选择动作 aaa 的概率。
heimeiyingwang
1 天前
大数据
·
数据库
·
人工智能
·
机器学习
·
架构
企业非结构化数据的 AI 处理与价值挖掘
在企业数字化转型的深水区,数据已成为核心竞争力的核心,但多数企业都面临一个共性困境:80%以上的企业数据都是“非结构化数据”——散落的PDF文档、员工聊天记录、客户通话录音、产品图片、行业报告截图、邮件往来等,这些数据杂乱无章、格式多样,无法被传统数据处理工具识别和分析,最终只能沉睡在服务器中,成为“数据垃圾”。