机器学习

Mr数据杨10 分钟前
机器学习·数据分析·kaggle
共享单车需求预测与城市运营调度优化自行车共享需求预测竞赛以回归任务为核心,采用RMSLE作为评估指标,这一设计直接指向了现实业务中的关键痛点:对低需求量时段的准确预估往往比预测高峰需求更具运营价值。低估需求可能导致车辆供应不足,直接影响用户体验与平台收入,而RMSLE通过对数变换强化了对较小预测误差的敏感性,迫使模型优化方向与业务风险控制逻辑保持一致。因此,参与此类竞赛不仅是模型精度的比拼,更是理解预测指标如何驱动业务决策的实践过程。
刘~浪地球16 分钟前
人工智能·python·机器学习
当AI开始“理财“:智能投顾是帮你赚钱还是割韭菜?写在前面:2024年,A股市场迎来了一波AI投资热潮。各大券商、基金公司纷纷推出AI智能投顾产品,宣称"AI选股,稳赚不赔"、“智能分析,收益跑赢大盘”。然而,事实真的如此美好吗?当AI开始帮你理财,它是帮你赚钱的"财神爷",还是收割你钱包的"镰刀"?今天我们就来深度剖析智能投顾的那些事儿。
Mr数据杨19 分钟前
机器学习·数据分析·kaggle
自行车共享需求预测与运营调度优化Kaggle竞赛“数据分析入门培训”提供了一个典型的时序预测练习场景,其核心任务是基于历史数据预测自行车共享需求。这类项目虽不涉及激烈排名竞争,但完整覆盖了从业务理解、数据清洗、特征工程到模型选择与评估的机器学习全流程,对于构建扎实的数据分析实践能力具有基础性价值。
渡我白衣26 分钟前
人工智能·深度学习·神经网络·学习·机器学习·迁移学习·caffe
触类旁通——迁移学习、多任务学习与元学习“智者千虑,必有一失;愚者千虑,必有一得。而真正的学习者,能从他人的‘一得’中,提炼出自己的‘千得’。”
Mr数据杨1 小时前
机器学习·数据分析·kaggle
MultiNLI跨领域文本推断实战 从语义三分类到建模落地MultiNLI Mismatched Open Evaluation 是一类很适合训练自然语言理解基本功的 Kaggle 赛题。任务目标并不复杂,输入是前提句与假设句,输出是蕴含、中立、矛盾三类语义关系,但真正的难点在于测试集强调跨领域分布,模型不能只依赖训练语料中的表面模式。
萝卜小白11 小时前
人工智能·算法·机器学习
算法实习Day04-MinerU2.5-pro这张图完整展示了 MinerU2.5-Pro 用来打造训练数据的“数据引擎”流水线,核心分为三大阶段:
大模型最新论文速读12 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
合成数据的正确打开方式:格式比模型重要,小模型比大模型好用来自 Hugging Face 团队的系统实验:用 1.7B 小模型生成 486B token,效果碾压已有方案,成本降低 30 倍
Ai1731639157913 小时前
大数据·服务器·人工智能·神经网络·机器学习·计算机视觉·架构
GB200 NVL72超节点深度解析:架构、生态与产业格局一、超节点:AI算力基础设施的革命性演进 1. 超节点的概念与演进历程超节点(SuperPod)是英伟达率先提出的创新概念,特指在AI服务器集群中,通过超高速互联技术将16张以上GPU紧密连接形成的纵向扩展(Scale Up)系统。这一概念的诞生标志着AI计算从"分散作战"向"集团军作战"的根本性转变。
chipsense14 小时前
算法·决策树·机器学习·闭环霍尔·tmr传感
霍尔电流传感器选型方法论再升级:从800V平台到TMR竞争的全场景决策树2026年,电流传感器市场正经历深刻的技术变局。800V高压平台加速普及、SiC/GaN功率器件开关频率突破100kHz、TMR传感器凭借2000倍于霍尔元件的灵敏度从高端向主流渗透。
05大叔15 小时前
人工智能·机器学习
词向量化和文本向量化,KMeans文本向量化文本是由词和字组成的,想将文本转化为向量,首先要能够把词和字转化为向量所有向量应该由同一维度n,我们可以称这个n维空间是一个语义空间
Z.风止17 小时前
pytorch·深度学习·机器学习
Large Model-learning(6)继续小土堆,并且尝试复现大模型项目。新建文件 train.py。之前已经搭建过,按照这张图去搭建。一种比较常用的方法是将网络放入单独的python文件里,需要的时候进行引入,所以新建model.py文件。可以直接在这个文件里去测试网络的正确性。
xixixi7777717 小时前
网络·gpt·安全·机器学习·架构·大模型·claude
从Mythos到GPT-5.4-Cyber:AI安全竞赛的“双轨”分化与防御新范式当Claude Mythos在OpenBSD中挖出27年的“老坑”,OpenAI选择了另一条路:把AI还给防守者,把控制权握在自己手里。
ITxiaobing202318 小时前
人工智能·学习·机器学习
Neel Somani:如何设计“既能学习又不脆弱”的AI系统Neel Somani 评估人工智能的标准,不仅在于系统能否持续学习,更在于其在成长过程中是否能够保持稳定而不过度脆弱。作为一位拥有加州大学伯克利分校数学、计算机科学与商业背景的研究者与技术专家,他以独特视角探讨了当代人工智能工程中最具影响力的问题之一。
翔云12345620 小时前
人工智能·深度学习·机器学习
一文读懂人工智能,机器学习,深度学习,神经网络,Transformer定义:让机器具备感知、推理、决策、理解、创造等类人智能的技术总称。 包含内容定义:不硬写死规则,让机器从数据中自动学规律,从而完成预测、分类、决策。 包含内容
极光代码工作室20 小时前
人工智能·机器学习·ai·系统设计
基于AI的新闻推荐系统设计随着信息爆炸式增长与用户注意力碎片化加剧,传统“人工编辑+时间流”新闻分发模式已难以满足个性化、实时化、高质量的信息获取需求。本研究聚焦于构建一个融合多源特征与深度学习能力的智能新闻推荐系统,旨在提升用户点击率(CTR)、阅读时长及长期留存率。系统采用“协同过滤+内容语义理解+行为序列建模”三级混合推荐架构:底层基于用户-新闻交互矩阵构建图神经网络(GNN)实现高阶协同信号挖掘;中层引入BERT微调模型对新闻标题、摘要与类别标签进行多粒度语义编码;上层设计基于Transformer的用户兴趣演化模块,动态
YMWM_20 小时前
机器学习
KL散度介绍及其应用在机器学习、信息论甚至强化学习中,你几乎一定会遇到一个核心概念——KL 散度(Kullback-Leibler Divergence)。它听起来有点“学术”,但本质上,它回答的是一个非常直观的问题:
大模型最新论文速读21 小时前
人工智能·深度学习·算法·机器学习·自然语言处理
VQKV:KV Cache 压缩 82% 性能几乎不降VQKV 用向量量化把 KV cache 从"每个 token 存一长串浮点数"改成"存几个共享码本的索引编号",在压掉 82.8% 的缓存后仍保留 98.6% 的原始性能
AI周红伟21 小时前
人工智能·深度学习·机器学习·语言模型·openclaw
周红伟:RAG 与知识检索RAG(Retrieval-Augmented Generation,检索增强生成)是目前最主流的 LLM 落地架构之一。
爱思考的观赏鱼1 天前
人工智能·yolo·目标检测·机器学习·计算机视觉·目标跟踪
YOLO 系列:2026最新遥感检测:YOLOv11-OBB 旋转框训练、参数调优与踩坑全解析2025年,Ultralytics 发布了 YOLOv11 系列模型,同时原生支持了 OBB(Oriented Bounding Box,有向边界框)旋转目标检测任务。根据 Ultralytics 官方文档,YOLO11 已成为检测、分割、姿态估计、分类和 OBB 任务的推荐默认模型,其 OBB 功能专门针对航空影像、遥感图像等任意角度目标的检测场景进行了优化。