机器学习

萝卜小白3 小时前
人工智能·算法·机器学习
算法实习Day04-MinerU2.5-pro这张图完整展示了 MinerU2.5-Pro 用来打造训练数据的“数据引擎”流水线,核心分为三大阶段:
大模型最新论文速读4 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
合成数据的正确打开方式:格式比模型重要,小模型比大模型好用来自 Hugging Face 团队的系统实验:用 1.7B 小模型生成 486B token,效果碾压已有方案,成本降低 30 倍
Ai173163915796 小时前
大数据·服务器·人工智能·神经网络·机器学习·计算机视觉·架构
GB200 NVL72超节点深度解析:架构、生态与产业格局一、超节点:AI算力基础设施的革命性演进 1. 超节点的概念与演进历程超节点(SuperPod)是英伟达率先提出的创新概念,特指在AI服务器集群中,通过超高速互联技术将16张以上GPU紧密连接形成的纵向扩展(Scale Up)系统。这一概念的诞生标志着AI计算从"分散作战"向"集团军作战"的根本性转变。
chipsense7 小时前
算法·决策树·机器学习·闭环霍尔·tmr传感
霍尔电流传感器选型方法论再升级:从800V平台到TMR竞争的全场景决策树2026年,电流传感器市场正经历深刻的技术变局。800V高压平台加速普及、SiC/GaN功率器件开关频率突破100kHz、TMR传感器凭借2000倍于霍尔元件的灵敏度从高端向主流渗透。
05大叔8 小时前
人工智能·机器学习
词向量化和文本向量化,KMeans文本向量化文本是由词和字组成的,想将文本转化为向量,首先要能够把词和字转化为向量所有向量应该由同一维度n,我们可以称这个n维空间是一个语义空间
Z.风止9 小时前
pytorch·深度学习·机器学习
Large Model-learning(6)继续小土堆,并且尝试复现大模型项目。新建文件 train.py。之前已经搭建过,按照这张图去搭建。一种比较常用的方法是将网络放入单独的python文件里,需要的时候进行引入,所以新建model.py文件。可以直接在这个文件里去测试网络的正确性。
xixixi7777710 小时前
网络·gpt·安全·机器学习·架构·大模型·claude
从Mythos到GPT-5.4-Cyber:AI安全竞赛的“双轨”分化与防御新范式当Claude Mythos在OpenBSD中挖出27年的“老坑”,OpenAI选择了另一条路:把AI还给防守者,把控制权握在自己手里。
ITxiaobing202311 小时前
人工智能·学习·机器学习
Neel Somani:如何设计“既能学习又不脆弱”的AI系统Neel Somani 评估人工智能的标准,不仅在于系统能否持续学习,更在于其在成长过程中是否能够保持稳定而不过度脆弱。作为一位拥有加州大学伯克利分校数学、计算机科学与商业背景的研究者与技术专家,他以独特视角探讨了当代人工智能工程中最具影响力的问题之一。
翔云12345612 小时前
人工智能·深度学习·机器学习
一文读懂人工智能,机器学习,深度学习,神经网络,Transformer定义:让机器具备感知、推理、决策、理解、创造等类人智能的技术总称。 包含内容定义:不硬写死规则,让机器从数据中自动学规律,从而完成预测、分类、决策。 包含内容
极光代码工作室12 小时前
人工智能·机器学习·ai·系统设计
基于AI的新闻推荐系统设计随着信息爆炸式增长与用户注意力碎片化加剧,传统“人工编辑+时间流”新闻分发模式已难以满足个性化、实时化、高质量的信息获取需求。本研究聚焦于构建一个融合多源特征与深度学习能力的智能新闻推荐系统,旨在提升用户点击率(CTR)、阅读时长及长期留存率。系统采用“协同过滤+内容语义理解+行为序列建模”三级混合推荐架构:底层基于用户-新闻交互矩阵构建图神经网络(GNN)实现高阶协同信号挖掘;中层引入BERT微调模型对新闻标题、摘要与类别标签进行多粒度语义编码;上层设计基于Transformer的用户兴趣演化模块,动态
YMWM_12 小时前
机器学习
KL散度介绍及其应用在机器学习、信息论甚至强化学习中,你几乎一定会遇到一个核心概念——KL 散度(Kullback-Leibler Divergence)。它听起来有点“学术”,但本质上,它回答的是一个非常直观的问题:
大模型最新论文速读14 小时前
人工智能·深度学习·算法·机器学习·自然语言处理
VQKV:KV Cache 压缩 82% 性能几乎不降VQKV 用向量量化把 KV cache 从"每个 token 存一长串浮点数"改成"存几个共享码本的索引编号",在压掉 82.8% 的缓存后仍保留 98.6% 的原始性能
AI周红伟14 小时前
人工智能·深度学习·机器学习·语言模型·openclaw
周红伟:RAG 与知识检索RAG(Retrieval-Augmented Generation,检索增强生成)是目前最主流的 LLM 落地架构之一。
爱思考的观赏鱼14 小时前
人工智能·yolo·目标检测·机器学习·计算机视觉·目标跟踪
YOLO 系列:2026最新遥感检测:YOLOv11-OBB 旋转框训练、参数调优与踩坑全解析2025年,Ultralytics 发布了 YOLOv11 系列模型,同时原生支持了 OBB(Oriented Bounding Box,有向边界框)旋转目标检测任务。根据 Ultralytics 官方文档,YOLO11 已成为检测、分割、姿态估计、分类和 OBB 任务的推荐默认模型,其 OBB 功能专门针对航空影像、遥感图像等任意角度目标的检测场景进行了优化。
乐园游梦记14 小时前
人工智能·深度学习·机器学习·开源
工业检测场景下自监督与无监督开源方案OpenMMLab+PatchCore 与其他方案对比分析核心结论:在特定工业场景下,Anomalib 集成方案、EfficientAD、SubspaceAD和Reverse Distillation等开源工具在速度、精度或部署便捷性上可能更优。选择的关键在于匹配 “检测精度、推理速度、标注成本、硬件资源” 四大工业核心需求,而非单纯追求技术先进性。
carrywudi14 小时前
人工智能·机器学习
论文(硕士论文)时序链路预测:预测未来会不会出现某个事件关系。事件演化预测:预测某个话题会不会扩散到某个实体、群体或平台。
格林威14 小时前
运维·人工智能·数码相机·opencv·机器学习·计算机视觉·视觉检测
工业视觉检测:OpenCV FPS 正确计算的方式别再被 cap.get(cv2.CAP_PROP_FPS) 骗了!“为什么我用 OpenCV 读相机,get(CAP_PROP_FPS) 返回 0?” “视频文件能拿到帧率,但工业相机就是不行!” “我的算法明明很快,但显示的 FPS 只有 10?”
好好学仿真16 小时前
人工智能·机器学习·xgboost·材料科学·mofs·吸附
用AI预测MOF材料吸氮能力:XGBoost力压神经网络,R²高达0.9984在天然气净化和温室气体控制中,氮气(N₂)与甲烷(CH₄)的分离一直是个“老大难”问题。两者的动力学直径极其接近(0.364 nm vs 0.381 nm),传统分离方法成本高、能耗大。而金属有机框架(MOFs)因其结构可调和超高孔隙率,被视为理想的吸附材料。
zs宝来了16 小时前
机器学习·ai·基础设施
MLflow 模型管理:实验跟踪与模型注册在MLOps的实践中,模型管理是连接实验与生产的关键桥梁。本文将深入剖析MLflow的实验跟踪与模型注册机制,助你构建专业级的机器学习工作流。