机器学习

忆~遂愿20 分钟前
人工智能·深度学习·目标检测·microsoft·机器学习·ar·交互
从文字应答到具象共情:Agent 交互的底层革新当大多数 Agent 还停留在文字匹配、机械应答的交互模式里,魔星云具身 Agent正以表情、手势与情绪联动,带来交互方式的本质改变 ——AI 不再是冰冷的信息输出工具,而是能读懂情绪、贴合语境、自然回应的交互伙伴,人机交互的底层逻辑正在悄然更新。
Zxc_1 小时前
机器学习
逻辑回归:从Sigmoid到牛顿法,手写一个完整的概率分类器逻辑回归是机器学习中最经典的二分类算法之一。它在线性回归的基础上通过 Sigmoid 函数将输出映射为类别概率,并使用交叉熵损失函数进行优化。本文从极大似然估计出发,完整推导了交叉熵损失的梯度,分别使用梯度下降法和牛顿法求解最优参数,并在威斯康星乳腺癌数据集上与sklearn进行对比验证。
水木流年追梦1 小时前
人工智能·学习·机器学习
大模型入门-预训练、SFT 有监督学习在大语言模型的整个训练生命周期中,预训练(Pre-Training) 是极为关键的“地基”工程。它为模型后续高效执行各种任务打牢了基础,深刻地影响着模型的最终性能与应用潜力。
pen-ai2 小时前
人工智能·算法·机器学习
Kennard-Stone (KS) 算法详解 —— 从实验设计到样本划分的经典方法论文标题:Computer Aided Design of Experiments 作者:R. W. Kennard & L. A. Stone (杜邦公司) 发表:Technometrics, Vol. 11, No. 1, 1969 年 2 月, pp. 137–148
咋吃都不胖lyh2 小时前
人工智能·深度学习·机器学习
Prompt Engineering(提示工程)和 CoT(Chain of Thought,思维链)要深入理解大模型应用中的 Prompt Engineering(提示工程)和 CoT(Chain of Thought,思维链),可以从“人类如何与模型沟通”这个视角切入。如果把大模型比作一位拥有海量知识但需要被精准引导的专家,那么提示工程就是与之对话的语言艺术,而思维链则是引导他进行分步推理、解决复杂问题的思考框架。
前端若水2 小时前
java·前端·人工智能·python·机器学习
使用 IndexedDB 在客户端存储对话记录让用户的对话历史永不丢失,即使断网、刷新页面、关掉浏览器,回来还能接着聊你有没有遇到过这种情况:正在跟 AI 助手讨论一个复杂问题,聊了三十多轮,突然网络断了,页面一刷新,所有对话都没了?用户骂娘,你背锅。
小小测试开发2 小时前
人工智能·算法·机器学习
OpenAI 模型攻克离散几何 80 年难题:Erdős 单位距离猜想被 AI 证明2026年5月20日,OpenAI 宣布其内部通用推理模型成功证明了一个困扰数学界近80年的开放问题——Erdős 单位距离问题(Unit Distance Problem)。这是AI首次自主攻克一个数学分支中的核心开放猜想,标志性意义堪比 AlphaGo 击败李世石。
Dfreedom.2 小时前
人工智能·算法·机器学习·剪枝·模型加速
模型剪枝完全指南:从理论到实践,打造高效深度学习模型模型剪枝作为模型压缩的核心技术之一,能够在不显著损失精度的前提下大幅减少模型大小和计算量。本文将从方法论、数学原理、实现细节到实践策略,全面解析模型剪枝技术,帮助读者深入理解并掌握这一关键技术。
PNP Robotics2 小时前
人工智能·深度学习·学习·机器学习·virtualenv
PNP机器人亮相南京学术论坛,分享具身智能多模态数据采集前沿成果PNP机器人亮相南京学术论坛,分享具身智能多模态数据采集前沿成果PNP机器人亮相南京学术论坛,分享具身智能多模态数据采集前沿成果
名字不好奇3 小时前
深度学习·游戏·机器学习
大模型如何训练?猜词游戏如何炼成智能大脑一个刚出厂的大模型,所有参数都是随机数。你问它"法国的首都是",它可能输出"skdfj23#@!"——完全不知所云。
渡我白衣3 小时前
人工智能·深度学习·神经网络·机器学习·自然语言处理·语音识别·集成学习
第十五章:海纳百川——集成学习的高级策略与Stacking硬核实战在上一章“从树到森林”中,我们领略了Bagging通过并行投票降低方差、Boosting通过顺序纠错降低偏差的强大威力。然而,当单一算法家族(比如清一色的决策树)遇到性能瓶颈时,我们需要更宏大的视野——“海纳百川”。本章将彻底撕开模型融合的底层黑盒,带你从零构建工业级的Stacking流水线。
大模型最新论文速读3 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
05-21 · LLM 最新论文速览今日候选池 89 篇,硬过滤 + LLM 打分后通过评估 18 篇,精选 Top-10,另列 8 篇速览。
水木流年追梦4 小时前
人工智能·深度学习·机器学习
大模型入门-Pre-Training、SFT、RLHF大家在阅读大模型相关的论文时,经常会看到将大模型训练分为 Pre-Training(预训练) 阶段和 Post-Training(后训练) 阶段:
Yunzenn4 小时前
linux·人工智能·rnn·深度学习·机器学习·架构·transformer
深度分析字节最新研究cola-DLM第 01 章:语言生成的三次范式之争 —— 从 RNN 到 AR 到扩散论文:Continuous Latent Diffusion Language Model项目地址:ByteDance-Seed/Cola-DLM
QBoson4 小时前
人工智能·机器学习
Nature:破译蛋白质隐形能量景观,从“看结构”到“控动态”的革命本文为《 Large-scale discovery, analysis and design of protein energy landscapes 》的阅读笔记,原文链接:https://www.nature.com/articles/s41586-026-10465-z。
WangN213 小时前
人工智能·机器学习
Unitree RL Lab 学习笔记【通识】本笔记基于 extern/unitree_rl_lab 源码及 docs/training/unitree_rl_lab/ 官方文档整理,聚焦 G1-29DOF 速度跟踪与动作模仿任务的完整训练链路。
人工智能培训15 小时前
人工智能·深度学习·神经网络·机器学习·生成对抗网络
大模型与传统小模型、传统NLP模型的核心差异解析随着人工智能技术的爆发式发展,大模型已成为推动AI普及的核心力量,与传统小模型、传统NLP模型形成了鲜明的能力分野。很多人误以为三者的区别仅在于“参数多少”,实则不然——从技术架构、训练方式到能力边界、应用场景,大模型实现了对传统模型的全方位突破,三者如同AI领域的“全能学者”“专科医生”与“基础工具”,各自承担着不同的角色。本文将从五大核心维度,系统解析三者的差异,帮助我们更清晰地理解AI技术的发展脉络。
砥锋17 小时前
机器学习
纯NumPy手写两层GCN:从零开始理解图神经网络核心思想很多教程直接调用GCNConv,但你真的理解 D~−1/2A~D~−1/2\tilde{D}^{-1/2} \tilde{A} \tilde{D}^{-1/2}D~−1/2A~D~−1/2在做什么吗? 本文用纯NumPy从零实现两层GCN,在34节点的空手道俱乐部图上完成半监督节点分类。通过手写对称归一化邻接矩阵、数值梯度下降和可视化,深入讲解图卷积的核心机制。实验表明,仅标注2个节点即可达到**96.88%**的测试准确率。
Larcher17 小时前
javascript·机器学习·前端框架
🔥 告别抓瞎:用 Claude Code (cc) 优雅接手与维护已有项目在日常的现代前端开发中——无论是写 HTML5、CSS3,还是捣鼓 JavaScript 和 React 组件——接手并维护一个前人留下的老项目总是件令人头疼的事。特别是当我们通过 cc-switch 结合 DeepSeek API 成功部署并配置好 Claude Code (cc) 命令行工具后,如何最大化利用这个强大的 AI 助手来梳理业务?