技术栈
机器学习
忆~遂愿
20 分钟前
人工智能
·
深度学习
·
目标检测
·
microsoft
·
机器学习
·
ar
·
交互
从文字应答到具象共情:Agent 交互的底层革新
当大多数 Agent 还停留在文字匹配、机械应答的交互模式里,魔星云具身 Agent正以表情、手势与情绪联动,带来交互方式的本质改变 ——AI 不再是冰冷的信息输出工具,而是能读懂情绪、贴合语境、自然回应的交互伙伴,人机交互的底层逻辑正在悄然更新。
Zxc_
1 小时前
机器学习
逻辑回归:从Sigmoid到牛顿法,手写一个完整的概率分类器
逻辑回归是机器学习中最经典的二分类算法之一。它在线性回归的基础上通过 Sigmoid 函数将输出映射为类别概率,并使用交叉熵损失函数进行优化。本文从极大似然估计出发,完整推导了交叉熵损失的梯度,分别使用梯度下降法和牛顿法求解最优参数,并在威斯康星乳腺癌数据集上与sklearn进行对比验证。
水木流年追梦
1 小时前
人工智能
·
学习
·
机器学习
大模型入门-预训练、SFT 有监督学习
在大语言模型的整个训练生命周期中,预训练(Pre-Training) 是极为关键的“地基”工程。它为模型后续高效执行各种任务打牢了基础,深刻地影响着模型的最终性能与应用潜力。
pen-ai
2 小时前
人工智能
·
算法
·
机器学习
Kennard-Stone (KS) 算法详解 —— 从实验设计到样本划分的经典方法
论文标题:Computer Aided Design of Experiments 作者:R. W. Kennard & L. A. Stone (杜邦公司) 发表:Technometrics, Vol. 11, No. 1, 1969 年 2 月, pp. 137–148
咋吃都不胖lyh
2 小时前
人工智能
·
深度学习
·
机器学习
Prompt Engineering(提示工程)和 CoT(Chain of Thought,思维链)
要深入理解大模型应用中的 Prompt Engineering(提示工程)和 CoT(Chain of Thought,思维链),可以从“人类如何与模型沟通”这个视角切入。如果把大模型比作一位拥有海量知识但需要被精准引导的专家,那么提示工程就是与之对话的语言艺术,而思维链则是引导他进行分步推理、解决复杂问题的思考框架。
前端若水
2 小时前
java
·
前端
·
人工智能
·
python
·
机器学习
使用 IndexedDB 在客户端存储对话记录
让用户的对话历史永不丢失,即使断网、刷新页面、关掉浏览器,回来还能接着聊你有没有遇到过这种情况:正在跟 AI 助手讨论一个复杂问题,聊了三十多轮,突然网络断了,页面一刷新,所有对话都没了?用户骂娘,你背锅。
小小测试开发
2 小时前
人工智能
·
算法
·
机器学习
OpenAI 模型攻克离散几何 80 年难题:Erdős 单位距离猜想被 AI 证明
2026年5月20日,OpenAI 宣布其内部通用推理模型成功证明了一个困扰数学界近80年的开放问题——Erdős 单位距离问题(Unit Distance Problem)。这是AI首次自主攻克一个数学分支中的核心开放猜想,标志性意义堪比 AlphaGo 击败李世石。
Dfreedom.
2 小时前
人工智能
·
算法
·
机器学习
·
剪枝
·
模型加速
模型剪枝完全指南:从理论到实践,打造高效深度学习模型
模型剪枝作为模型压缩的核心技术之一,能够在不显著损失精度的前提下大幅减少模型大小和计算量。本文将从方法论、数学原理、实现细节到实践策略,全面解析模型剪枝技术,帮助读者深入理解并掌握这一关键技术。
PNP Robotics
2 小时前
人工智能
·
深度学习
·
学习
·
机器学习
·
virtualenv
PNP机器人亮相南京学术论坛,分享具身智能多模态数据采集前沿成果
PNP机器人亮相南京学术论坛,分享具身智能多模态数据采集前沿成果PNP机器人亮相南京学术论坛,分享具身智能多模态数据采集前沿成果
名字不好奇
3 小时前
深度学习
·
游戏
·
机器学习
大模型如何训练?猜词游戏如何炼成智能大脑
一个刚出厂的大模型,所有参数都是随机数。你问它"法国的首都是",它可能输出"skdfj23#@!"——完全不知所云。
渡我白衣
3 小时前
人工智能
·
深度学习
·
神经网络
·
机器学习
·
自然语言处理
·
语音识别
·
集成学习
第十五章:海纳百川——集成学习的高级策略与Stacking硬核实战
在上一章“从树到森林”中,我们领略了Bagging通过并行投票降低方差、Boosting通过顺序纠错降低偏差的强大威力。然而,当单一算法家族(比如清一色的决策树)遇到性能瓶颈时,我们需要更宏大的视野——“海纳百川”。本章将彻底撕开模型融合的底层黑盒,带你从零构建工业级的Stacking流水线。
大模型最新论文速读
3 小时前
论文阅读
·
人工智能
·
深度学习
·
机器学习
·
自然语言处理
05-21 · LLM 最新论文速览
今日候选池 89 篇,硬过滤 + LLM 打分后通过评估 18 篇,精选 Top-10,另列 8 篇速览。
水木流年追梦
4 小时前
人工智能
·
深度学习
·
机器学习
大模型入门-Pre-Training、SFT、RLHF
大家在阅读大模型相关的论文时,经常会看到将大模型训练分为 Pre-Training(预训练) 阶段和 Post-Training(后训练) 阶段:
Yunzenn
4 小时前
linux
·
人工智能
·
rnn
·
深度学习
·
机器学习
·
架构
·
transformer
深度分析字节最新研究cola-DLM第 01 章:语言生成的三次范式之争 —— 从 RNN 到 AR 到扩散
论文:Continuous Latent Diffusion Language Model项目地址:ByteDance-Seed/Cola-DLM
QBoson
4 小时前
人工智能
·
机器学习
Nature:破译蛋白质隐形能量景观,从“看结构”到“控动态”的革命
本文为《 Large-scale discovery, analysis and design of protein energy landscapes 》的阅读笔记,原文链接:https://www.nature.com/articles/s41586-026-10465-z。
WangN2
13 小时前
人工智能
·
机器学习
Unitree RL Lab 学习笔记【通识】
本笔记基于 extern/unitree_rl_lab 源码及 docs/training/unitree_rl_lab/ 官方文档整理,聚焦 G1-29DOF 速度跟踪与动作模仿任务的完整训练链路。
人工智能培训
15 小时前
人工智能
·
深度学习
·
神经网络
·
机器学习
·
生成对抗网络
大模型与传统小模型、传统NLP模型的核心差异解析
随着人工智能技术的爆发式发展,大模型已成为推动AI普及的核心力量,与传统小模型、传统NLP模型形成了鲜明的能力分野。很多人误以为三者的区别仅在于“参数多少”,实则不然——从技术架构、训练方式到能力边界、应用场景,大模型实现了对传统模型的全方位突破,三者如同AI领域的“全能学者”“专科医生”与“基础工具”,各自承担着不同的角色。本文将从五大核心维度,系统解析三者的差异,帮助我们更清晰地理解AI技术的发展脉络。
砥锋
17 小时前
机器学习
纯NumPy手写两层GCN:从零开始理解图神经网络核心思想
很多教程直接调用GCNConv,但你真的理解 D~−1/2A~D~−1/2\tilde{D}^{-1/2} \tilde{A} \tilde{D}^{-1/2}D~−1/2A~D~−1/2在做什么吗? 本文用纯NumPy从零实现两层GCN,在34节点的空手道俱乐部图上完成半监督节点分类。通过手写对称归一化邻接矩阵、数值梯度下降和可视化,深入讲解图卷积的核心机制。实验表明,仅标注2个节点即可达到**96.88%**的测试准确率。
Larcher
17 小时前
javascript
·
机器学习
·
前端框架
🔥 告别抓瞎:用 Claude Code (cc) 优雅接手与维护已有项目
在日常的现代前端开发中——无论是写 HTML5、CSS3,还是捣鼓 JavaScript 和 React 组件——接手并维护一个前人留下的老项目总是件令人头疼的事。特别是当我们通过 cc-switch 结合 DeepSeek API 成功部署并配置好 Claude Code (cc) 命令行工具后,如何最大化利用这个强大的 AI 助手来梳理业务?