技术栈
深度学习
牧子川
2 小时前
人工智能
·
深度学习
·
transformer
009-Transformer-Architecture
💡 摘要:Transformer 是 ChatGPT、Claude 等所有大语言模型的基础架构。它通过"自注意力"机制解决了 RNN 的长遗忘问题,让 AI 真正能理解长文本。
dfsj66011
3 小时前
人工智能
·
深度学习
第四章:深度学习革命
[!info] 在第三章的结尾我们留下了一个问题:当数据、算力、算法三块拼图同时准备好,接下来又会发生哪些故事呢?
cskywit
4 小时前
人工智能
·
深度学习
·
计算机视觉
【CVPR2024】用Diffusion“造”遥感分割数据:SatSynth论文解读
遥感影像并不缺。真正缺的是高质量像素级标注。对于semantic segmentation任务来说,模型需要知道每一个像素属于什么类别,比如building、road、water、tree、agriculture land等。问题在于,遥感图像通常分辨率高、场景复杂、类别尺度差异大,人工标注既耗时又昂贵。尤其是小目标类别,例如车辆、船只、飞机、网球场、桥梁等,在图像中占比很低,但又对精细化识别非常重要。
薛定e的猫咪
4 小时前
人工智能
·
笔记
·
深度学习
·
算法
因果推理研究方向综述笔记
因果推理研究变量间的因果关系而非相关关系,理论基础来自两大框架:关键依赖:因果效应估计通常需要已知或假设因果图(因果发现的产出);因果表示学习是将深度学习引入上游的桥梁;LLM 是目前贯穿所有方向的"横切关注点"。
老毛肚
5 小时前
人工智能
·
深度学习
·
cnn
卷积神经网络CNN
ps:最快速度了解一下下,当扩充了1. 知道图像的基本概念2. 掌握使用matplotlib加载图片方法
八月瓜科技
6 小时前
数据库
·
人工智能
·
科技
·
深度学习
·
机器人
用AI来省电?iOS26.5正式版全球推送:信号弱网双提升,AI省电模式上新
2026年5月12日,苹果公司正式向全球iPhone用户推送iOS 26.5正式版系统更新,此次更新以信号增强、弱网覆盖优化和AI 智能省电为核心亮点,适配iPhone 12及以上全系列机型。
碧海银沙音频科技研究院
6 小时前
人工智能
·
深度学习
·
算法
音箱在加入 NN AEC(神经网络声学回声消除) 后出现反复重启问题解决
从日志分析,音箱在加入 NN AEC(神经网络声学回声消除) 后出现反复重启,根本原因是 CPU0 的用户栈(USP)溢出。 关键错误信息为:
现代野蛮人
7 小时前
网络
·
人工智能
·
python
·
深度学习
·
tensorflow
【深度学习】 —— VGG-16 网络实现猫狗识别
利用 TensorFlow,通过构建 VGG-16 网络实现猫狗识别。数据集中有 dog 和 cat 2 类图片,每类图片数量各有 1700 张图片。
五月底_
8 小时前
人工智能
·
深度学习
Transformer
Transformer 是由 Google 在 2017 年的经典论文《Attention Is All You Need》中提出的一种深度学习架构。它彻底抛弃了以往处理序列数据时常用的 RNN(循环神经网络)和 CNN(卷积神经网络),完全依赖于注意力机制(Attention Mechanism)。
Ares-Wang
8 小时前
人工智能
·
深度学习
·
学习
AI》》 监督学习,无监督学习,半监督学习、强化学习 、深度学习 统计学的常用方法
是统计学和机器学习中用于衡量估计量或预测值与真实值之间差异的核心指标,其值为误差平方的期望或平均值,计算公式为
这张生成的图像能检测吗
10 小时前
人工智能
·
深度学习
·
计算机视觉
·
transformer
(论文速读)DSFormer:用于高光谱图像分类的双选择融合变压器网络
论文题目:Dual selective fusion transformer network for hyperspectral image classification(用于高光谱图像分类的双选择融合变压器网络)
沪漂阿龙
10 小时前
人工智能
·
深度学习
·
神经网络
面试题:神经网络的超参数怎么讲?层数、神经元、学习率、Batch Size、调参方向一文讲透
超参数,简单说,就是训练开始前就要先定好的外部配置。它们不是模型自己从数据里学出来的,而是你在训练之前就要先拍板的设置。
Ricardo-Yang
11 小时前
python
·
深度学习
·
神经网络
·
算法
·
视觉检测
使用GEE以及LandSat8植被指数NDVI计算
进入GEE 右上角dataset打开 页面往下拉找到Landsat系列数据 选择地表反射率的L2层级产品,这个产品是做了辐射定标,大气校正,以及正射校正的产品 点击L2进入如下界面 下拉找到代码编辑器,点击 转到如下界面 可以新建一个项目或者是使用一个创建好的项目,之后的结果会存放再对应的项目之下,第一次使用需要登录谷歌账号绑定google cloud,可以创建项目相关文件夹
lazybird74
11 小时前
人工智能
·
深度学习
·
神经网络
PINN-物理信息神经网络及其在航空中的应用
物理信息神经网络 (PINN) 在深度学习模型的训练中包含支配现实的物理定律,从而能够对复杂现象进行预测和建模,同时遵守基本物理原理。
龙侠九重天
12 小时前
人工智能
·
深度学习
·
架构
·
大模型
·
llm
·
deepseek
·
deepseek v4
DeepSeek V4 深度解析:从架构创新到开发者生态的全面解读
值得注意的是,DeepSeek 宣布 deepseek-chat 和 deepseek-reasoner 将于 2026年7月24日停用,前者将迁移到 V4-Flash 的 non-thinking 模式,后者迁移到 thinking 模式。
my烂笔头
12 小时前
人工智能
·
深度学习
·
计算机视觉
目标检测个人知识库
锚框 anchor → 可以用来生成候选区 proposal 候选区 proposal → 通常出现在双阶段检测器里 阶段 stage → 决定有没有单独的候选区生成阶段
dfsj66011
12 小时前
深度学习
·
架构
·
transformer
第九章:Transformer 架构
[!info] 在上一章中,我们看到了注意力机制如何打破了 Seq2Seq 的信息瓶颈。巴赫达瑙(Bahdanau)等人的一个朴素想法——让解码器在每步生成时"回头查阅"编码器的所有隐状态——不仅让机器翻译的质量大幅提升,还给整个 NLP 领域留下了一个迷人的可解释性工具:对齐矩阵。注意力机制,成了那个时代 NLP 系统的"标配附件"。
江汉似年
13 小时前
人工智能
·
深度学习
·
算法
·
rl
强化学习中的 On-policy 与 Off-policy 全面解析
本文系统总结强化学习中 On-policy 与 Off-policy 的核心区别、典型算法、底层原理以及现代 RL 中的发展趋势。
TangGeeA
13 小时前
人工智能
·
深度学习
·
机器学习
Hermes Agent RL / Evaluation Environment 使用与实现分析
先说一个最重要的边界:换句话说,它训练或评测的是更底层的能力:如果你想研究 Hermes 的完整自进化能力,应该重点看 memory、skills、multi-agent delegation 等模块;如果你想研究模型如何在可验证任务里被评测、采样 trajectory、计算 reward、进入 RL 训练管线,才应该看这套环境。
dhashdoia
13 小时前
人工智能
·
gpt
·
深度学习
·
claude
2026年深度体验:OpenAI Codex App如何重塑AI辅助编程工作流
近期OpenAI的Codex应用持续进行高强度迭代,集成了最新的GPT-5.5模型,内置了浏览器功能,并整合了Gpt-image-2图像生成能力。经过半个月的深度使用,这款工具不仅在稳定性上表现出色,功能层面也相当全面。如果你正在使用Claude Code但受限于免费额度不足或担心账户风险,或是AI编程新手寻求零门槛入门方案,本文将提供有价值的参考。