深度学习

数智工坊10 分钟前
论文阅读·人工智能·深度学习·算法·transformer
视觉-语言-动作模型解剖学:从模块、里程碑到核心挑战想象一下这个场景:你对家里的机器人说"帮我把餐桌上的蓝色杯子拿到厨房水槽里洗一下"。一个普通的机器人可能会愣住——它不知道什么是"蓝色杯子",不知道"餐桌"在哪里,更不知道"洗一下"具体要做什么动作。而一个装备了视觉-语言-动作(VLA)模型的机器人,会立刻理解你的指令,识别出餐桌上的蓝色杯子,规划出一条安全的路径,伸出手臂拿起杯子,走到水槽边打开水龙头,完成清洗动作。
惊鸿一博36 分钟前
人工智能·深度学习·transformer
Transformer模型图解(简单易懂版)翻译自 https://jalammar.github.io/illustrated-transformer/
Omics Pro1 小时前
人工智能·python·深度学习·plotly·numpy·pandas·scikit-learn
填补蛋白质组深度学习预处理教学空白质谱蛋白质组学可生成表征生物样品中肽段/蛋白质组分的复杂数据,各类机器学习是串联质谱肽段鉴定及数据分析全流程的核心计算方法。随着深度学习成为数据建模与解析的强力机器学习手段,蛋白质组学计算研究者利用海量公开数据集训练机器学习模型,用于预测肽段碎裂谱与液相色谱保留时间。ProteomicsML等资源为这类学习任务提供了详尽的演示教程,缩小了蛋白质组学与机器学习领域的隔阂。但现有深度学习教学材料普遍缺失数据预处理嵌入这一关键步骤:肽段文本序列必须转换为数值格式(即嵌入)才能用于模型训练。肽段嵌入方法种类繁多,
解局易否结局2 小时前
人工智能·深度学习·transformer
ops-transformer 的 FlashAttention:给昇腾NPU 配了个“高效厨房“第一次在昇腾NPU 上跑 LLaMA-13B 的时候,显存爆了。不是模型太大,是 attention 计算中间存了一大堆临时矩阵,把 HBM(高带宽内存)撑到爆。
东湖山上2 小时前
服务器·人工智能·深度学习·transformer·gpu算力
GTAC: A Generative Transformer for Approximate Circuits在日益增长的能效需求和性能挑战下,近似计算(Approximate Computing)通过允许可控制的精度损失,换取了显著的功耗、性能和面积(PPA)改善。然而,传统的近似逻辑综合(Approximate Logic Synthesis, ALS)方法多基于增量式改写,难以探索全新的电路结构。而生成式AI的概率特性,恰恰与近似计算的松弛等价要求天然契合。
解局易否结局2 小时前
人工智能·深度学习·transformer
ops-transformer 里的 FlashAttention:让大模型在昇腾NPU上“吃得少、跑得快“刚接触 CANN 那会,我被算子系统砸懵了——一堆仓库名、一层层架构,完全不知道从哪下手。直到朋友让我帮他看一段大模型推理的代码,发现瓶颈全在 attention 计算上,这才第一次认真看了 ops-transformer 这个仓库。
陈天伟教授3 小时前
人工智能·rnn·深度学习
图解人工智能(28)循环神经网络是如何实现记忆功能讨论一下,循环神经网络是如何实现记忆功能的?为什么说这种记忆功能对成串的数据特别重要?循环神经网络是通过循环连接实现记忆功能的。循环连接的存在意味着当前状态会传递到下一个状态,这样从前到后的传递过程就形成了对历史信息的记忆。
AI医影跨模态组学3 小时前
人工智能·深度学习·论文·医学影像·影像组学·医学科研
NPJ Precis Oncol(IF=8)南京医科大学第一附属医院放射肿瘤科等团队:整合MRI与ECV的放射组学模型提高高级别胶质瘤进展预测准确性01文献学习今天分享的文献是由南京医科大学第一附属医院放射肿瘤科等团队于2026年5月在肿瘤学顶刊《npj Precision Oncology》(中科院1区top,IF=8)上发表的研究“Radiomics model integrating MRI and ECV enhances prediction accuracy for progression in high-grade glioma”即整合MRI与ECV的放射组学模型提高高级别胶质瘤进展预测准确性,该研究构建了一种基于MobileNet混合
OpenBayes3 小时前
人工智能·深度学习·ai·agent
外语、方言、少数民族语言全覆盖:Hy-MT1.5 支持 1056 个翻译方向;MIT 联合发布 MathNet:涵盖 2.7 万道奥数真题的多模态数学推理基准9 个公共数据集:* Claw-Eval 真实世界评测基准数据集* MathNet 多模态数学基准推理数据集
手写码匠3 小时前
人工智能·深度学习·算法·aigc
手写 AI 推理加速引擎:从零实现 KV Cache 与 Speculative Decoding大模型推理慢是生产环境的第一痛点。同样是 7B 模型,naive 逐 token 生成和经过优化的推理引擎,吞吐差距可达 5-10 倍。本文不依赖任何推理框架,从零手写 KV Cache 和 Speculative Decoding 两大加速技术,代码可直接运行,效果立竿见影。
文歌子5 小时前
深度学习
TorchGeo 入门:用 PyTorch 处理遥感数据,从零搭建卫星图像分类模型面向 PyTorch 用户的遥感深度学习第一课。读完你将能用 TorchGeo 加载卫星图像、训练分类模型。
茗创科技5 小时前
python·深度学习·机器学习·matlab·脑网络
Nat Hum Behav | 特征选择会导致基于脑影像的机器学习生物标志物产生迥异的神经生物学解释特征选择虽能提升脑影像机器学习模型的预测性能,但被剔除的弱连接特征同样蕴含显著预测能力。《Nature Human Behaviour》刊发的这项研究通过四个大规模数据集(超1.2万人)验证:依据关联强度将脑连接特征划分为互不重叠的十分位组后,排名靠后的特征组在认知、发育及精神疾病表型预测中的表现与高排名组相当,且能成功泛化至外部队列。同时研究警示,过度依赖特征选择可能会歪曲对神经生物学机制的解释,强调全脑广泛分布的微弱信号不容忽视,这对提升模型可解释性与可重复性具有重要启示。
dr_yingli5 小时前
人工智能·深度学习
MedGemma皮肤肿瘤6分类LLM fineturn流程验证环境:成功标准:GPU 显示 A100,无报错。成功标准:模型加载成功,能做一次带图像的普通推理(不训练),确认多模态输入正常。
放下华子我只抽RuiKe56 小时前
前端·javascript·人工智能·pytorch·深度学习·react.js·前端框架
React 从入门到生产(一):JSX 与组件思维创作者: Yardon | GitHub: github.com/YardonYan | 版本: v1.0 |
RSTJ_16256 小时前
人工智能·深度学习
PYTHON+AI LLM DAY FIFITY今天简单聊聊循环神经网络(Recurrent Neural Network RNN):就是用来专门处理序列数据(后面的数据跟前面的数据有关系)或是有时间依赖的数据的神经网络,也是人工神经网络(ANN)的一种.常应用于自然语言处理(NLP):文本生成,语言建模,机器翻译,情感翻译等.时间序列预测:股市预测,气象预测,传感器数据分析等.语音识别:将语音转换成文字.音乐生成:通过学习音乐的时许模式来生成新音乐曲等方面.RNN网络内部结构:词嵌入层,RNN循环层,全连接层.词嵌入层:主要是将词转换为词向量.具体过
qqqweiweiqq6 小时前
人工智能·python·深度学习
Jetson Orin nx 无法train pi0export OMP_NUM_THREADS=2 export MKL_NUM_THREADS=2 export NUMEXPR_NUM_THREADS=2
koharu1236 小时前
人工智能·深度学习·神经网络·三维点云
PointNet 与 PointNet++ 详解PointNet 发表于 CVPR 2017,PointNet++ 发表于 NIPS 2017,两者都来自斯坦福大学。前者提出了用一个对称函数(Max Pooling)来处理天然无序的点集,实现了端到端的点云学习。后者针对 PointNet 无法感知局部结构的缺陷,引入了层级化的特征提取,使网络能够像 CNN 处理图像那样,从局部到全局逐步提炼语义。
动物园猫6 小时前
深度学习·yolo·分类
棉花病害图像分类数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1lupIbmRgAYlsenadogdqMQ?pwd=4mas
人工智能培训6 小时前
人工智能·深度学习·机器学习·docker·容器
AI人工智能未来发展趋势当ChatGPT实现自然语言的深度交互,当AI机器人走进工厂车间,当智能算法助力疫苗研发提速,人工智能已从实验室的前沿探索,成为渗透社会各领域的核心生产力。当前,AI技术正处于从“弱智能”向“强智能”跨越的关键节点,结合技术迭代方向与行业应用实践,其未来发展将呈现技术深耕、场景融合、伦理规范协同推进的清晰态势,深刻重塑人类生产生活方式,开启智能时代的全新篇章。
生物信息与育种7 小时前
人工智能·深度学习·职场和发展·数据分析·r语言
PlantBiMoE开源:轻量高效的植物基因组基础模型基因组里藏着大量调控元件和结构信息,它们分布在编码区和非编码区,参与转录起始、可变剪接、染色质开放等关键过程。这些区域碱基组成不均、依赖关系长、交互复杂,传统窗口式模型很难捕捉全局上下文。