深度学习

逻辑君7 小时前
人工智能·深度学习·神经网络·机器学习
认知神经科学研究报告【20260010】认知神经科学研究报告系列暂时告一段落,我说说我的心得体会: 最大的想法就是AI的涌现现象让我感到一种莫名其妙的担忧。
龙文浩_8 小时前
人工智能·深度学习·神经网络·学习·自然语言处理
Attention Mechanism: From Theory to CodeAttention Mechanism: From Theory to Code
微臣愚钝8 小时前
人工智能·深度学习·prompt
prompt目录模型选择写作prompt中转英英转中中转中英文缩写英文扩写表达润色(英文论文)表达润色(中文论文)
宝贝儿好9 小时前
人工智能·python·深度学习·神经网络·自然语言处理·机器人·语音识别
【LLM】第二章:文本表示:词袋模型、小案例:基于文本的推荐系统(酒店推荐)上一个章节我们讲了如何分词,分完词下一步就是,如何把这些词(tokens)转化为计算机可以读懂的词向量,这个步骤也叫文本表示。
啦啦啦在冲冲冲10 小时前
人工智能·深度学习
多头注意力机制的优势是啥,遇到长文本的情况,可以从哪些情况优化呢首先多头注意力机制的优势,总结为四点或者三点1. 捕捉多维度的语义特征(表示子空间的多样性)2. 增强模型的表达能力与稳定性
CV-杨帆11 小时前
人工智能·深度学习·安全
ICLR 2026 LLM安全相关论文整理整理日期:2026-04-11ICLR 2026 共录用 5300+ 篇论文(其中 Oral 223 篇),本文从中筛选出 约 50 篇与大模型安全直接相关的论文,涵盖 Oral 和 Poster 两个类别。
小程故事多_8011 小时前
人工智能·深度学习·架构·aigc·transformer
从零吃透Transformer核心,多头注意力、残差连接与前馈网络(大白话完整版)在学习大模型相关知识时,Transformer绝对是绕不开的核心架构,而其中的多头注意力机制、残差连接、层归一化以及前馈网络,更是让很多新手望而却步的“拦路虎”。不少人第一次接触这些概念时,都会被复杂的公式、抽象的矩阵维度和专业术语搞得晕头转向,甚至越看越困惑。其实这些看似高深的技术,本质上都是为了解决“让模型更好地理解语言”这一核心问题,只要用通俗的类比、清晰的步骤拆解,就能彻底搞懂它们的原理和作用。
清空mega13 小时前
人工智能·深度学习
动手学深度学习——SSD在前面的学习中,我们已经依次了解了:什么是物体检测边界框如何表示目标位置锚框的基本思想多尺度锚框为什么重要
bryant_meng15 小时前
人工智能·深度学习·业界资讯
【Reading Notes】(4)Favorite Articles from 2021邱锡鹏,这是Transformer最全综述(2021年06月11日)从R-CNN到Mask R-CNN的思维跃迁(2021年06月15日)
清空mega15 小时前
人工智能·深度学习·目标跟踪
动手学深度学习——多尺度锚框在前面的学习中,我们已经知道了锚框的基本思想:在图像的每个位置预先生成若干个不同大小、不同宽高比的候选框,再由模型判断这些框中是否包含目标,并进一步修正位置。
克里斯蒂亚诺·罗纳尔达15 小时前
深度学习·学习·机器学习
智能体学习16——学习与适应(Learning-and-Adaptation)-深入解读LLM 学会了"说话",但说的内容不一定符合人类期望。对齐就是让模型"说人话、办人事"。直觉:想象你在调水温,PPO 说"每次只能转一点点,别一下从冷水转到开水"。ε 就是"每次最多转多少"的限制。
冰西瓜60016 小时前
人工智能·深度学习
深度学习的数学原理(二十六)—— 多头注意力在上一篇中,我们完整拆解了缩放点积注意力的核心原理:它可以让模型根据词与词的相关性,动态分配注意力权重,实现“该关注谁就关注谁”的信息融合。本文会继续介绍应用更广泛的多头注意力机制。
憨波个16 小时前
人工智能·深度学习·lstm·transformer·音频·语音识别
【说话人日志】从 LSTM attractor 到 Transformer attractor:EEND-TA论文:Transformer Attractors for Robust and Efficient End-to-End Neural Diarization 简称:EEND-TA 作者:Lahiru Samarakoon, Samuel J. Broughton, Marc Harkonen, Ivan Fung 时间:ASRU2023 任务:Speaker Diarization,回答“谁在什么时候说话”
这张生成的图像能检测吗16 小时前
人工智能·深度学习·知识图谱·故障诊断
(论文速读)基于知识图谱构建的大型工业设备故障诊断模型论文题目:Large model for fault diagnosis of industrial equipment based on a knowledge graph construction(基于知识图谱构建的大型工业设备故障诊断模型)
ccLianLian16 小时前
人工智能·深度学习
深度学习基础·损失函数参考文献
极光代码工作室17 小时前
python·深度学习·机器学习·ai·自然语言处理
基于NLP的智能客服系统设计与实现随着人工智能技术的快速发展与企业数字化转型的深入推进,传统人工客服面临响应延迟高、服务成本大、知识覆盖不全、7×24小时服务能力弱等瓶颈。自然语言处理(NLP)作为AI落地的关键使能技术,为构建高效、可扩展、拟人化的智能客服系统提供了坚实基础。本文围绕“基于NLP的智能客服系统”开展设计与实现研究,融合规则匹配、语义相似度计算与预训练语言模型(BERT+BiLSTM-CRF)三阶段混合架构,构建具备意图识别、实体抽取、多轮对话管理及FAQ精准检索能力的端到端客服系统。系统采用前后端分离架构,后端基于Fla
卡梅德生物科技小能手17 小时前
经验分享·深度学习·生活
整合素家族核心靶点解析:CD51(Integrin αv)的分子机制与药物研发技术前瞻在细胞生物学与生物医药研发领域,整合素(Integrin)家族始终是研究的热点。其中,CD51(整合素αv亚基) 因其在细胞黏附、迁移及信号转导中的枢纽作用,成为了连接细胞外基质(ECM)与细胞内环境的关键分子。尽管目前尚无直接靶向CD51的单抗药物获批,但其在研管线与分子机制的深度解析,为技术开发者与科研人员提供了广阔的研究视角。本文将从技术维度,系统梳理CD51的作用机制与药物研发现状。
张二娃同学18 小时前
人工智能·windows·深度学习·github·claude code
Claude Code 使用教程:下载安装、CC Switch 配置、MiniMax API 获取与启动实操最近在配置 Claude Code 的过程中,我整理了一套比较完整的实操流程。本文不讲太多抽象概念,而是按照实际操作界面的顺序,带大家一步一步完成整个配置过程。全文主要包含四部分内容:Claude Code 下载与安装、GitHub 项目《CC Switch》安装、MiniMax 模型 API 获取,以及 Claude Code 的启动与初始使用。
V搜xhliang024618 小时前
大数据·人工智能·python·深度学习·机器学习·机器人
基于¹⁸F-FDG PET/CT的深度学习-影像组学-临床模型预测非小细胞肺癌脉管侵犯的价值基于¹⁸F-FDG PET/CT的深度学习-影像组学-临床模型预测非小细胞肺癌脉管侵犯的价值 摘要 脉管侵犯(Lymphovascular Invasion, LVI)是非小细胞肺癌(NSCLC)术后复发和不良预后的独立危险因素,术前准确评估LVI状态对于手术方案制定和辅助治疗决策具有重要临床意义。¹⁸F-FDG PET/CT作为融合代谢与解剖信息的多功能影像技术,为LVI的无创预测提供了独特的影像学生物标志物平台。本文系统阐述基于PET/CT的深度学习-影像组学-临床多维度融合模型预测NSCLC脉管侵犯
XuecWu318 小时前
人工智能·深度学习·算法·计算机视觉·语言模型
原生多模态颠覆Scaling Law?解读语言“参数需求型”与视觉“数据需求型”核心差异在大模型发展初期,行业普遍遵循“均匀堆料”的Scaling逻辑——参数、数据、算力同步提升,模型能力便会线性增长。但随着原生多模态技术的发展,这一固有认知被彻底打破:全模态模型的Scaling并非均匀分布,不同模态对资源的需求存在显著差异。杨立昆、谢赛宁最新论文及文心5.0技术报告均指出,即便加入负载均衡损失,模型仍会向语言模态倾斜更多专家资源,核心原因正是“语言是参数需求型、视觉是数据需求型”。结合自身对多模态模型的理解,本文将拆解这一核心结论,解答“原生多模态为何颠覆传统Scaling”及“不同模态资