技术栈
深度学习
机器学习之心
1 小时前
深度学习
·
lstm
·
transformer
一张Transformer-LSTM模型的结构图
一个典型的 Transformer-LSTM 混合模型 架构。这种设计结合了 Transformer 处理全局关联的能力和 LSTM 处理时序序列的优势。
Blossom.118
2 小时前
人工智能
·
深度学习
·
yolo
·
目标检测
·
智能手机
·
边缘计算
·
mnn
AI边缘计算实战:基于MNN框架的手机端文生图引擎实现
摘要:本文将撕开大模型端侧部署的技术面纱,从零搭建一个可在手机实时运行的文生图系统。不同于云端推理方案,我们将完整实现模型量化压缩、计算图优化、异构设备调度等核心模块,基于阿里巴巴MNN框架将Stable Diffusion模型压缩至487MB,在骁龙8 Gen3上实现15秒生成512x512图像,显存占用仅2.1GB。完整代码包含ONNX转换、INT8量化、GPU Shader编写、内存管理优化等工程细节,提供从模型到APK的端到端部署方案。
胡伯来了
2 小时前
人工智能
·
pytorch
·
深度学习
·
transformer
·
transformers
09 Transformers - 训练
现在,我们将看到如何在不使用Trainer类的情况下实现与上一节相同的结果。同样,我们假设您已经完成了第2节中的数据处理。这里有一个简短的总结,涵盖了你需要的一切:
有Li
3 小时前
论文阅读
·
人工智能
·
深度学习
·
计算机视觉
·
文献
·
医学生
MIRAGE:针对嘈杂环境鲁棒性的医学图像-文本预训练|文献速递-医疗影像分割与目标检测最新技术
2025.12.23这篇文章发表于《Medical Image Analysis》期刊(2026 年第 109 卷),由南方科技大学、香港大学等机构学者联合撰写,聚焦医疗图像 - 文本预训练中的噪声鲁棒性问题,提出一种名为 MIRAGE 的新型多模态学习框架。
STLearner
3 小时前
大数据
·
人工智能
·
python
·
深度学习
·
机器学习
·
数据挖掘
·
自动驾驶
AAAI 2026 | 时空数据(Spatial-temporal)论文总结[上](时空预测,轨迹挖掘,自动驾驶等)
AAAI 2026将在2026年1月20日到1月27日于新加坡(Singapore)举行。AAAI 2026会议主会共有23, 680篇论文投稿,其中4, 167 篇被接收,接收率为17.6%。
一招定胜负
3 小时前
人工智能
·
深度学习
·
神经网络
神经网络入门
神经网络属于机器学习算法的深度学习模块。神经网络的核心思想是模拟人脑神经元的工作模式,进行数据处理与分析。我们先回顾一下逻辑回归模型:对于输入的特征,我们会先进行矩阵运算,再将运算结果映射到sigmoid函数中,最终得到分类结果或对应的概率。
deephub
4 小时前
人工智能
·
python
·
深度学习
·
大语言模型
·
ai-agent
Pydantic-DeepAgents:基于 Pydantic-AI 的轻量级生产级 Agent 框架
DeepAgents的灵感源自 LangChain deepagents,但在设计上更做减法,它强调类型安全且内置了 Docker 沙箱
八月瓜科技
5 小时前
大数据
·
人工智能
·
科技
·
深度学习
·
机器人
·
娱乐
工业和信息化部国际经济技术合作中心第五党支部与八月瓜科技党支部开展主题党日活动暨联学联建活动
12月22日,工业和信息化部国际经济技术合作中心第五党支部与北京八月瓜科技有限公司联合开展主题党日活动暨联学联建活动。
胡伯来了
5 小时前
人工智能
·
深度学习
·
机器学习
·
transformer
·
transformers
08 Transformers - 微调
下面是我们如何在PyTorch中训练一个批处理的序列分类器:当然,只训练两个句子的模型不会产生很好的结果。为了得到更好的结果,你需要准备一个更大的数据集。
q_3023819556
5 小时前
人工智能
·
python
·
深度学习
·
能源
·
课程设计
·
ai编程
双能突围!能源高效型模型压缩+碳足迹追踪,解锁数据中心与农业AI新价值
一边是数据中心算力激增带来的高能耗、高碳排放难题——全球数据中心年耗电量已占全球总电量的3%以上,且仍在快速增长;另一边是农业病虫害识别的“轻量化刚需”——无人机搭载AI模型时,受限于算力、续航,难以实现实时精准识别。今天,我们带来一款“能源高效型模型压缩算法+碳足迹追踪系统”的双能解决方案,既破解数据中心能耗与碳排放痛点,又让轻量化视觉模型成功落地农业无人机,为毕业设计提供高价值实践方向!
无心水
5 小时前
人工智能
·
python
·
深度学习
·
机器学习
·
stable diffusion
·
ai镜像开发
·
ai镜像
【Stable Diffusion 3.5 FP8】1、Stable Diffusion 3.5 FP8 入门指南:为什么它能颠覆文生图效率?
作为AI图像生成领域的“效率革命”之作,Stable Diffusion 3.5 FP8(以下简称SD 3.5 FP8)的发布彻底打破了文生图技术“高质量=高资源消耗”的固有认知。
小女孩真可爱
5 小时前
人工智能
·
pytorch
·
深度学习
·
学习
·
大模型
大模型学习记录(九)-------Agent
Agent(智能代理)是一种能够自主执行任务、做出决策并与环境交互的智能系统。在AI领域,Agent通常指的是结合了大语言模型(LLM)和工具调用能力的智能实体,能够理解用户意图,规划执行步骤,并通过调用外部工具来完成复杂任务。
长相忆兮长相忆
6 小时前
深度学习
·
机器学习
·
推荐算法
【推荐算法】PRM重排模型:Personalized Re-ranking for Recommendation
作为推荐系统的关键环节,排序的任务是给用户提供一个有序的item列表。传统上,一个排序函数通过最优化全局表现从标注过的数据集中得到学习,它能够为每个独立的item输出一个排序分。然而,应用到每个item上的打分函数是独立的,同时也没有明确考虑item之间的相互影响及用户的偏好和意图,这可能带来一个次优解。
这张生成的图像能检测吗
6 小时前
人工智能
·
深度学习
·
计算机视觉
·
语义分割
·
目标追踪
·
分类模型
(论文速读)RoShuNet:一个轻量级的基于卷积神经网络的可见图像特征提取器
论文题目:A lightweight convolutional neural network-based feature extractor for visible images(一个轻量级的基于卷积神经网络的可见图像特征提取器)
咬人喵喵
6 小时前
人工智能
·
深度学习
·
神经网络
神经网络:教电脑像人脑一样思考
生活中的例子 01人脸识别:手机通过你的脸部特征来解锁。生活中的例子 02自动驾驶:汽车识别红绿灯和行人,决定是停还是走。
思通数据
6 小时前
人工智能
·
深度学习
·
安全
·
目标检测
·
机器学习
·
计算机视觉
·
架构
AI智能预警系统:矿山、工厂与油气站安全管理架构浅析
随着矿山、工厂和油气站等高风险行业对安全管理要求的提升,传统人工巡查已无法满足严格的监管需求。人工巡查存在隐患空档、疏漏和瞒报问题。基于AI智能预警系统,结合深度学习、计算机视觉和大数据分析等前沿技术,能够实现全天候、全方位的智能巡检,提高安全监控效率、降低成本,并成为未来安全管理的核心技术。
深度学习实战训练营
7 小时前
人工智能
·
深度学习
Monodepth:基于左右一致性的无监督单目深度估计,单目估计的起步-k学长深度学习专栏
本文来源:k学长的深度学习宝库,点击查看源码&详细教程。深度学习,从入门到进阶,你想要的,都在这里。包含学习专栏、视频课程、论文源码、实战项目、云盘资源等。
碎碎思
7 小时前
人工智能
·
深度学习
·
神经网络
·
机器学习
·
fpga开发
FINN:FPGA AI 推理新范式 —— 定制化、高性能、量化神经网络编译器框架
FINN 是一个由 Xilinx(现 AMD Research)集成通信与 AI 实验室开源的机器学习框架,它提供了一个端到端的方案,用于探索和实现 量化神经网络(QNN)在 FPGA 上的高效推理加速器。它不是通用的神经网络加速通用库,而是通过 协同设计(co-design) 和 数据流体系结构生成,为每个网络构建定制的数据流式硬件架构。
论缘投稿网
7 小时前
人工智能
·
深度学习
·
aigc
论文生成降重会改变内容吗
传统降重依赖人工逐句修改,效率低且易遗漏关键信息;而AI降重工具(如AI降重修改神器晓橙序)通过自然语言处理(NLP)技术,实现语义级改写,其核心逻辑可拆解为三步:
paopao_wu
7 小时前
人工智能
·
深度学习
深度学习4:手写数字识别
了解了神经网络的结构之后,这里我们来进行手写数字图像的分类。神经网络的“推理处理”。这个推理处理也称为神经网络的前向 传播(forward propagation)。