技术栈
deepseek
OpenBayes
14 分钟前
人工智能
·
深度学习
·
机器学习
·
ocr
·
大语言模型
·
文本处理
·
deepseek
教程上新丨Deepseek-OCR 以极少视觉 token 数在端到端模型中实现 SOTA
众所周知,大语言模型在处理千字、万字或是更长文本时,计算量往往急剧增加,甚至直接导致算力的「烧钱」游戏,也因此制约了 LLM 在处理高密度文本信息场景中的效率边界。
_大学牲
15 小时前
deepseek
·
mcp
·
trae
从年初DeepSeek的爆火🔥 - 到年底Trae solo 的上线⚙️ :2025 AI 大年,一个普通人的认知指南 ! 🧭
2025年初,在还是欢庆的浓郁的新年氛围之中,DeepSeek 猛然爆火,但是他的爆火并非偶然,而是技术积累、产品策略与市场机遇共同作用的结果。核心原因可以概括为:以一个极具竞争力的 开源模型,用远低于行业预期的成本,提供了顶尖的性能,并通过出色的产品体验迅速吸引了大量用户。
win4r
1 天前
aigc
·
openai
·
deepseek
🚀微调的力量:看3B参数的DeepSeek-OCR如何蜕变为中文识别高手!零成本微调保姆级教程:用Google Colab免费GPU,十分钟打造一个专属领域的
你是否遇到过这样的困境:想要识别图片中的文字,但大模型太"重"跑不动,小模型又经常认错字?比如把清晰的"一"识别成"二",把重要的表格数据搞得面目全非……
paopao_wu
3 天前
ai
·
ocr
·
deepseek
DeepSeek-OCR实战(02):DeepSeek-OCR模型介绍
DeepSeek-OCR实战是一个系列文章,包含了从基础运行环境搭建到应用接入全过程。本章会对DeepSeek-OCR模型进行介绍
数据智能老司机
5 天前
架构
·
llm
·
deepseek
构建一个 DeepSeek 模型——通过键值缓存(Key-Value Cache, KV Cache)解决推理瓶颈
要理解 DeepSeek 架构的关键创新,我们需要先看清这些创新要解决的技术痛点。本章对应全书开篇所述“四阶段路线图”的第 1 阶段:KV Cache 基础。它针对现代 LLM 推理中最根本的瓶颈。在进入第 2 阶段并理解 DeepSeek 的核心设计(如多头潜在注意力 MLA)之前,必须先掌握 KV Cache 的来龙去脉——以及它被设计出来要解决的问题。
武子康
5 天前
人工智能
·
深度学习
·
机器学习
·
ai
·
ocr
·
deepseek
·
deepseek-ocr
AI研究-119 DeepSeek-OCR PyTorch FlashAttn 2.7.3 推理与部署 模型规模与资源详细分析
要使用DeepSeek-OCR,需准备支持GPU的Python环境。根据官方说明,模型已在Python 3.12、PyTorch 2.6.0、Transformers 4.46.3下测试。
OpenBayes
7 天前
人工智能
·
深度学习
·
分类
·
数据挖掘
·
ocr
·
数据集
·
deepseek
OCR 新范式!DeepSeek 以「视觉压缩」替代传统字符识别;Bald Classification数据集助力高精度人像分类
公共资源速递1 个公共教程:* DeepSeek-OCR:利用视觉模态压缩长文本上下文的新方法5 个公共数据集:
安如衫
7 天前
人工智能
·
llm
·
sft
·
后训练
·
deepseek
【学习笔记更新中】Deeplearning.AI 大语言模型后训练:微调与强化学习导论
在构建LLM Agent应用的征程中,我们都可能遇到过这样的困境:尽管尝试了精妙的提示词工程(Prompt Engineering)、更换了更强大的模型提供商,甚至将复杂任务进行了拆解,但LLM组件就是不“work”。
realhuizhu
7 天前
ai提示词
·
deepseek
·
工作周报
·
职场效率
·
周报生成器
周报写了2小时还被挑刺?试试这个AI生成框架
周五下午3点,你打开文档准备写周报。半小时过去了,标题栏还是空的。想想这周做了什么...修了几个bug、开了两场会、推进了项目进度...但怎么写成周报呢?
l1t
8 天前
数据库
·
lua
·
c
·
duckdb
·
deepseek
利用DeepSeek采用hugeint转字符串函数完善luadbi-duckdb的decimal处理
用如下函数替换原有同名函数,弥补了原函数不能处理非常大的HUGEINT值的缺陷。让DeepSeek利用已有hugeint转换的字符串,结合scale插入小数点,避免除法运算。
Mr.Lee jack
8 天前
deepseek
【CUDA 编程思想】FwdKvcacheMla 算子详细数据流程讲解
形状: [batch_size, seqlen_q, num_heads_q, head_size]具体示例: [2, 2, 4, 64]
武子康
8 天前
人工智能
·
深度学习
·
机器学习
·
ai
·
ocr
·
deepseek
·
deepseek-ocr
AI研究-121 DeepSeek-OCR 研究路线:无限上下文、跨模态抽取、未来创意点、项目创意点
DeepSeek-OCR提出的上下文光学压缩为扩展LLM记忆提供了新思路。未来研究可以基于此探索“无限上下文”模型:模拟人类记忆,将旧对话压缩成模糊图像存储,新的信息用清晰图像保留,模型动态决定何时解压细读。这涉及构建分层记忆模块、研究压缩级别与任务性能的关系,可能催生出类人记忆的对话系统架构。
嗷嗷哦润橘_
8 天前
网络
·
阿里云
·
deepseek
集群网络技术1:RDMA和相关协议
一、核心概念:为什么需要RDMA?传统网络通信的问题(TCP/IP栈的瓶颈) 在传统的网络通信(如标准的TCP/IP Socket)中,数据从应用层到网卡需要经过复杂的路径:
武子康
9 天前
人工智能
·
深度学习
·
机器学习
·
ai
·
ocr
·
deepseek
·
deepseek-ocr
AI研究-120 DeepSeek-OCR 从 0 到 1:上手路线、实战要点
如果读者有一定深度学习或OCR领域背景,想学习并掌握DeepSeek-OCR,以下是建议的路径:Medium: DeepSeek-OCR is here
血小溅
9 天前
后端
·
ollama
·
deepseek
Spring Boot 整合 Spring AI:接入 DeepSeek 与 Ollama 调用大模型
本文将介绍如何使用 Spring Boot 整合 Spring AI 框架,实现对 DeepSeek 在线模型和 Ollama 本地模型的调用。通过本文,你将学习:
视觉&物联智能
9 天前
人工智能
·
ai
·
机器人
·
自动化
·
aigc
·
agi
·
deepseek
【杂谈】-制造业变革:机器人与自动化引领新时代
先从设计环节说起。如今,工程师借助先进工具,短短几分钟内便能生成数千种零件配置方案,并精准权衡成本、强度与材料选用等因素。以往需耗费数周才能完成的原型制作,如今依托机器人增材制造系统,仅需一夜即可实现。再结合数字孪生技术,无需实际切割材料,就能模拟压力测试、进行公差检查并验证产品的可制造性,极大地节省了时间与成本。
win4r
10 天前
llm
·
aigc
·
deepseek
🚀超越DeepSeek-OCR!OCR领域的革命性突破:Chandra OCR本地部署+真实测评!手写体、繁体字、数学公式、重叠文字全部完美识别,告别漏字漏页
🔥🔥🔥本篇笔记所对应的视频:www.bilibili.com/video/BV1kD…这两年开源 OCR 模型真是井喷:DeepSeek-OCR、olmOCR、dots.ocr……名字越来越多,教程也越来越花。但很多朋友踩过的坑大同小异:一到长文档、多页 PDF、复杂排版(页眉页脚、多栏、表格、公式、图表),效果就开始“打折”——漏字、漏段,页眉页脚识别丢失,段落顺序错乱,表格对不齐,最后导出的文本还得人工返工。效率上不去,可靠性也难以让人放心。
shayudiandian
11 天前
deepseek
Node.js环境变量配置
Node.js环境变量的作用与常见应用场景 process.env对象的基本原理与访问方式.env文件的标准格式与书写规范 dotenv库的安装与基础使用方法 VS Code调试时环境变量的注入配置
l1t
12 天前
c语言
·
数据库
·
人工智能
·
junit
·
lua
·
duckdb
·
deepseek
利用DeepSeek辅助改写luadbi-duckdb支持日期和时间戳数据类型
1.克隆github上的luadbi存储库2.编译打包luadbi-duckdb rock包不成功,说缺少luadbi scm依赖,再编译打包luadbi-scm rock包并安装
l1t
13 天前
数据结构
·
python
·
deepseek
利用DeepSeek修改数据结构提升求解集合程序效率
为了精确翻译SQL,DeepSeek采用了复杂的字典作为循环中列表的元素,以达到用列名访问的效果,这降低了效率。 让他把b的元素由字典改成列表,用索引0代替cnt,1代替bit,2代替bit2,去掉判断重复逻辑,代new_rows用生成式代替两重for循环,while循环每步结束若new_rows有值,用它覆盖b,而不是扩展,不做别的。