大模型

QQ__176461982412 小时前
服务器·大模型·codex
为Windows系统安装Codex(保姆级教程)Win+R输入msinfo32可以直接查看:系统信息如下:点击直接下载Windows系统x64架构Git安装包(推荐)
CoderJia程序员甲14 小时前
开源·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-01-20)生成于:2026-01-20共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI应用开发正全面开花,开发者正积极利用大语言模型解决实际问题。热点集中在两大方向:一是智能体与RAG技术,如LEANN实现本地高效私密检索,PocketFlow用百行代码搭建智能体框架,凸显轻量化与实用化趋势;二是AI工具链完善,Google的langextract能精准抽取文本信息,多款Claude技能工具则极大降低了AI工作流的定制门槛。同时,经典项目如PythonRobotics和freqtrade持续受到
程序员柒叔15 小时前
大模型·llm·prompt·dify
Dify 集成-文档处理Dify 集成多种文档处理和网页爬取服务,用于从各类文档和网页中提取文本内容,构建知识库。📌 以下路径均为项目实际文件结构
人工智能培训17 小时前
人工智能·python·算法·大模型·大模型学习·大模型应用工程师·大模型工程师证书
如何持续、安全地向大模型注入新知识?向大模型持续、安全地注入新知识,核心是解决“知识时效性更新”与“原有能力保护”的平衡问题,同时规避过拟合、事实偏差、灾难性遗忘等风险。需结合参数更新、非参数补充、安全管控三大体系,形成全流程解决方案。
程序员老周66618 小时前
人工智能·深度学习·语言模型·大模型·transformer·gpu算力·cuda
10.一文学会GPU与cuda原理,并从其原理来理解FlashAttentioncuda的每个block对应gpu中的每个sm(stream multiprocessor ), cuda的一个block可以分为多个warp,一个warp内有32个线程(在不同的数据上执行相同指令)
红尘炼丹客20 小时前
人工智能·深度学习·大模型·mhc
DeepSeek 新作 mHC 解读:用流形约束(Manifold Constraints)重构大模型残差连接这篇由 DeepSeek-AI 团队于 2025 年末发布的论文 《mHC: Manifold-Constrained Hyper-Connections》(mHC:流形约束的超连接),是对现代深度神经网络(特别是大语言模型)底层宏观架构设计的一次极其深入且具有高度工程实用价值的探索。
CoderOnly2 天前
人工智能·大模型
SFT后训练32B-LLM的一些观察用COIG-CQIA数据集,以及把COIG-CQIA数据集混合guanaco和belle之后的数据集一起SFT 32B-Base模型,或者基于32B-Chat模型SFT(1-3 epoch), 目的是想提升LLM在单一语种的效果, 然后在中文通用评测集CEVAL和CMMLU评测, 效果都不如32B-Chat模型。
喜欢吃豆2 天前
人工智能·架构·大模型·2025博客之星
企业级 AI 系统分层存储架构深度研究报告随着大语言模型(LLM)与检索增强生成(RAG)技术的普及,企业数据架构面临前所未有的挑战。尽管 PostgreSQL 通过 pgvector 等插件提供了向量存储能力,但在处理亿级规模数据、高并发检索以及复杂元数据管理的生产环境中,单一的“All-in-Postgres”架构往往暴露出性能瓶颈与运维风险。
ThinkPet2 天前
java·人工智能·ai·大模型·rag·springai·mcp
【AI】大模型知识入门扫盲以及SpringAi快速入门大模型是基于海量数据训练的、参数量巨大的深度学习模型,核心能力是理解和生成人类语言,完成推理翻译代码编写等复杂任务。案例-chatgpt,千问,豆包,deepseek。
大数据002 天前
python·flask·大模型·alibaba·ollama·springai·deepseek
基于Ollama大模型学习官网下载: https://ollama.com/downloadhttps://ollama.com/download 网盘下载:
阿尼亚要好好读书呀2 天前
大模型
大模型实践之数据准备https://www.bilibili.com/video/BV15irPBzE14
盼小辉丶2 天前
深度学习·大模型·多模态大模型
数据不再“拖后腿”,EasyLink重塑非结构化数据处理新范式在人工智能 (Artificial Intelligence, AI) 技术快速发展的今天,高质量的数据预处理已成为决定智能化成败的关键因素。EasyLink 通过创新的非结构化数据处理技术,能够将混乱的多模态数据转化为高质量的 AI 数据准备基础。在本文中,我们将深入探讨 EasyLink 如何通过创新技术架构,实现对复杂文档的语义级理解,对视频内容的结构化解析,以及对全量非结构化数据的端到端处理,并介绍 EasyLink 的技术优势。
AI周红伟2 天前
大模型·微调·部署·rag·智能体·agent智能体
周红伟《DeepSeek企业大模型的企业级部署及优化和RAG知识库和Agent智能体构建的案例交付实操》——企业私有RAG知识库业务助手的构建课程背景大规模预训练模型已成为推动智能化转型的核心动力。从DeepSeek,Qwen, Yiyan 到各行业定制化大模型,越来越多的企业开始将“以大模型为中台”的技术架构融入产品与服务。
AndrewHZ2 天前
人工智能·语言模型·大模型·cpu·访存·计算逻辑
【AI黑话日日新】什么是访存bound?在后端高性能开发、算法性能调优、大数据处理等场景中,我们总会遇到一个共性问题:明明CPU配置很高,程序运行速度却始终上不去。
wangmengxxw2 天前
大模型·springai·advisor
SpringAI-AdvisorChatMemoryRepository 接⼝是对话记忆存储的抽象。⽀持多种存储⽅式,例如:内存⽅式、 JDBC ⽅式以及 Redis ⽅式等,每种实现⽅式都有特定的实现类。⽐如内存⽅式就是通过 InMemoryChatMemoryRepository 类实现的。
雪碧聊技术2 天前
java·大模型·langchain4j
1、LangChain4j 名字的寓意你好,LangChain4J:开启Java开发者的智能应用新篇章!欢迎来到本文,无论你是初次接触 LangChain4J,还是已经对 AI 应用开发有所涉猎,这里都将为你提供一个清晰的起点。
huazi-J3 天前
语言模型·大模型·transformer·datawhale
Datawhale Happy-LLM 课程 task 4:Encoder-Decoder此博客为Datawhale 组队学习打卡笔记[1] https://github.com/datawhalechina/happy-llm
过期的秋刀鱼!3 天前
人工智能·深度学习·机器学习·大模型·线性回归·过拟合和欠拟合·大模型调参
机器学习-正则化线性回归如上图我们不需要对b进行正则化,w控制着特征的影响强度,W太大会容易让模型对训练数据过于敏感,造成过拟合,而B是偏置项,相当于对所有样本添加了一个固定值,,他的大小对模型的影响很小,不会导致过拟合额,他只影响模型的整体平移
CoderJia程序员甲3 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-01-18)生成于:2026-01-18共发现热门项目: 12 个榜单类型:日榜本期GitHub热榜显示AI与大模型应用正深入解决实际问题,技术热点集中在文本信息结构化提取和智能语音生成。Google的langextract利用LLMs精准抽取文本信息,OpenBMB的VoxCPM实现无需分词的高质量语音克隆,凸显了多模态AI技术的成熟落地。同时,TrendRadar和anthropics的技能库展示了AI在信息聚合与智能体工作流构建方面的强大能力,而ultralytics的YOLO和NVIDIA的物理AI框架则推动
山顶夕景3 天前
大模型·llm·ocr·多模态·文档智能·vlm
【VLM】Format Decoupled Reinforcement Learning for Document OCR【文档智能进展】讲的故事是格式化文本(公式、表格等)比纯文本熵值高一个数量级,导致模型输出不确定性大、解析准确率低,所以搞了个应对思路。工作在:Reading or Reasoning? Format Decoupled Reinforcement Learning for Document OCR,https://arxiv.org/pdf/2601.08834,