语言模型

Protein Designer4 小时前
语言模型
Deepseek-V4-Flash 快速部署与调用指南在本地部署大语言模型时,很多开发者最头疼的往往不是模型本身的复杂度,而是环境配置的“劝退”环节。从依赖冲突到显存溢出,再到推理速度不如预期,每一个环节都可能让项目停滞不前。尤其是当我们需要将模型集成到现有业务流中,或者仅仅想在本地快速验证一个想法时,繁琐的部署流程和不透明的报错信息常常让人无从下手。
AI 小老六7 小时前
数据库·人工智能·ai·语言模型·架构·系统架构
Claude Code 如何压缩上下文:Microcompact、Prompt Cache 与 cache_edits 工程拆解拆解 Claude Code 如何用 Microcompact 和 cache_edits,在清理上下文时保住 Prompt Cache 折扣。 原文链接:AI 小老六
lqqjuly7 小时前
人工智能·语言模型
注意力机制完全详解注意力机制(Attention Mechanism)是一种让模型能够动态聚焦于输入序列中最相关部分的技术。它的核心思想是:在处理一个序列时,模型不应该平等对待所有位置的信息,而应该根据当前任务的需要,选择性地关注最相关的信息。
风落无尘8 小时前
人工智能·语言模型·aigc
第十章《多模态与具身》 完整学习资料本资料为《智能重生:从垃圾堆到AI工程师》第十章配套学习内容。 阅读小说原文:第十章《多模态与具身》 专栏总目录:《智能重生》AI工程师成长小说专栏
lqqjuly12 小时前
人工智能·语言模型
词嵌入与语言模型详解词嵌入(Word Embedding)是自然语言处理中最基础也是最重要的技术之一。它的核心目标是将离散的词语符号映射到连续的低维向量空间中,使得语义相近的词在向量空间中的距离也相近。这种映射不是随意的,而是通过大量文本数据学习得到的,能够捕捉词语之间的语义、语法和上下文关系。
城管不管12 小时前
android·java·数据库·语言模型·llm·prompt
什么是Prompt?上一章你已经搞清楚了大模型的底层逻辑:它是一个超级助理,你通过 messages 列表把内容传给它,它根据你给的上下文预测并生成回答。
YueJoy.AI12 小时前
人工智能·ai·语言模型
AI应用的容器化部署:从Docker到Kubernetes我们的产品从单服务器部署到多服务器部署时,遇到了很多问题:环境不一致、部署复杂、扩容困难。后来我们引入了容器化和 Kubernetes,问题迎刃而解。今天,分享我们的实践经验。
学习中.........13 小时前
人工智能·机器学习·语言模型
大语言模型的采样参数与输出控制机制阅读目标: 掌握从概率分布到最终文本生成的机制,理解采样参数的底层逻辑,以及参数调优与任务建模的优先级关系。
wabs66613 小时前
人工智能·语言模型·自然语言处理
本科毕业设计项目——基于RAG与大语言模型的408问答系统设计与实现【检索与生成功能的第三步答案生成是怎么实现的?】目录一、Cursor版本的答案生成流程图二、自己版本的答案生成流程图
z小猫不吃鱼14 小时前
人工智能·gpt·语言模型
09 GPT-2 论文精读:语言模型如何走向 Zero-shot?在前几篇文章中,我们分别精读了 GPT-1 和 BERT。GPT-1 的核心思想是:它先在大规模无标注文本上训练 Transformer Decoder 语言模型,然后再把模型迁移到文本分类、自然语言推理、问答等下游任务中进行微调。
星辰AI14 小时前
人工智能·ai·语言模型
数据质量检查:保障 AI 训练数据的可靠性垃圾进,垃圾出(Garbage In, Garbage Out)。数据质量直接决定了模型性能,数据质量检查是构建高质量 AI 系统的关键环节。
海兰15 小时前
人工智能·语言模型
【文字三国志:第二篇】天命重构,系统架构与核心设计文档欢迎加入天命三国项目。这份文档将带您从宏观的游戏定位出发,逐步深入到具体的子系统、技术选型、核心流程,最后探讨未来的扩展方向。
枫叶林FYL15 小时前
大数据·人工智能·语言模型
Explore with Long-term Memory:基于多模态大语言模型与强化学习的具身探索框架想象一个快递员第一次进入一栋陌生的写字楼。他手里有一张清单,上面列着五个需要送达的包裹,分别在不同楼层、不同房间。传统的方法是什么?他每找到一个包裹就返回起点重新规划路线——这就是现有主流具身智能任务的"一次性"范式:任务完成即结束,探索过程的记忆被丢弃,下一个任务从零开始。
学习中.........15 小时前
人工智能·语言模型·自然语言处理
大语言模型的推理机制与工程应用阅读目标: 解析模型内部运算机制、Reasoning 模型与普通模型的差异,以及推理过程中的计算成本与延迟控制。
小美美大白蛋15 小时前
人工智能·语言模型·自然语言处理
从词袋模型到预训练语言模型:文本表示方法的演进在自然语言处理中,一个最基础的问题是:机器如何理解文本?计算机不能直接理解“我喜欢这部电影”这样的自然语言,它需要把文本转换成数字,才能进行计算、分类、检索、翻译或生成。
生成论实验室15 小时前
人工智能·深度学习·语言模型·机器人·自动驾驶
降U定律:宇宙认知动力学第一定律在前面的系列文章中,我反复提到一个概念——降U。有读者问我:降U到底是一个技术方案,还是一个自然规律?如果是技术方案,那它只是一种选择,别人可以不用。如果是自然规律,那它就是一个必须遵循的法则,谁也绕不开。
星辰AI16 小时前
人工智能·ai·语言模型
数据增强方法:提升模型泛化能力的利器数据是模型的燃料。数据增强通过对现有数据进行变换和扩充,能显著提升模型的泛化能力,降低过拟合风险。我在多个项目中实践过数据增强,今天分享一些实用方法。
LoserChaser17 小时前
人工智能·ai·语言模型
初识智能体在人工智能领域,智能体被定义为任何能够通过传感器(Sensors)感知其所处环境(Environment),并自主地通过**执行器(Actuators)采取行动(Action)**以达成特定目标的实体。 智能体并非只是被动响应外部刺激或严格执行预设指令的程序,它能够基于其感知和内部状态进行独立决策,以达成其设计目标。这种从感知到行动的闭环,构成了所有智能体行为的基础。 我们正从开发专用自动化工具转向构建能自主解决问题的系统。核心不再是编写代码,而是引导一个通用的“大脑”去规划、行动和学习。
YueJoy.AI18 小时前
人工智能·ai·语言模型
创业公司如何打造品牌影响力我们产品技术很牛,但用户不知道。用了一段时间后,用户说:"原来你们这么厉害!"那一刻我意识到:技术好是不够的,还需要让用户知道你好。
wabs66618 小时前
人工智能·语言模型·自然语言处理
本科毕业设计项目——基于RAG与大语言模型的408问答系统设计与实现【检索与生成功能的第二步文档检索是怎么实现的?】目录一、Cursor版本的文档检索流程图(涉及项目代码名字)二、自己总结的文档检索流程图(不涉及项目代码名字)