技术栈
语言模型
YueJoy.AI
2 小时前
人工智能
·
ai
·
语言模型
创业公司如何设计有效的OKR
创业第一年,我们没有明确的目标,大家都很忙,但不知道忙什么。每个人都在做事,但好像没有形成合力。后来我开始研究 OKR(Objectives and Key Results),发现这不仅仅是一个目标管理工具,更是一种让团队对齐方向、聚焦重点的方法。今天,分享我们是如何设计和落地 OKR 的。
星辰AI
3 小时前
人工智能
·
ai
·
语言模型
长文本处理技术综述:突破上下文限制
大模型的上下文窗口是有限的,但很多应用场景需要处理超长文本。如何高效处理长文本是大模型应用开发中的重要挑战。
一条泥憨鱼
3 小时前
人工智能
·
ai
·
语言模型
·
机器人
·
rag
让AI从“死记硬背”到“开卷考试”:详解RAG技术的奥秘
🌈个人主页:一条泥憨鱼(欢迎各位大佬莅临)🎬精选专栏:数据结构与算法,JavaSE ,苍穹外卖日记,AI学习
韦胖漫谈IT
3 小时前
人工智能
·
语言模型
·
自然语言处理
数据与模型投毒 - 大语言模型 OWASP TOP 10系列
给 AI"喂"了有问题的数据,AI 学出来的东西就会有问题——就像食物被污染,吃了就会出问题。这就是数据投毒的核心逻辑。
韦胖漫谈IT
3 小时前
人工智能
·
安全
·
语言模型
·
自然语言处理
敏感信息泄露 - 大语言模型 OWASP TOP 10系列
AI 大模型在回答问题时,可能无意中说出它"不应该说"的内容——比如用户的个人信息、公司的商业机密、系统的内部配置,甚至是其他用户的私密数据。
YueJoy.AI
4 小时前
人工智能
·
ai
·
语言模型
创业公司如何做好用户反馈管理
我们产品上线第一个月,收到了很多用户反馈,有好的,有差的,有时候甚至同一天收到截然相反的意见。一开始我们很迷茫:到底应该听谁的?后来我意识到,用户反馈不是噪音,而是信号。关键是如何收集、分析、转化这些反馈。
硅谷秋水
14 小时前
人工智能
·
深度学习
·
机器学习
·
语言模型
智体Harness工程:综述(下)
26年5月来自CMU, Yale大学, JHU, 东北大学(NEU), Tulane大学, 阿拉巴马大学(UAB), 俄亥俄州立(OSU), Virginia Tech 和Amazon公司的论文“Agent Harness Engineering: A Survey”。
生成论实验室
19 小时前
人工智能
·
深度学习
·
语言模型
·
机器人
·
自动驾驶
用事件关系网络重新理解AI:自注意力机制、词向量、CNN、GAN、强化学习、Dropout、知识蒸馏
在前几篇文章中,我提出了一个核心命题:智能的本质不是“知道什么”,而是“知道在发生什么”。 要实现这种智能,我们的AI系统必须从处理“实体”转向处理“事件”。事件不是孤立的存在者,而是在关系网络中确定自身意义的发生。事件之间的关系——因果的、依赖的、冲突的、共振的——构成了认知的基本语法。
LCG元
1 天前
人工智能
·
语言模型
深耕 RAG 工程,解锁大模型知识库开发之路
当前大模型落地普遍面临三大痛点:训练数据有截止日期,无法实时更新企业私有知识;通用大模型在垂直领域幻觉问题严重,回答可信度不足;全参数微调成本高,知识更新周期长,无法满足企业快速迭代的需求。
迁旭
1 天前
前端
·
javascript
·
chrome
·
机器学习
·
语言模型
·
gpt-3
Claude Code 项目 /init 命令详解
本文档详细讲解 Claude Code 项目中 /init 命令的源码实现、执行流程、生成文件的层级体系及相关机制。
生成论实验室
1 天前
人工智能
·
深度学习
·
语言模型
·
agi
·
安全架构
Token即事件:Transformer为何是“事件-关系网络”的最佳实现——兼论大语言模型如何从“概率鹦鹉”进化为“认知主体”
当我们谈论大语言模型时,几乎所有讨论都围绕着参数规模、训练数据、基准分数展开。但在这些技术细节之下,隐藏着一个更根本的哲学事实——它从未被认真对待,却决定了这些模型能做以及不能做的一切。
枫叶林FYL
1 天前
人工智能
·
语言模型
·
php
【强化学习】6 MoE-GRPO:视觉语言模型中基于强化学习的混合专家路由优化
核心结论前置:MoE-GRPO 将传统 MoE 的确定性 Top-K 路由改造为可学习的强化学习策略,通过 Group Relative Policy Optimization(GRPO)同时优化"生成什么 token"和"走哪条专家路径",在保持稀疏推理效率的前提下,显著缓解专家过拟合并诱导任务级专家特化。
阿拉伯柠檬
1 天前
人工智能
·
python
·
语言模型
·
自然语言处理
·
langchain
大语言模型 LLM
AI 里的“模型”, 本质上就是一个从输入到输出的数学函数, 它由大量的参数(数字)来定义, 而这些参数是从海量数据中“学”出来的, 这些模型可以进行预测、生成文本、图像或其他输出,从而为各行各业赋能. 可以简单理解为模型是⼀个"超级加工厂",这个工厂是经过特殊训练的,训练师给它看了海量的例子 (数据),并告诉它该怎么做。通过看这些例子,它自己摸索出了一套规则,学会了完成某个"特定任 务"。模型就是一套学到的"规则"或者"模式", 它能根据你给的东西,产生你想要的东西。
生成论实验室
2 天前
人工智能
·
语言模型
·
架构
·
创业创新
·
agi
通用人工智能(AGI)完整技术方案:以字序生命模型(WOLM)为认知内核的双脑协同架构
在讨论技术方案之前,先定义什么是AGI。当前主流的AGI定义,强调一个系统能在绝大多数人类能做的智力任务上达到或超越人类水平。这个定义隐含了一个假设:AGI的核心是“智力”——逻辑推理、知识储备、创造力。
数智工坊
2 天前
论文阅读
·
人工智能
·
算法
·
语言模型
·
机器人
·
无人机
【Inner Monologue论文阅读】: 首次将大语言模型嵌入机器人控制闭环,实现自我反思和动态行为调整
想象一下,你让机器人去厨房拿一瓶可乐。传统的机器人会怎么做?它会生成一个僵硬的计划:1. 走到厨房 2. 拿起可乐 3. 拿给你。然后就一条路走到黑——如果可乐不在桌子上,它会傻站在那里;如果第一次没拿起来,它会直接放弃;如果冰箱里只有雪碧,它完全不知道该怎么办。
LCG元
2 天前
人工智能
·
语言模型
大模型微调指南:从数据处理到工业落地全解析
当前通用大模型已经解决了通用场景的基础能力问题,但针对垂直行业场景,依然需要通过微调来对齐业务需求,解决幻觉、专业知识不足等问题。很多开发爱好者和企业工程师都卡在了「从实验性调参到工业级落地」的环节,要么缺少完整流程说明,要么代码无法直接运行,本文梳理从数据处理到生产部署的全流程,所有步骤可复现,新人小白也能跟着一步步落地,企业可直接复用这套方案。
AI技术控
2 天前
人工智能
·
语言模型
·
自然语言处理
·
langchain
·
nlp
NeuroH-TGL 论文解读:面向脑疾病诊断的神经异质性引导时序图学习方法
论文标题:《NeuroH-TGL: Neuro-Heterogeneity Guided Temporal Graph Learning Strategy for Brain Disease Diagnosis》 会议:NeurIPS 2025 研究方向:动态功能脑网络、时序图学习、图神经网络、脑疾病诊断、fMRI 分析 本文基于上传论文原文整理。:contentReference[oaicite:0]{index=0}
IceSugarJJ
2 天前
语言模型
·
微信小程序
·
github
Open-AutoGLM项目学习
Open-AutoGLM是一个面向自动化自然语言处理任务的开源框架,专为简化大语言模型(LLM)在实际业务场景中的部署与调优而设计。其核心机制融合了提示工程自动化、动态上下文优化与轻量化推理引擎,使开发者无需深入模型内部结构即可实现高效的任务适配。
xiaoyuchidayuma
2 天前
笔记
·
语言模型
【cherrystudio接入硅基流动的DeepSeek R1大模型API】
登录网址,选择windows https://cherry-ai.com/直接下一步就行第一次登录需要联网,在打开的网址上注册账号
Jump 不二
2 天前
人工智能
·
语言模型
·
系统架构
AI Agent Skill 系统架构全解析:SKILL 规范与框架实现
最近刚好需要自己实现一套完整的 Skills 运行框架,所以把官方协议、源码、实现方案都啃了一遍。写这篇文章,就是想把自己踩的坑、悟出来的门道记录下来。对做 Agent 开发、做 skill 开发,或者单纯想搞懂 “我的 skill 为什么效果不稳定” 的人,应该都有帮助。