技术栈
语言模型
YueJoy.AI
1 小时前
人工智能
·
ai
·
语言模型
创业团队如何管理远程工作
疫情后,我们开始尝试远程工作。一开始担心效率下降,结果发现:远程工作不仅可行,还能提高效率。但远程工作也有挑战:沟通变难、协作变慢、团队凝聚力下降。今天,分享我们是如何管理远程团队的。
GOTXX
1 小时前
服务器
·
网络
·
人工智能
·
语言模型
SenseNova U1 实战体验:API 调用 + OpenClaw 接入全流程
最近商汤科技开源了 SenseNova U1 系列,主打"理解与生成统一"。这个方向我关注了很久——市面上大多数多模态模型要么偏重理解,要么偏重生成,两者能力是割裂的。SenseNova U1 基于自研的 NEO-unify 架构,号称把语言和视觉信息放在同一个表示空间里建模。
生成论实验室
1 小时前
人工智能
·
学习
·
算法
·
语言模型
·
可信计算技术
用事件关系网络重新理解AI(三):激活函数、微调与元学习
在前两篇文章中,我用事件关系网络理论解释了十四项AI核心技术。这篇文章将继续这一工作,用同一个理论框架来审视另外七项同样重要但通常不被放在一起讨论的技术——激活函数、权重初始化、微调、LoRA、元学习、对比学习、联邦学习。
星辰AI
2 小时前
人工智能
·
ai
·
语言模型
大模型对抗攻击与防御:保护 AI 系统安全
随着大模型的广泛应用,对抗攻击成为一个重要的安全问题。攻击者可以通过精心设计的输入来欺骗模型,导致错误输出。
星辰AI
2 小时前
人工智能
·
ai
·
语言模型
Stable Diffusion 实战教程:从安装到图像生成
Stable Diffusion 是当前最流行的开源图像生成模型之一。它能够根据文字描述生成高质量的图像,在创意设计、游戏开发等领域有广泛应用。
大模型任我行
3 小时前
人工智能
·
语言模型
·
自然语言处理
·
论文笔记
人大:揭示大模型推理的几何约束机制
📖标题:Reasoning emerges from constrained inference manifolds in large language models 🌐来源:arXiv, 2605.08142v1
生成论实验室
4 小时前
数据结构
·
人工智能
·
深度学习
·
算法
·
语言模型
用事件关系网络重新理解AI(二):损失函数、优化器与深度学习的动力学
在前两篇文章中,我用事件关系网络理论解释了自注意力机制、词向量、CNN、GAN、强化学习、Dropout和知识蒸馏这七项核心AI技术。这篇文章将继续这一工作,用同一个理论框架来重新审视深度学习中最基础、最底层、也最容易被忽视的七项技术——损失函数、优化器、残差连接、归一化层、Scaling Law、灾难性遗忘、RAG与提示工程。
韦胖漫谈IT
4 小时前
网络
·
人工智能
·
语言模型
·
大模型安全
·
owasp
提示词注入- 大语言模型 OWASP TOP 10系列
提示词注入,简单说就是攻击者通过精心设计的文字输入,让 AI 大模型做出它"不应该做"的事。AI 大模型会把用户发来的内容当作指令来执行。攻击者利用这一点,把恶意指令伪装成普通输入,从而让模型绕过限制、泄露机密或执行危险操作。这些恶意内容甚至不需要肉眼可见——只要 AI 能"读懂",就能触发攻击。就像你和一个非常听话但缺乏判断力的员工说话,换个措辞,他可能就会帮你做一些本来被禁止的事。
生成论实验室
4 小时前
人工智能
·
算法
·
语言模型
·
可信计算技术
·
安全架构
事件、信息荷与六维态势空间——每一个事件都是一次空间的弯曲
在第一篇中,我论证了一个核心命题:智能的本质不是“知道什么”,而是“知道在发生什么”。 要实现这种智能,我们的AI系统必须从处理“实体”转向处理“事件”。
韦胖漫谈IT
4 小时前
人工智能
·
语言模型
·
自然语言处理
供应链 - 大语言模型 OWASP TOP 10系列
构建 AI 应用不只是调用一个模型那么简单,背后涉及一整条"供应链":训练数据从哪来?用了哪些第三方模型?依赖了什么开源库?部署在哪个平台?这整条链路上的任何一个环节,都可能成为攻击的入口。
YueJoy.AI
8 小时前
人工智能
·
ai
·
语言模型
创业公司如何设计有效的OKR
创业第一年,我们没有明确的目标,大家都很忙,但不知道忙什么。每个人都在做事,但好像没有形成合力。后来我开始研究 OKR(Objectives and Key Results),发现这不仅仅是一个目标管理工具,更是一种让团队对齐方向、聚焦重点的方法。今天,分享我们是如何设计和落地 OKR 的。
星辰AI
9 小时前
人工智能
·
ai
·
语言模型
长文本处理技术综述:突破上下文限制
大模型的上下文窗口是有限的,但很多应用场景需要处理超长文本。如何高效处理长文本是大模型应用开发中的重要挑战。
一条泥憨鱼
9 小时前
人工智能
·
ai
·
语言模型
·
机器人
·
rag
让AI从“死记硬背”到“开卷考试”:详解RAG技术的奥秘
🌈个人主页:一条泥憨鱼(欢迎各位大佬莅临)🎬精选专栏:数据结构与算法,JavaSE ,苍穹外卖日记,AI学习
韦胖漫谈IT
9 小时前
人工智能
·
语言模型
·
自然语言处理
数据与模型投毒 - 大语言模型 OWASP TOP 10系列
给 AI"喂"了有问题的数据,AI 学出来的东西就会有问题——就像食物被污染,吃了就会出问题。这就是数据投毒的核心逻辑。
韦胖漫谈IT
9 小时前
人工智能
·
安全
·
语言模型
·
自然语言处理
敏感信息泄露 - 大语言模型 OWASP TOP 10系列
AI 大模型在回答问题时,可能无意中说出它"不应该说"的内容——比如用户的个人信息、公司的商业机密、系统的内部配置,甚至是其他用户的私密数据。
YueJoy.AI
9 小时前
人工智能
·
ai
·
语言模型
创业公司如何做好用户反馈管理
我们产品上线第一个月,收到了很多用户反馈,有好的,有差的,有时候甚至同一天收到截然相反的意见。一开始我们很迷茫:到底应该听谁的?后来我意识到,用户反馈不是噪音,而是信号。关键是如何收集、分析、转化这些反馈。
硅谷秋水
20 小时前
人工智能
·
深度学习
·
机器学习
·
语言模型
智体Harness工程:综述(下)
26年5月来自CMU, Yale大学, JHU, 东北大学(NEU), Tulane大学, 阿拉巴马大学(UAB), 俄亥俄州立(OSU), Virginia Tech 和Amazon公司的论文“Agent Harness Engineering: A Survey”。
生成论实验室
1 天前
人工智能
·
深度学习
·
语言模型
·
机器人
·
自动驾驶
用事件关系网络重新理解AI:自注意力机制、词向量、CNN、GAN、强化学习、Dropout、知识蒸馏
在前几篇文章中,我提出了一个核心命题:智能的本质不是“知道什么”,而是“知道在发生什么”。 要实现这种智能,我们的AI系统必须从处理“实体”转向处理“事件”。事件不是孤立的存在者,而是在关系网络中确定自身意义的发生。事件之间的关系——因果的、依赖的、冲突的、共振的——构成了认知的基本语法。
LCG元
1 天前
人工智能
·
语言模型
深耕 RAG 工程,解锁大模型知识库开发之路
当前大模型落地普遍面临三大痛点:训练数据有截止日期,无法实时更新企业私有知识;通用大模型在垂直领域幻觉问题严重,回答可信度不足;全参数微调成本高,知识更新周期长,无法满足企业快速迭代的需求。
迁旭
1 天前
前端
·
javascript
·
chrome
·
机器学习
·
语言模型
·
gpt-3
Claude Code 项目 /init 命令详解
本文档详细讲解 Claude Code 项目中 /init 命令的源码实现、执行流程、生成文件的层级体系及相关机制。