语言模型

郭龙飞9802 小时前
人工智能·windows·语言模型
OpenClaw技能拓展教程 五大场景高效办公实操指南OpenClaw实用技能大全|全方位提升电脑办公与操作效率OpenClaw(小龙虾)最核心的亮点,在于丰富的Skill技能拓展体系。激活对应的技能功能后,这款AI工具不再局限于基础的对话交互,能够落地各类电脑实操工作,助力用户解决办公、文件处理、网页操作、系统运维、内容编辑等各类场景问题。
古怪今人8 小时前
人工智能·语言模型·langchain
大语言模型运行工具及格式 Ollama操作大模型 LangChain应用开发框架【2026】运行工具(软件):1、LM Studio:最推荐新手。2、Ollama:开发者。3、llama.cpp:底层引擎,性能天花板、可深度调优。
数智工坊9 小时前
论文阅读·人工智能·算法·计算机视觉·语言模型
【SigLIP论文阅读】:重新定义视觉-语言预训练的损失函数——VLA模型的“语言理解“基石如果你正在研究具身智能或者VLA(视觉-语言-动作)模型,你会发现一个有趣的现象:几乎所有最新的开源VLA模型都不约而同地放弃了曾经的王者CLIP,转而使用SigLIP作为它们的视觉-语言编码器。OpenVLA用它,Octo用它,小米的Xiaomi-Robotics-0也用它。为什么SigLIP能在短短一年内就取代CLIP的地位?因为它用一个简单到不能再简单的改动——把softmax换成sigmoid——就解决了CLIP几乎所有的痛点:小批量性能差、内存占用高、训练不稳定。今天我们就来深度拆解这篇来自Go
纤纡.10 小时前
阿里云·语言模型·交互
解锁大模型应用实战:从文本处理到智能交互的全维度实践在人工智能技术飞速发展的当下,大语言模型(LLM)已经成为提升工作效率、优化用户体验的核心工具。无论是电商场景的评论分析、客服系统的问题分类,还是结构化的信息整理、逻辑化的推理分析,大模型都能发挥出强大的作用。本文将结合实际的代码案例,从应用场景、技术实现、优化技巧等多个维度,详细拆解大模型在文本处理与智能交互中的落地方法,帮助开发者快速掌握大模型应用的核心逻辑。
Omics Pro12 小时前
开发语言·人工智能·深度学习·语言模型·r语言·excel·知识图谱
全流程可重复!R语言脂质组学:原始数据→功能解析脂质组学已成为生物医学研究中具有变革性的学科,为代谢信号传导与疾病病理生理机制提供高分辨率解析。R语言凭借完善的生物统计基础架构,成为复杂脂质组学数据可扩展分析的主流平台。本文提出1套完整的R语言脂质组学分析路线图,围绕标准化分析全流程构建:从原始数据采集、预处理,到结构注释、统计建模与功能解析。本文筛选并整合了1套经严格验证的主流R包(4.3.0版本),包括用于特征提取的xcms、MSnbase,基于碎裂模式鉴定的LipidMS 3.0,以及用于质控与归一化的lipidr。同时阐述了如何整合mixOmi
Cosolar1 天前
人工智能·深度学习·语言模型·chatgpt·面试
AI Agent 记忆机制全景对比:OpenClaw vs QwenPaw vs Hermes vs HiClaw在理解了记忆机制的通用原理之后,最关键的问题来了:当前主流的开源 Agent,到底是怎么实现记忆的?它们之间有什么本质差异?
日取其半万世不竭1 天前
人工智能·语言模型·自然语言处理
Ollama + Open WebUI 部署教程:本地运行大语言模型,自建私有 AI 助手不想把对话内容发给 OpenAI?有私密需求或离线场景?Ollama 让你在自己的服务器上运行 Llama、Qwen、DeepSeek 等开源大语言模型,Open WebUI 提供和 ChatGPT 一样的聊天界面。这篇文章讲如何搭建一套完整的私有 AI 服务。
Leweslyh1 天前
人工智能·语言模型·自然语言处理
【论文翻译】意图驱动的多智能体大语言模型网络管理:Confucius框架第一作者:Zhaodong Wang 翻译工具:TRAE、Gemini 3.1 Pro Proview、MinerU等
AI技术控1 天前
人工智能·python·语言模型·自然语言处理·nlp
ReAct 论文解读:大模型 Agent 如何通过“推理 + 行动”完成复杂任务《ReAct: Synergizing Reasoning and Acting in Language Models》是 ICLR 2023 的一篇经典论文,也是理解大模型 Agent、工具调用、RAG 和外部环境交互时绕不开的一篇工作。
逆境不可逃2 天前
人工智能·语言模型·自然语言处理
Hello-Agents 第一部分总结:从智能体概念到大语言模型基础作者:逆境不可逃技术永无止境希望我的内容可以帮助到你!!!!!大家吼 ! 我是逆境不可逃 今天给大家带来文章《Hello-Agents 第一部分总结:从智能体概念到大语言模型基础》.
测试员周周2 天前
服务器·数据库·人工智能·python·测试工具·语言模型·appium
【Appium 系列】第09节-数据驱动测试 — YAML 数据 + parametrize对应代码:core/data_driver.py(206行)、testcases/data/login_users.yaml、testcases/yaml/login_test_cases.yaml
摆摊的豆丁2 天前
语言模型
2.对1文档中的内容做展开补充在 Claude Code 语境里,harness 可以理解为“把模型变成可用工程代理的外部运行框架/脚手架/控制层”。
AI技术控2 天前
人工智能·python·深度学习·语言模型·自然语言处理·prompt
Prompt Engineering 在企业大模型应用中的实践:从提示词模板到可控输出在大模型应用开发中,Prompt Engineering 是最容易被低估、也最容易被误解的部分。很多人认为提示词只是“把问题问清楚一点”,或者在系统提示词里写几句“你是一个专业助手”。这种方式做 Demo 可能够用,但一旦进入企业级场景,问题就会集中暴露:
耕烟煮云2 天前
人工智能·语言模型·自然语言处理
一篇文章讲清大语言模型发展史2017年的某个夏天,Google内部一群搞翻译的工程师,发了一篇论文。标题很狂,叫《Attention Is All You Need》。意思很明确:我们把RNN彻底扔了,只用注意力机制,翻译效果反而更好。
硅谷秋水2 天前
人工智能·科技·机器学习·语言模型·软件工程
ARIS:基于对抗性多智体协作的自主研究26年5月来自上海交大和上海创智学院的论文“ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration”。
翼达口香糖2 天前
大数据·人工智能·深度学习·语言模型·数据分析·边缘计算
当大模型吃掉你的App,从高德开放平台看AI服务重构作为一个还在习惯用手机软件的老用户,最近有幸参加了一下高德开放平台的Al产品发布会。这场高德AI发布会给我提了个醒,大模型真正的商业化拐点,可能不在模型本身,而在它如何吃掉我们手机里的一个个App。当MCP协议让AI能实时调用地图、天气、打车服务时,"打开软件"这个动作本身,就开始变得不那么频繁了。 其实从24年上旬之前,SaaS(软件即服务)这个模式思维其实还挺流行的。具体来说,比如生活中在手机上安装一个地图软件,然后用这个地图软件上提供的服务,比如说导航、路线规划、交通情况查询这些服务。那个时候其实C
阿正的梦工坊3 天前
人工智能·语言模型·自然语言处理
ALiBi:让大语言模型“免训练“外推到更长序列的位置编码方法Transformer 的自注意力机制本身是排列不变的——它不知道 token 的顺序。因此我们需要某种方式告诉模型"谁在前、谁在后",这就是位置编码(Positional Encoding)。
摆摊的豆丁3 天前
语言模型
3. 创始人手册:打造 AI 原生初创公司The founder’s playbook: Building an AI-native startup https://claude.com/blog/the-founders-playbook
Heartache Doctor3 天前
论文阅读·笔记·语言模型
[论文阅读笔记] A Survey on Multimodal Large Language Models使用LLM辅助的multimodal工作的架构特点以及运用。1. Modality Encoder:使用pre-aligned encoder将其他模态和LLM tokens对齐。
tzc_fly3 天前
人工智能·语言模型·自然语言处理
LLaDA2.0:块扩散语言模型这是一篇非常具有突破性的自然语言处理(NLP)领域的大模型论文。这篇由蚂蚁集团(Ant Group)领衔撰写的论文《LLaDA2.0: Scaling Up Diffusion Language Models to 100B》,标志着离散扩散语言模型(Discrete Diffusion LLMs, dLLMs)首次成功扩展到了千亿(100B)参数规模。