语言模型

如此这般英俊4 小时前
人工智能·python·语言模型
手搓Claude Code-第三章 permission第三章,shareAI讲述了给模型加权限的过程。完整代码见 https://github.com/shareAI-lab/learn-claude-code/blob/main/s03_permission/code.py   我们的任务是:   1,了解check_deny_list, check_rules, ask_user三道闸门组成的permission   2,滤清楚权限检查的逻辑
MartinYeung57 小时前
学习·安全·语言模型
[论文学习]大型语言模型(LLM)安全与隐私-基于善、恶、丑的深度分析A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly
walnut_oyb8 小时前
人工智能·语言模型·自然语言处理
CVPR 2026|VisRes Bench:视觉语言模型视觉推理能力评估视觉 - 语言模型在视觉问答、图像字幕等任务上已取得显著进展,但这类模型究竟是在执行真正的视觉推理,还是仅依赖语言先验完成任务,目前仍不明确。 针对这一问题,本文提出 VisRes Bench 基准,用于在无上下文语言监督的自然场景下研究视觉推理能力。基准按照三层复杂度分析模型行为,清晰揭示了模型在感知与关系视觉推理能力上的局限:
大模型任我行10 小时前
人工智能·语言模型·自然语言处理·论文笔记
腾讯:原生多模态建模路线图📖标题:Toward Native Multimodal Modeling: A Roadmap 🌐来源:arXiv, 2605.25343v1
大模型任我行10 小时前
人工智能·语言模型·embedding·论文笔记
谷歌:多模态嵌入Gemini Embedding 2📖标题:Gemini Embedding 2: A Native Multimodal Embedding Model from Gemini 🌐来源:arXiv, 2605.27295v1
东方佑12 小时前
人工智能·语言模型·自然语言处理·开源
分形递归状态机 (FRSM) 实验报告-更新对比分形递归状态机 (Fractal Recursive State Machine, FRSM) 是一种新型自回归语言模型架构,其核心原理是:
txg66613 小时前
人工智能·深度学习·安全·网络安全·语言模型
FuzzGPT:用大语言模型生成“极端边界程序”的深度学习框架 Fuzzing 新范式“ 随着 PyTorch、TensorFlow、JAX 等深度学习框架成为 AI 基础设施,其 API的稳定性与安全性正面临前所未有的挑战。然而,传统 Fuzzing技术在测试DL框架时逐渐暴露瓶颈:随机变异难以覆盖复杂API参数空间、手工规则难以构造“非直觉但合法”的极端输入、大量真实漏洞隐藏在 Edge Case(边界用法)中。
eric-sjq14 小时前
人工智能·深度学习·语言模型·自然语言处理·架构
Xiaothink-T17-Tiny 模型深度解析:轻量级RNN架构的创新与实战评测ModelScope - 模型卡片⚠️ 由于模型架构特殊(GRU3 历史检索机制),目前不支持 ModelScope 调用,请使用 xiaothink ≥ 1.4.2 库加载。
承渊政道15 小时前
人工智能·pytorch·深度学习·机器学习·语言模型·自然语言处理·pycharm
【从零开始大模型开发与微调:基于PyTorch与ChatGLM】(从环境搭建到第一个训练闭环:PyTorch2.0深度学习入门实战)大模型正在成为人工智能应用开发的核心基础能力.从智能问答、代码助手,到企业知识库、智能客服和垂直领域应用,越来越多的场景都离不开大模型的理解、生成与推理能力.对于开发者来说,仅仅会调用现成的大模型接口已经远远不够,理解大模型的开发流程、掌握微调方法,并能够亲手完成一个从环境搭建到训练验证的闭环,正在变成一项非常重要的工程能力.不过,对于刚开始接触大模型开发的同学来说,这条路往往并不轻松.PyTorch、Transformers、ChatGLM、显存配置、数据格式、模型加载、训练参数、微调策略……这些概念单
CJH(本人账号)15 小时前
人工智能·安全·语言模型
上线仅72小时被强制下架:Claude Fable 5 的短命摘要:2026年6月9日,Anthropic 发布号称"地表最强商用AI"的 Claude Fable 5,仅3天后(6月12日)美国政府以"国家安全"为由强制全球下架。从发布到禁用,72小时内完成了一场完整的"神坛坠落"。本文从技术视角深度解读事件始末,分析对开发者生态的影响,以及背后的战略博弈。
MartinYeung51 天前
人工智能·学习·语言模型
[论文学习]CAMIA:基于上下文感知的成员资格推断攻击:针对预训练大型语言模型的深度分析CAMIA: Context-Aware Membership Inference Attack核心问题与动机
c7692 天前
论文阅读·人工智能·笔记·语言模型·论文笔记·提示工程
【文献笔记】Learn to Relax with LLMs: Solving COPs via Bidirectional CoevolutionLearn to Relax with Large Language Models: Solving Constraint Optimization Problems via Bidirectional Coevolution
明天好,会的2 天前
语言模型
grill-me我用 grill-me 整整一个月了。现在,我几乎在开始每一个任务之前,都会用grill-me给我把关,通过这个skill,让大模型了解我这个任务中,我没有说说清楚的细节。
MartinYeung52 天前
人工智能·学习·语言模型
[论文学习]LoRA-Leak:针对 LoRA 微调语言模型的成员推断攻击深度分析与隐私风险评估LoRA-Leak: Membership Inference Attacks Against LoRA Fine-tuned Language Models
硅谷秋水2 天前
人工智能·机器学习·语言模型·中间件·机器人
物理人工智能的驾驭工程:机器人中间件是驾驭层26年6月来自韩国DGIST的论文“Harness Engineering for Physical AI: Robot Middleware Is the Harness Layer”。
必胜刻2 天前
人工智能·笔记·ai·语言模型·golang
Go项目实战:使用Ollama本地部署大模型实现AI智能笔记生成在当今AI技术快速发展的背景下,越来越多的应用开始集成大语言模型(LLM)能力。然而,依赖云端API不仅成本高昂,还存在数据隐私和网络延迟等问题。本文将分享一个实际项目经验——如何在Go后端项目中集成Ollama,实现本地大模型部署,用于课程音视频的智能笔记生成。
毒爪的小新2 天前
linux·ai·语言模型·chatgpt·openwebui
Open WebUI 从零到一:打造属于你的私人ChatGPT一句话定义:Open WebUI是一个开源的、可自托管的类ChatGPT网页界面,让你用浏览器就能和本地大模型流畅对话,同时完全掌控自己的数据。
DisonTangor2 天前
人工智能·语言模型·自然语言处理·开源·aigc·transformer
谷歌开源首个扩散大语言模型——DiffusionGemmaHugging Face | GitHub | 发布博客 | 文档 许可证: Apache 2.0 | 作者: Google DeepMind
我爱cope2 天前
人工智能·设计模式·语言模型·职场和发展
【Agent智能体26 | 多智能体-多智能体工作流】声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。
装不满的克莱因瓶2 天前
网络·人工智能·python·深度学习·语言模型·自然语言处理
自然语言处理发展历史——从规则系统到大语言模型的演进之路目录一、前言二、NLP发展的整体阶段三、第一阶段:规则驱动时代(1950s-1990s)(一)核心思想