语言模型

生成论实验室2 小时前
人工智能·语言模型·机器人·自动驾驶·安全架构
判断力与六十四卦:AI的第三块基石作者:周林东,单位:莆田字序生命科技有限公司,地址:福建省莆田市本文核心观点:判断力是AI继Token和Transformer之后的第三块基石。六十四卦的本质是2⁶=64的完备态势空间,是判断力的数学底座。这不是占卜,而是中华文明对认知科学的结构性贡献。
挂科边缘3 小时前
人工智能·语言模型·whisper·faster-whisper·实时语音输入转文本
手把手教你使用 Faster-Whisper 实时语音输入转文本,本地部署教程要想实现像豆包、微信等一样的语音输入功能,通常有两种主流方案:云端 API(轻量、准确度极高)和 本地模型(免费、隐私、无需联网)。由于目前开发的系统需要添加一个语音识别功能,刚好记录一下使用 Faster-Whisper 实时语音输入转文本。Faster-Whisper官网地址链接: Faster-Whisper官网地址
我爱cope4 小时前
人工智能·设计模式·语言模型·职场和发展
【Agent智能体23 | 规划-规划工作流】声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。
生成论实验室4 小时前
人工智能·语言模型·机器人·自动驾驶·安全架构
降U动力学:用一套原理统一解释21项AI技术作者:周林东,单位:莆田字序生命科技有限公司,地址:福建省莆田市声明:本文提出的降U动力学目前是一个统一解释框架,已通过思想实验与工程原型(WOLM判断力引擎)验证了可行性,但尚未在大规模公开基准上完成全部统计检验。欢迎同行进行实证验证与讨论。
樱花的浪漫6 小时前
前端·javascript·人工智能·语言模型·自然语言处理·typescript
Typescript、Zod基础初始化项目目录与 package.json可指定 package.json中TS和zod的版本,然后下载
AI人工智能+6 小时前
深度学习·语言模型·自然语言处理·ocr·药品注册证识别
药品注册证识别技术利用深度学习和多模态融合架构,实现药品注册证信息的自动化精准提取在医药监管与行业数字化进程中,药品注册证是药品合法上市的核心凭证。然而,随着海量历史档案的数字化以及新批文的高频发布,人工录入和核对注册证信息(如药品名称、证书编号、剂型、规格、受理号等)面临着效率低、易出错、标准不统一等痛点。
像风一样自由20207 小时前
android·人工智能·语言模型·大模型
量化压缩实战:INT8 / INT4 / AWQ / GPTQ 全面对比《大模型知识与部署》系列 · No.12 / 35 适合人群:AI 工程师、后端开发 阅读时间:约 28 分钟
P-ShineBeam7 小时前
数据库·人工智能·语言模型·自然语言处理·langchain
智能体-LangChain框架-Tools工具的使用指南Tools(工具)是 LangChain 中让大模型与外部世界交互的核心机制。模型本身只会“说话”,而工具让它能够真正“动手”——搜索、计算、查数据库、调 API。通过工具,Agent 可以执行搜索、计算、数据库查询等操作,极大扩展了 AI 的能力边界。
我爱cope7 小时前
人工智能·设计模式·语言模型·职场和发展
【Agent智能体24 | 规划-创建和执行LLM计划】声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。
天青色等烟雨..8 小时前
人工智能·语言模型·数据分析
AI大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研随着人工智能技术的快速发展,大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练,能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。
东方佑8 小时前
人工智能·语言模型·自然语言处理
碱基互补语言模型用 DNA 配对规则,从无标注文本中发现语法“如果语言也有一条双螺旋——我们只是还没有找到它?”有一个事实如此明显,以至于没有人想到去质疑它。
zhangfeng11338 小时前
人工智能·语言模型·自然语言处理
大语言模型思维链技术研究报告 CoT | 推理模型 | 思维树 | 强化学习 | o1 / R1思维链(Chain of Thought,简称CoT)是一种提示工程技术,其核心思想是在向大语言模型提出问题时,不仅要求模型给出最终答案,还要求模型在回答过程中生成一系列中间推理步骤,就像人类在解决复杂问题时会逐步思考一样。这种方法通过将复杂的推理任务分解为多个可管理的子步骤,显著提升了大语言模型在数学推理、常识推理、符号推理等任务上的表现。思维链的本质是让模型的推理过程变得"可见"和"可追溯",从而不仅提高了答案的准确性,还增强了模型输出的可解释性和可信度。 在思维链提出之前,大语言模型通常采用"直接回
Python私教17 小时前
人工智能·语言模型·qwen·ollama·本地大模型·大模型部署·deepseek
Cursor + Claude Code 全流程实战:搭一套生产级 AI 编程工作流(2026 最新版)这是专栏「AI编程实战:Cursor与Claude Code」的第 1 篇。读完你会得到一套可以照抄进真实项目的 AI 编程工作流:Cursor 与 Claude Code 各自的定位与协作分工、项目级提示词(rules)的写法、一个真实小项目从 0 到跑通的多文件改造、以及 8 个我在生产中真实踩过的报错的「原文 + 根因 + 解法」。不是"怎么装个插件试试看",而是"明天上班就能用上、还能少踩坑"。
海兰21 小时前
人工智能·语言模型·小程序
【小程序】基于 AI 大语言模型驱动的中国古典诗词 Web 应用详细设计指南“以诗为心,以 AI 为笔,让千年诗词与你的心灵相遇”本项目站内资源源代码下载地址诗心 是一款基于 AI 大语言模型驱动的中国古典诗词 Web 应用。用户通过输入关键词、心情描述或上传图片,即可获得 AI 匹配的古典诗词、精美赏析以及诗词卡片生成。应用融合了传统诗词文化与现代 AI 技术,提供沉浸式的诗词体验。
CJH(本人账号)1 天前
人工智能·安全·机器学习·语言模型·云计算·prompt
【AI安全】大模型安全威胁:Prompt注入与模型防御策略摘要:随着大语言模型(LLM)在各类应用中的广泛部署,提示词(Prompt )注入攻击已成为 AI 安全领域最突出的威胁之一。本文将从开发者视角出发,系统梳理 Prompt 注入的攻击原理与典型场景,提供可复现的攻击示例代码,并深入探讨从输入层到输出层的多级防御策略,最后介绍主流开源防御工具,帮助开发者构建更安全的 AI 应用。
Sirius Wu1 天前
人工智能·深度学习·机器学习·ai·语言模型·aigc
Agent Skill能力建设用统一的规范文档告诉模型如何完成某件事情。模型的SystemtPromt时只加载这个SKILL.md文件的描述信息,决定当前用户问题应该使用哪个skill,然后再把这个SKILL.md完整内容加载到Prompt中,根据SKILL.md中的说明执行某个操作。
如此这般英俊1 天前
人工智能·python·ai·语言模型
手搓Claude Code-第二章 tool_use第二章,shareai讲述了给agent扩展工具的流程。完整代码见 https://github.com/shareAI-lab/learn-claude-code/tree/main/s02_tool_use   我们的任务是:   1,扩展四个工具,手把手感受整个过程   2,构建沙箱,了解沙箱为什么重要。   3,感受claude code处理并发的操作
Sirius Wu1 天前
人工智能·深度学习·算法·机器学习·语言模型·架构
MoE与Fengyu-Dense_架构对比及训练方案MOE 架构的基本思想是在传统 Transformer 模型中,将每个前馈网络(FFN)层替换为一个 MOE 层。一个 MOE 层通常由两个关键部分组成:
MartinYeung51 天前
人工智能·学习·语言模型
[论文学习]大型语言模型中个人可识别资讯(PII)的机器遗忘技术:UnlearnPII 基准与 PERMU 方法的分析Machine Unlearning of Personally Identifiable Information in LLMs (D. Parii et al., 2025, ACL/NLLP)
hixiong1231 天前
人工智能·语言模型·自然语言处理
C# LLamaSharp部署大语言模型实例nuget安装 LLamaSharp、LLamaSharp.Backend.Cpu(或者Cuda版本)