语言模型

硅谷秋水7 小时前
深度学习·机器学习·计算机视觉·语言模型·机器人
用于机器人控制的因果世界建模26年1月来自蚂蚁Robbyant的论文“Causal World Modeling for Robot Control”。
文艺小码农8 小时前
人工智能·深度学习·语言模型·自然语言处理·集成学习
PEFT 库中文本生成LoRA 教程在本教程中介绍如何使用的 peft 库和 bitsandbytes 来以 8-bits 加载大语言模型,并对其进行高效微调。微调方法使用“低秩适配器”(LoRA)的方法
MaoziShan11 小时前
开发语言·人工智能·机器学习·语言模型·自然语言处理·c#
CMU Subword Modeling | 09 Lexemes, or What Dictionaries Know about Morphology我们平常说的 “word(词)” 在语言学里其实有两个不同层次:通俗理解:Lexeme 就是词的“家族”。一个 lexeme 是一组意义相同但形式不同的 word forms 的集合。例如:
SmartBrain14 小时前
人工智能·语言模型·aigc
经营洞察:三种经营哲学的核心内涵和实践机制目录一、三种经营哲学的核心内涵与理论基础1.1 稻盛和夫:以 "敬天爱人" 为根基的价值创造哲学1.2 任正非:基于熵减理论的组织进化哲学
阿杰学AI15 小时前
人工智能·ai·语言模型·自然语言处理·aigc·大模型全栈工程师·新型职业
AI核心知识104—大语言模型之 LLM Full Stack Engineer(简洁且通俗易懂版)大模型全栈工程师 (LLM Full Stack Engineer) 是 AI 时代诞生的一种“超级个体”或新型技术角色。
量子-Alex15 小时前
人工智能·语言模型·自然语言处理
【大模型智能体】作为数字原子与分子的AI智能体:大型语言模型在计算生物物理领域开启新纪元Large Language Models as AI Agents for Digital Atoms and Molecules: Catalyzing a New Era in Computational Biophysics 作为数字原子与分子的AI智能体:大型语言模型在计算生物物理领域开启新纪元
AI资源库15 小时前
人工智能·语言模型·架构
stepfun-ai/Step-3.5-Flash模型深入解析我们将文件分为三大类进行详细解读,揭示它们是如何“相辅相成”的。这部分决定了模型的思考方式和生理构造。
Elastic 中国社区官方博客19 小时前
大数据·人工智能·功能测试·elasticsearch·搜索引擎·语言模型·全文检索
AI 可观察性:公共部门使命韧性的支柱作者:来自 Elastic Leah McEwen去年,停机给公共部门造成了 1.93 亿美元的损失 —— 而财务打击只是开始。除了数字之外,公共部门的停机还可能对公民产生严重后果:关键在线服务中断、福利延迟以及紧急响应受阻。当公民无法依赖政府服务时,停机不仅仅是一个不便问题;它关系到信任。
阿杰学AI20 小时前
人工智能·ai·语言模型·自然语言处理·产品经理·ai产品经理·ai pm
AI核心知识103——大语言模型之 AI PM(简洁且通俗易懂版)AI 产品经理 (AI Product Manager, 简称 AI PM) 是人工智能时代诞生的一种全新职业角色。
来两个炸鸡腿20 小时前
人工智能·学习·语言模型·大模型·智能体
【Datawhale组队学习202602】Hello-Agents task03 大语言模型基础语言模型 (Language Model, LM) 是自然语言处理的核心。 其根本任务是计算一个词序列(即一个句子)出现的概率。
量子-Alex21 小时前
人工智能·语言模型·架构
【大模型智能体】代理式人工智能:大型语言模型智能体的架构、分类与评估Agentic Artificial Intelligence (AI): Architectures, Taxonomies, and Evaluation of Large Language Model Agents 代理式人工智能:大型语言模型智能体的架构、分类与评估
陈天伟教授21 小时前
人工智能·神经网络·语言模型·自然语言处理·机器人·机器翻译
人工智能应用- 扫地机器人:01.什么是机器人在人工智能逐渐融入日常生活的今天,有一类低调却极富技术含量的“家电新成员”悄然改变着我们的生活方式——扫地机器人。它不再是传统意义上的家用电器,而是集成了传感、定位、路径规划等多个智能模块的移动机器人。
大尚来也21 小时前
语言模型
Llama 与 PyTorch:大模型开发的黄金组合近年来,大型语言模型(LLM)迅速成为人工智能领域的核心驱动力。Meta 开源的 Llama 系列模型(包括 Llama、Llama2、Llama3)凭借其卓越的性能和开放策略,成为学术界与工业界广泛采用的基础模型。而 PyTorch 作为当前最主流的深度学习框架之一,以其动态计算图、易用性和强大的社区生态,成为训练和部署 LLM 的首选工具。
量子-Alex2 天前
人工智能·语言模型·自然语言处理
【大模型智能体】基于大语言模型的角色扮演Role play with large language models 基于大语言模型的角色扮演随着对话代理的行为表现日趋拟人化,我们必须建立有效的描述框架,以高层次术语刻画其行为特征,同时避免陷入拟人化陷阱。本文凸显"角色扮演"的核心概念,通过该理论框架阐释对话代理行为,使我们能够借助熟悉的民间心理学术语进行论述,而无需将语言模型实际不具备的人类特性强加于它们。基于此方法,我们重点探讨对话代理行为中两个重要案例:表面性欺骗与表面性自我意识。
namelessmyth2 天前
人工智能·语言模型·chatgpt·ai编程
聚合AI大模型API平台-横向评测对比对于开发者和高频AI用户而言,直接订阅官方服务(OpenAI、Anthropic、Google)往往面临费用高昂、支付困难及并发受限等痛点。使用优质的聚合API平台,不仅能节省 50%-80% 的费用,还能在单一接口中无缝切换 Claude Opus 4.6、GPT-5.2、DeepSeek V3.2、Qwen3-Max 等全球顶级模型。
黑巧克力可减脂2 天前
人工智能·语言模型·ai编程
工欲善其事:从先秦工匠到AI辅助编程的智慧传承“工欲善其事,必先利其器。”两千五百年前,孔夫子在《论语·卫灵公》中留下的这句箴言,穿越时空,至今仍在每一个精益求精的匠人耳畔回响。它道出了一个朴素而永恒的真理:任何卓越的成就,都离不开对工具的极致追求。工具不仅是双手的延伸,更是思想的载体,是文明进阶的阶梯。
陈天伟教授2 天前
人工智能·神经网络·游戏·语言模型·自然语言处理·机器翻译
人工智能应用- 人机对战:03.玩转 ATARI 游戏2015 年,DeepMind 公司在《自然》杂志上发表了一篇论文,报告了他们的 AI 系统在 29 款雅达利(Atari)游戏中超越了人类玩家的表现。这一成果的核心在于将强化学习与深度神经网络相结合,形成了深度强化学习(Deep Reinforcement Learning)的新范式。
shenxianasi2 天前
人工智能·深度学习·机器学习·计算机视觉·语言模型·自然语言处理
【论文精读】Flamingo: a Visual Language Model for Few-Shot Learning目录一、前言二、创新点总结&模型优越性1.关键的架构创新2.Flamingo-80B的性能优越三、Introduction
学生高德2 天前
人工智能·语言模型·自然语言处理
Perplexity AI 团队以 扩散预训练语言模型Perplexity AI 近日发布了一项重要研究成果:论文《Diffusion-Pretrained Dense and Contextual Embeddings》(扩散预训练的密集与上下文嵌入),正式推出了 pplx-embed(简称 PPLX-Family)系列多语言嵌入模型。该系列模型专为大规模网页搜索和检索任务设计,在 Twitter(X)上迅速引发 AI 社区讨论。
阿杰学AI2 天前
人工智能·ai·语言模型·自然语言处理·aigc·cherry studio·ai 桌面客户端
AI核心知识101——大语言模型之 Cherry Studio(简洁且通俗易懂版)Cherry Studio 是目前在 AI 极客圈和开发者社区中非常流行的一款 全能型 AI 桌面客户端。