技术栈
语言模型
硅谷秋水
7 小时前
深度学习
·
机器学习
·
计算机视觉
·
语言模型
·
机器人
用于机器人控制的因果世界建模
26年1月来自蚂蚁Robbyant的论文“Causal World Modeling for Robot Control”。
文艺小码农
8 小时前
人工智能
·
深度学习
·
语言模型
·
自然语言处理
·
集成学习
PEFT 库中文本生成LoRA 教程
在本教程中介绍如何使用的 peft 库和 bitsandbytes 来以 8-bits 加载大语言模型,并对其进行高效微调。微调方法使用“低秩适配器”(LoRA)的方法
MaoziShan
11 小时前
开发语言
·
人工智能
·
机器学习
·
语言模型
·
自然语言处理
·
c#
CMU Subword Modeling | 09 Lexemes, or What Dictionaries Know about Morphology
我们平常说的 “word(词)” 在语言学里其实有两个不同层次:通俗理解:Lexeme 就是词的“家族”。一个 lexeme 是一组意义相同但形式不同的 word forms 的集合。例如:
SmartBrain
14 小时前
人工智能
·
语言模型
·
aigc
经营洞察:三种经营哲学的核心内涵和实践机制
目录一、三种经营哲学的核心内涵与理论基础1.1 稻盛和夫:以 "敬天爱人" 为根基的价值创造哲学1.2 任正非:基于熵减理论的组织进化哲学
阿杰学AI
15 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
大模型全栈工程师
·
新型职业
AI核心知识104—大语言模型之 LLM Full Stack Engineer(简洁且通俗易懂版)
大模型全栈工程师 (LLM Full Stack Engineer) 是 AI 时代诞生的一种“超级个体”或新型技术角色。
量子-Alex
15 小时前
人工智能
·
语言模型
·
自然语言处理
【大模型智能体】作为数字原子与分子的AI智能体:大型语言模型在计算生物物理领域开启新纪元
Large Language Models as AI Agents for Digital Atoms and Molecules: Catalyzing a New Era in Computational Biophysics 作为数字原子与分子的AI智能体:大型语言模型在计算生物物理领域开启新纪元
AI资源库
15 小时前
人工智能
·
语言模型
·
架构
stepfun-ai/Step-3.5-Flash模型深入解析
我们将文件分为三大类进行详细解读,揭示它们是如何“相辅相成”的。这部分决定了模型的思考方式和生理构造。
Elastic 中国社区官方博客
19 小时前
大数据
·
人工智能
·
功能测试
·
elasticsearch
·
搜索引擎
·
语言模型
·
全文检索
AI 可观察性:公共部门使命韧性的支柱
作者:来自 Elastic Leah McEwen去年,停机给公共部门造成了 1.93 亿美元的损失 —— 而财务打击只是开始。除了数字之外,公共部门的停机还可能对公民产生严重后果:关键在线服务中断、福利延迟以及紧急响应受阻。当公民无法依赖政府服务时,停机不仅仅是一个不便问题;它关系到信任。
阿杰学AI
20 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
产品经理
·
ai产品经理
·
ai pm
AI核心知识103——大语言模型之 AI PM(简洁且通俗易懂版)
AI 产品经理 (AI Product Manager, 简称 AI PM) 是人工智能时代诞生的一种全新职业角色。
来两个炸鸡腿
20 小时前
人工智能
·
学习
·
语言模型
·
大模型
·
智能体
【Datawhale组队学习202602】Hello-Agents task03 大语言模型基础
语言模型 (Language Model, LM) 是自然语言处理的核心。 其根本任务是计算一个词序列(即一个句子)出现的概率。
量子-Alex
21 小时前
人工智能
·
语言模型
·
架构
【大模型智能体】代理式人工智能:大型语言模型智能体的架构、分类与评估
Agentic Artificial Intelligence (AI): Architectures, Taxonomies, and Evaluation of Large Language Model Agents 代理式人工智能:大型语言模型智能体的架构、分类与评估
陈天伟教授
21 小时前
人工智能
·
神经网络
·
语言模型
·
自然语言处理
·
机器人
·
机器翻译
人工智能应用- 扫地机器人:01.什么是机器人
在人工智能逐渐融入日常生活的今天,有一类低调却极富技术含量的“家电新成员”悄然改变着我们的生活方式——扫地机器人。它不再是传统意义上的家用电器,而是集成了传感、定位、路径规划等多个智能模块的移动机器人。
大尚来也
21 小时前
语言模型
Llama 与 PyTorch:大模型开发的黄金组合
近年来,大型语言模型(LLM)迅速成为人工智能领域的核心驱动力。Meta 开源的 Llama 系列模型(包括 Llama、Llama2、Llama3)凭借其卓越的性能和开放策略,成为学术界与工业界广泛采用的基础模型。而 PyTorch 作为当前最主流的深度学习框架之一,以其动态计算图、易用性和强大的社区生态,成为训练和部署 LLM 的首选工具。
量子-Alex
2 天前
人工智能
·
语言模型
·
自然语言处理
【大模型智能体】基于大语言模型的角色扮演
Role play with large language models 基于大语言模型的角色扮演随着对话代理的行为表现日趋拟人化,我们必须建立有效的描述框架,以高层次术语刻画其行为特征,同时避免陷入拟人化陷阱。本文凸显"角色扮演"的核心概念,通过该理论框架阐释对话代理行为,使我们能够借助熟悉的民间心理学术语进行论述,而无需将语言模型实际不具备的人类特性强加于它们。基于此方法,我们重点探讨对话代理行为中两个重要案例:表面性欺骗与表面性自我意识。
namelessmyth
2 天前
人工智能
·
语言模型
·
chatgpt
·
ai编程
聚合AI大模型API平台-横向评测对比
对于开发者和高频AI用户而言,直接订阅官方服务(OpenAI、Anthropic、Google)往往面临费用高昂、支付困难及并发受限等痛点。使用优质的聚合API平台,不仅能节省 50%-80% 的费用,还能在单一接口中无缝切换 Claude Opus 4.6、GPT-5.2、DeepSeek V3.2、Qwen3-Max 等全球顶级模型。
黑巧克力可减脂
2 天前
人工智能
·
语言模型
·
ai编程
工欲善其事:从先秦工匠到AI辅助编程的智慧传承
“工欲善其事,必先利其器。”两千五百年前,孔夫子在《论语·卫灵公》中留下的这句箴言,穿越时空,至今仍在每一个精益求精的匠人耳畔回响。它道出了一个朴素而永恒的真理:任何卓越的成就,都离不开对工具的极致追求。工具不仅是双手的延伸,更是思想的载体,是文明进阶的阶梯。
陈天伟教授
2 天前
人工智能
·
神经网络
·
游戏
·
语言模型
·
自然语言处理
·
机器翻译
人工智能应用- 人机对战:03.玩转 ATARI 游戏
2015 年,DeepMind 公司在《自然》杂志上发表了一篇论文,报告了他们的 AI 系统在 29 款雅达利(Atari)游戏中超越了人类玩家的表现。这一成果的核心在于将强化学习与深度神经网络相结合,形成了深度强化学习(Deep Reinforcement Learning)的新范式。
shenxianasi
2 天前
人工智能
·
深度学习
·
机器学习
·
计算机视觉
·
语言模型
·
自然语言处理
【论文精读】Flamingo: a Visual Language Model for Few-Shot Learning
目录一、前言二、创新点总结&模型优越性1.关键的架构创新2.Flamingo-80B的性能优越三、Introduction
学生高德
2 天前
人工智能
·
语言模型
·
自然语言处理
Perplexity AI 团队以 扩散预训练语言模型
Perplexity AI 近日发布了一项重要研究成果:论文《Diffusion-Pretrained Dense and Contextual Embeddings》(扩散预训练的密集与上下文嵌入),正式推出了 pplx-embed(简称 PPLX-Family)系列多语言嵌入模型。该系列模型专为大规模网页搜索和检索任务设计,在 Twitter(X)上迅速引发 AI 社区讨论。
阿杰学AI
2 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
cherry studio
·
ai 桌面客户端
AI核心知识101——大语言模型之 Cherry Studio(简洁且通俗易懂版)
Cherry Studio 是目前在 AI 极客圈和开发者社区中非常流行的一款 全能型 AI 桌面客户端。