自然语言处理

zeroporn9 天前
人工智能·深度学习·算法·自然语言处理·embedding·word2vec·skip-gram
以玄幻小说方式打开深度学习词嵌入算法!! 使用Skip-gram来完成 Word2Vec 词嵌入(Embedding)在浩瀚的修真界中,存在一种上古秘术名为《词嵌真经》。修士们发现,世间万物皆有其“道韵”,而语言中的每个字词都暗含天地法则。传统修炼方式需逐个参悟字词,耗时千年方能小成。
Zhijun.li@Studio9 天前
人工智能·自然语言处理·llama·多模态大模型
【LLaMA-Factory 实战系列】二、WebUI 篇 - Qwen2.5-VL 多模态模型 LoRA 微调保姆级教程本教程将详细介绍如何使用 LLaMA-Factory 的图形化 WebUI 界面,对强大的开源多模态模型 Qwen2.5-VL-3B-Instruct 进行 LoRA 微调。LLaMA-Factory 是一个功能强大、简单易用的一站式大模型微调平台,它集成了多种主流的微调方法(如 LoRA、QLoRA、全量微调等),并通过简洁的 WebUI 和命令行工具,极大地降低了个人或小型团队进行模型训练的门槛。我们将以经典的宝可梦图文数据集为例,一步步带您完成从环境搭建到模型评估的全过程。
lgbisha10 天前
人工智能·ai·语言模型·自然语言处理·华为云·ai写作
华为云Flexus+DeepSeek征文|体验华为云ModelArts快速搭建Dify-LLM应用开发平台并创建自己的AI写作神器Dify-LLM 应用开发平台是一个基于大型语言模型(LLM)的低代码/无代码开发平台,旨在帮助开发者快速构建、部署和管理基于 AI 的应用程序。它提供了可视化的操作界面和丰富的工具,简化了从模型调用到应用上线的全流程,适合不同技术背景的用户使用。
大模型最新论文速读10 天前
人工智能·深度学习·机器学习·缓存·语言模型·自然语言处理
Agent成本降低46%:缓存规划器的思路模板论文标题Cost-Efficient Serving of LLM Agents via Test-Time Plan Caching
unityのkiven10 天前
人工智能·自然语言处理
Happy-LLM task2 第一章 NLP 基础概念(2天)自然语言处理(Natural Language Processing,NLP)是人工智能领域的核心分支,旨在让计算机理解、处理并生成人类语言,实现人机自然交互。
东临碣石8210 天前
人工智能·语言模型·自然语言处理
【AI论文】扩展大型语言模型(LLM)智能体在测试时的计算量摘要:扩展测试时的计算量在提升大型语言模型(LLMs)的推理能力方面已展现出显著成效。在本研究中,我们首次系统地探索了将测试时扩展方法应用于语言智能体,并研究了该方法在多大程度上能提高其有效性。具体而言,我们探索了不同的测试时扩展策略,包括:(1)并行采样算法;(2)顺序修订策略;(3)验证器与结果合并方法;(4)多样化推演策略。我们仔细分析并消融了不同设计策略对语言智能体应用测试时扩展的影响,并得出以下发现:1. 扩展测试时的计算量能够提升智能体的性能。2. 知道何时进行反思对智能体而言至关重要。3.
H4ppyD0g10 天前
人工智能·语言模型·自然语言处理
预训练语言模型基础知识概述以图像领域的预训练为例,CNN一般用于图片分类任务,越浅的层学到的特征越通用(横竖撇捺),越深的层学到的特征和具体任务的关联性越强。
UQI-LIUWJ10 天前
人工智能·语言模型·自然语言处理
论文笔记:Large language model augmented narrative driven recommendationsRecSys 2023代码:iesl/narrative-driven-rec-mint: Mint: A data augmentation method for narrative driven recommendation.
抱抱宝11 天前
深度学习·自然语言处理·transformer
Transformer:现代自然语言处理的革命性架构Transformer模型彻底改变了自然语言处理领域,它摒弃了传统的循环神经网络(RNN)结构,完全基于自注意力机制构建。这种架构在机器翻译、文本生成等任务中表现出色,成为当今NLP模型的基石。
mailangduoduo11 天前
人工智能·自然语言处理·文本分类·循环神经网络·长短期记忆网络
基于双层注意力重加权 LSTM 的中文长文本谣言检测模型虚假信息在社交媒体上传播迅速,会对公众的行为及对社会事件的反应产生负面影响。长文本假新闻由于信息复杂,难以全面识别,现有的检测方法存在不足。针对上述现象,本文提出一种基于双层注意力重加权的长文本谣言检测模型。模型采用双层双向 LSTM 架构,通过第一层 LSTM 提取基础语义特征并结合 Tanh 非线性变换与线性层计算词级注意力权重定位关键区域;第二层 LSTM 以 Sigmoid 门控网络生成的动态特征权重与第一层注意力权重重加权后的特征为输入,进一步强化深层语义关联;最终拼接两层注意力的全局池化特征,
nuise_12 天前
人工智能·语言模型·自然语言处理
李宏毅 《生成式人工智能导论》| 第6讲-第8讲:大语言模型修炼史所有的阶段都是在学习文字接龙,只是训练的资料不同。在文字接龙中,每次产生出来的符号被叫做token模型:有大量未知参数的函数
lgbisha12 天前
人工智能·ai·语言模型·自然语言处理·华为云
华为云Flexus+DeepSeek征文|体验华为云ModelArts快速搭建Dify-LLM应用开发平台并创建天气预报大模型Dify-LLM 应用开发平台是一个基于大型语言模型(LLM)的低代码/无代码开发平台,旨在帮助开发者快速构建、部署和管理基于 AI 的应用程序。它提供了可视化的操作界面和丰富的工具,简化了从模型调用到应用上线的全流程,适合不同技术背景的用户使用。
unityのkiven12 天前
自然语言处理
Happy-LLM-task3 :2.1 注意力机制 2 天
羊小猪~~13 天前
人工智能·深度学习·神经网络·自然语言处理·大模型·nlp·embedding
【NLP入门系列三】NLP文本嵌入(以Embedding和EmbeddingBag为例)博主简介:努力学习的22级本科生一枚 🌟;探索AI算法,C++,go语言的世界;在迷茫中寻找光芒🌸 博客主页:羊小猪~~-CSDN博客 内容简介:NLP入门三,Embedding和EmbeddingBag嵌入. 🌸箴言🌸:去寻找理想的“天空“”之城 上一篇内容:【NLP入门系列二】NLP分词和字典构建-CSDN博客
Jamence13 天前
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
多模态大语言模型arxiv论文略读(131)➡️ 论文标题:MLLM as Retriever: Interactively Learning Multimodal Retrieval for Embodied Agents ➡️ 论文作者:Junpeng Yue, Xinru Xu, Börje F. Karlsson, Zongqing Lu ➡️ 研究机构: 北京大学、中国科学院软件研究所、北京人工智能研究院 ➡️ 问题背景:多模态大型语言模型(MLLMs)在处理复杂具身任务时展现出潜力,通过检索多模态任务相关轨迹数据来完成任务。然而,当前的
背太阳的牧羊人14 天前
人工智能·语言模型·自然语言处理
BitsAndBytes(简称 BnB)是一个用于“压缩”大语言模型的工具包BitsAndBytes(简称 BnB)是一个用于“压缩”大语言模型的工具包,能把模型从原来的16位或32位,压成4位或8位,减少显存占用,同时保持尽量高的精度。
思绪漂移14 天前
人工智能·语言模型·自然语言处理
大型语言模型(LLM)的构建模块吴恩达来信:认识新一代生成式AI应用工程师生成式AI应用工程师通常具备两个主要条件:(i) 能够利用新的AI构建模块快速开发强大的应用;(ii) 能够借助AI辅助快速完成工程开发,用远少于以往的时间搭建软件系统
lgbisha14 天前
人工智能·ai·自然语言处理·华为云
华为云Flexus+DeepSeek征文|体验华为云ModelArts快速搭建Dify-LLM应用开发平台并搭建查询数据库的大模型工作流Dify-LLM 应用开发平台是一个基于大型语言模型(LLM)的低代码/无代码开发平台,旨在帮助开发者快速构建、部署和管理基于 AI 的应用程序。它提供了可视化的操作界面和丰富的工具,简化了从模型调用到应用上线的全流程,适合不同技术背景的用户使用。
愚者大大14 天前
人工智能·自然语言处理
自然语言处理相关基本概念定义核心内容定义发展里程碑定义评估标准定义与其他学科的关系定义汉语的特点通过以上总结,可清晰梳理自然语言处理领域的核心概念及其相互关系,为后续学习奠定理论基础。
Ethanwhh14 天前
人工智能·语言模型·自然语言处理
大语言模型原理与实战(第一章NLP基础概念)目录第一章NLP基础概念什么是NLP:NLP发展历程:NLP任务:文本表示的发展历程:最近大模型很火,很多朋友想要入门大模型,网上的资料很多,不知道从何开始,非常有幸看到Datawhale开源了大语言模型原理与实战教程——Happy-LLM。