语言模型

盼小辉丶1 小时前
深度学习·语言模型·tensorflow
TensorFlow深度学习实战——基于语言模型的动态词嵌入技术基于语言模型的词嵌入技术,通过利用上下文信息来生成动态的词向量,大大提升了词嵌入模型的表达能力。随着 BERT、GPT 等大规模预训练模型的出现,基于语言模型的词嵌入在自然语言处理领域的应用变得越来越广泛,成为当前自然语言处理 (Natural Language Processing, NLP) 研究的一个重要方向。
明明跟你说过1 小时前
人工智能·语言模型·chatgpt·langchain
基于【Lang Chain】构建智能问答系统的实战指南🐇明明跟你说过:个人主页🏅个人专栏:《深度探秘:AI界的007》 🏅🔖行路有良友,便是天堂🔖
eqwaak03 小时前
数据库·python·mysql·adb·语言模型
MySQL 超详细安装教程与常见问题解决方案访问 MySQL 官网下载页面。选择 Windows (x86, 64-bit), MSI Installer(推荐使用完整版 mysql-installer-web-community-8.0.xx.xx.msi)。
川泽曦星16 小时前
人工智能·语言模型·自然语言处理
【第四十周】文献阅读:用于检索-增强大语言模型的查询与重写这篇论文提出了一种名为"Rewrite-Retrieve-Read"的新型检索增强框架,旨在改进大型语言模型(LLMs)在知识密集型任务中的表现。传统方法采用"检索-读取"的两步流程,而本文创新性地在检索前增加了查询重写步骤,形成"重写-检索-读取"的三步流程。核心思想是通过优化检索查询本身来弥合输入文本与所需知识之间的差距,而非像以往研究那样专注于调整检索器或读取器。工作流程分为三个关键阶段:首先利用LLM或可训练的小型语言模型(称为"重写器")对原始查询进行重写;然后使用网络搜索引擎检索相关文档;最后
Jamence19 小时前
人工智能·语言模型·自然语言处理
多模态大语言模型arxiv论文略读(十二)➡️ 论文标题:MarineGPT: Unlocking Secrets of Ocean to the Public ➡️ 论文作者:Ziqiang Zheng, Jipeng Zhang, Tuan-Anh Vu, Shizhe Diao, Yue Him Wong Tim, Sai-Kit Yeung ➡️ 研究机构: Hong Kong University of Science and Technology, Shenzhen University ➡️ 问题背景:大型语言模型(LLMs)如Ch
music&movie1 天前
人工智能·语言模型·自然语言处理
调研大语言模型的知识编辑技术大语言模型(LLMs)的知识编辑旨在通过高效、精准的方式修改模型内部存储的特定知识,以纠正错误、更新信息或消除偏见,同时保持模型的通用能力。其核心原理可分为三类:
Jamence1 天前
人工智能·语言模型·自然语言处理
多模态大语言模型arxiv论文略读(十三)➡️ 论文标题:Octavius: Mitigating Task Interference in MLLMs via LoRA-MoE ➡️ 论文作者:Zeren Chen, Ziqin Wang, Zhen Wang, Huayang Liu, Zhenfei Yin, Si Liu, Lu Sheng, Wanli Ouyang, Yu Qiao, Jing Shao ➡️ 研究机构: Shanghai AI Laboratory, School of Software, Beihang Unive
Panesle1 天前
人工智能·语言模型·llama·nvidia
英伟达Llama-3.1-Nemotron-Ultra-253B-v1语言模型论文快读:FFN Fusion代表模型:Llama-3.1-Nemotron-Ultra-253B-v1本文介绍了一种名为 FFN Fusion 的架构优化技术,旨在通过识别和利用自然并行化机会来减少大型语言模型(LLMs)中的顺序计算。研究发现,移除特定注意力层后剩余的前馈网络(FFN)层序列通常可以并行化,且对准确性影响最小。通过将这些序列转换为并行操作,显著降低了推理延迟,同时保留了模型行为。作者将这种技术应用于 Llama-3.1-405B-Instruct,创建了一个名为 Llama-Nemotron-Ultra-253B-
itwangyang5201 天前
人工智能·python·语言模型·自然语言处理
AIDD-人工智能药物-pyecharts-gallery
Jamence2 天前
人工智能·语言模型·自然语言处理
多模态大语言模型arxiv论文略读(十五)➡️ 论文标题:Jailbreaking GPT-4V via Self-Adversarial Attacks with System Prompts ➡️ 论文作者:Yuanwei Wu, Xiang Li, Yixin Liu, Pan Zhou, Lichao Sun ➡️ 研究机构: Huazhong University of Science and Technology, Lehigh University ➡️ 问题背景:多模态大语言模型(Multimodal Large Language
小白学C++.2 天前
人工智能·语言模型·gpt-3
大模型论文:Language Models are Few-Shot Learners(GPT3)文章地址:https://proceedings.neurips.cc/paper_files/paper/2020/file/1457c0d6bfcb4967418bfb8ac142f64a-Paper.pdf
才思喷涌的小书虫2 天前
人工智能·yolo·目标检测·计算机视觉·ai·语言模型·视觉检测
学术分享:基于 ARCADE 数据集评估 Grounding DINO、YOLO 和 DINO 在血管狭窄检测中的效果冠状动脉疾病(CAD)作为全球主要死亡原因之一,其早期准确检测对有效治疗至关重要。X 射线冠状动脉造影(XCA)虽然是诊断 CAD 的金标准,但这些图像的人工解读不仅耗时,还易受观察者间差异的影响。本研究评估了三种先进的目标检测模型——Grounding DINO、YOLO 和 DINO —— 在 ARCADE 数据集上对冠状动脉造影图像中狭窄(血管变窄)的自动检测性能。
XT46252 天前
人工智能·语言模型·自然语言处理
AI 之 LLM(大语言模型)是如何生成文本的!你是不是也曾在朋友面前自信满满地说:“AI我可太熟了!”然后随便丢一句“写篇短文”给大模型,坐等它秒出结果?但你有没有想过,那几秒钟里,AI到底干了什么?从你敲下的几个字,到屏幕上蹦出的流畅句子,这背后可不是什么“魔法”。如果你连LLM(大语言模型)如何生成文本都不清楚,还好意思说自己懂AI?别急,今天我就带你拆开这台“写作机器”,用最直白的方式讲清楚每个步骤,看完你再吹牛,至少底气足点!
崔高杰2 天前
论文阅读·人工智能·语言模型·nlp
LEARNING DYNAMICS OF LLM FINETUNING【论文阅读笔记】作者将LLM的学习动力机制拆解成AKG三项,并分别观察了SFT和DPO训练过程中正梯度信号和负梯度信号的变化及其带来的影响,并得到以下结论:
敲键盘的小夜猫2 天前
人工智能·语言模型·自然语言处理
DeepSeek大语言模型部署指南:从基础认知到本地实现目录一、DeepSeek简介:开源领域的新兴力量1.1 公司背景与发展历程1.2 核心产品DeepSeek-R1的技术特点
沐雪架构师2 天前
人工智能·语言模型
大模型分布式推理和量化部署对于一个7B(70亿)参数的模型,每个参数使用16位浮点数(等于 2个 Byte)表示,则模型的权重大小约为:
三道杠卷胡3 天前
人工智能·python·计算机视觉·语言模型·aigc
【AI News | 20250411】每日AI进展1、docext docext是一款无需OCR的本地化文档信息提取工具,利用视觉语言模型(VLM)从发票、护照等文档图像中高效提取结构化字段和表格数据。其支持自定义字段或预置模板,提供置信度评分、多页处理及REST API集成,适用于多种操作系统(Linux/MacOS),并内置常见文档模板(如发票、护照),用户可灵活扩展字段或模板,满足企业级私有化部署需求。
新加坡内哥谈技术3 天前
人工智能·深度学习·语言模型·自然语言处理·自动化
OpenAI即将上线新一代重磅选手——GPT-4.1每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
小马过河R3 天前
人工智能·深度学习·机器学习·语言模型·nlp
通俗理解CLIP模型如何实现图搜图乃至文搜图图搜图和文搜图的场景相信大家并不少见,比如度娘的搜索框就可以直接上传图片找到相似的图片,还有某宝某团都有这种上传图片匹配到相似商品或者商品页的推荐的功能。那比如我想搜一张“正在跳舞的狗”的图片,是不是就能搜出来呢? 我们可以看到搜是搜出来了,但是基本图片的标题都涵盖了关键字“跳舞”、“狗”等。那么问题来了,度娘的图片搜索用的是图片标签的关键词匹配还是深度学习的文搜图?这个小马目前也不得而知,但丝毫不影响今天的主题。