语言模型

AI实战5 小时前
人工智能·语言模型·自动驾驶
多车合作自动驾驶框架CoDrivingLLM:基于大语言模型驱动的决策框架目前,全球范围内已开始对联网自动驾驶汽车(CAVs)进行道路测试,但它们在复杂场景中的安全性和效率表现仍不令人满意。合作驾驶利用CAVs的连接能力,通过协同作用超越个体表现,使其成为在复杂场景中提高CAV性能的有前途方法。然而,缺乏交互和持续学习能力限制了当前的合作驾驶仅能应用于单一场景和特定的合作驾驶自动化(CDA)。为了解决这些挑战,本文提出了一种交互式和可学习的基于大型语言模型(LLM)的合作驾驶框架——CoDrivingLLM,以实现全场景和全CDA。首先,由于LLM不擅长处理数学计算,我们引入了
小城哇哇5 小时前
人工智能·学习·ai·语言模型·pdf·大模型·agi
AI大模型对我国劳动力市场潜在影响研究报告(2024)|附19页PDF文件下载北京大学国家发展研究院与智联招聘日前联合发布《AI大模型对我国劳动力市场潜在影响研究》。该研究显示,2024年上半年,招聘职位数同比增速前五的人工智能职业,包括大语言模型方面的自然语言处理(111%)、深度学习(61%)岗位,机器人方面的机器人算法岗位(76%),自动驾驶方面的智能驾驶系统工程师(49%)、导航算法(47%)。
三月七(爱看动漫的程序员)8 小时前
人工智能·gpt·语言模型·chatgpt·prompt·知识图谱·boosting
Enhancing Trust in LLMs: Algorithms for Comparing and Interpreting LLMs增强LLM中的信任:比较和解释LLM的算法论文地址:hhttps://arxiv.org/pdf/2406.01943
知来者逆8 小时前
人工智能·rnn·深度学习·神经网络·机器学习·语言模型·智慧医疗
BiGRU——提高基于 RNN免疫反应预测的准确性论文地址:https://arxiv.org/abs/2208.04314人们有一种叫做免疫系统的系统来保护自己免受外来有害物质(包括病毒和细菌)的侵害。免疫系统是指包括白细胞在内的人体内各种元素相互配合以保卫身体的系统,众所周知,它是人类生存的重要机制。近年来,人们一直在研究如何利用免疫系统的机制来治疗难以治愈的癌症。 免疫系统中一个特别重要的组成部分是HLA分子,它通过向另一个细胞呈现一种叫做肽的物质来诱导免疫反应,这种物质会被一个细胞吸收,因此它是发生免疫反应的一个重要组成部分。近年来,人们一直在进
沉下心来学鲁班9 小时前
人工智能·语言模型·分类·微调
欺诈文本分类检测(十七):支持分类原因训练前文数据校正与增强进行了数据增强,本文将使用增强后的数据对模型进行进一步训练,以便得到能同时预测出分类标签、欺诈者、分类原因多个信息的模型。
sp_fyf_202412 小时前
人工智能·深度学习·算法·语言模型·自然语言处理
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-25M Nazzal, I Khalil, A Khreishah, NH Phan - arXiv preprint arXiv:2409.12699, 2024 https://arxiv.org/pdf/2409.12699 PromSec: 使用大型语言模型(LLMs)生成功能源代码的提示优化以确保安全
DA树聚12 小时前
人工智能·深度学习·算法·机器学习·语言模型·分类·transformer
人工智能-机器学习-深度学习-分类与算法梳理目前人工智能的概念层出不穷,容易搞混,理清脉络,有益新知识入脑。为便于梳理,本文只有提纲,且笔者准备仓促,敬请勘误,不甚感激。 请看右边目录索引 。
shadowcz00717 小时前
人工智能·语言模型·自然语言处理·编辑器
结合了LLM(大语言模型)的编辑器,不仅能理解人类语言,还能与用户互动,仿佛有了自己的思想。...从前有一个神奇的编辑器王国,那里住着各种编辑器:开源的、AI代码编辑器、视频编辑器,还有专门处理邮件和音频的编辑器。一天,国王Markdown决定举办一场盛会,邀请所有编辑器展示各自的才华。
DogDaoDao17 小时前
人工智能·windows·深度学习·ai·语言模型·大模型·llama
Windows下安装 LLama-Factory 保姆级教程LLaMA Factory 是一个旨在简化大型语言模型训练和微调流程的平台。它支持多种预训练模型,如LLaMA、LLaVA、Mistral等,以及多种训练算法,包括增量预训练、多模态指令监督微调、奖励模型训练等。此外,LLaMA Factory 还支持不同的运算精度和优化算法,以及分布式训练,使得在单机多卡或多机多卡环境下进行训练成为可能。
玩转AI大模型18 小时前
人工智能·学习·语言模型·自然语言处理·langchain·transformer·产品经理
AI产品经理学习路径:从零基础到精通,从此篇开始!市面上不同的公司对产品经理的定位有很大的差别,一名合格的产品经理是能对软件产品整个生命周期负责的人。思考框架相同: AI产品经理和通用型软件产品经理的底层思考框架是一样的,都是要经历产品立项、需求分析、产品设计、产品执行管理(研发测试)、验收、分析迭代这几个阶段。
HyperAI超神经18 小时前
图像处理·人工智能·机器学习·语言模型·自然语言处理·数据集·图像分割
入选ECCV 2024!覆盖5.4w+图像,MIT提出医学图像分割通用模型ScribblePrompt,性能优于SAM外行看热闹,内行看门道,这句话在医学影像领域可谓是绝对真理。不仅如此,即便身为内行人,要想在复杂的 X 光片、CT 光片或 MRI 等医学影像上准确看出些「门道」来,也并非易事。而医学图像分割则是通过将复杂的医学图像中某些具有特殊含义的部分分割出来,并提取相关特征,从而可以辅助医生为患者提供更为准确的诊疗方案,也可以为科研人员进行病理学研究提供更为可靠的依据。
sp_fyf_202418 小时前
人工智能·语言模型·自然语言处理
[大语言模型-论文精读] Diffusion Model技术-通过时间和空间组合扩散模型生成复杂的3D人物动作L Mandelli, S Berretti - arXiv preprint arXiv:2409.11920, 2024
新加坡内哥谈技术19 小时前
人工智能·语言模型·自然语言处理·chatgpt
Meta的首席技术官安德鲁·博斯沃思谈Orion和Apple的竞争每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
知来者逆21 小时前
人工智能·深度学习·语言模型·大语言模型·缺陷检测·anomalygpt
工业缺陷检测——Windows 10本地部署AnomalyGPT工业缺陷检测大模型在缺陷检测中,由于真实世界样本中的缺陷数据极为稀少,有时在几千甚至几万个样品中才会出现一个缺陷数据。因此,以往的模型只需在正常样本上进行训练,学习正常样品的数据分布。在测试时,需要手动指定阈值来区分每种项目的正常和异常实例,然而这并不适用于实际的生产环境。 大型视觉语言模型(LVLMs),诸如 MiniGPT - 4 和 LLaVA,已展现出强大的图像理解能力,在各类视觉任务中取得显著性能。那么,大模型能否应用于工业缺陷检测领域呢?AnomalyGPT 对此展开了深入探索
zzZ_CMing21 小时前
人工智能·语言模型·自然语言处理
大语言模型量化方法GPTQ、GGUF、AWQ详细原理大语言模型量化的目的是减少模型的计算资源需求和存储占用,同时尽量保持模型的性能。以下是几种常见的量化方法的原理;
龙的爹233321 小时前
人工智能·深度学习·语言模型·自然语言处理·chatgpt·nlp
论文 | Reframing Instructional Prompts to GPTk’s Language作者:Swaroop Mishra, Daniel Khashabi, Chitta Baral, Yejin Choi, Hannaneh Hajishirzi
龙的爹233321 小时前
人工智能·gpt·语言模型·自然语言处理·nlp·prompt
论文翻译 | Reframing Instructional Prompts to GPTk’s Language 将教学提示重新构建为GPTk的语言对于语言模型(LMs),哪些类型的指导提示更容易遵循?我们通过广泛的实证分析来研究这个问题,揭示了成功的教学提示的重要特征。 具体来说,我们研究了几种用于手动将提示重新表述为更有效提示的重构技术。一些示例包括将复杂的任务指令分解为多个更简单的任务,或是将指令逐项划分为连续的步骤。我们的实验比较了在六个类别的十二个NLP任务中,由重构指令提示的LMs的零样本和少样本性能。与原始指令相比,我们的重构指令在不同规模的LMs上取得了显著的改进。例如,在所有任务中,相同的重构提示分别使GPT-3系列和GPT-2系列
知来者逆21 小时前
人工智能·语言模型·自然语言处理·llm·大语言模型
SGLang——结构化语言模型程序的高效执行大型语言模型 (LLM) 越来越多地用于需要多次生成调用、高级提示技术、控制流和结构化输入/输出的复杂任务。然而,缺乏用于编程和执行这些应用程序的高效系统。新推出的系统 SGLang 旨在通过提供复杂语言模型程序的高效执行来解决这一问题。SGLang 包含前端语言和运行时。前端使用用于生成和并行控制的原语简化编程,而运行时通过新颖的优化加速执行,例如用于 KV 缓存重用的 RadixAttention 和用于更快结构化输出解码的压缩有限状态机。实验表明,与各种大型语言和多模态模型上的最先进推理系统相比,S
小小帅AIGC1 天前
人工智能·深度学习·语言模型·自然语言处理·llm·大语言模型·论文推送
AI推介-大语言模型LLMs论文速览(arXiv方向):2024.09.05-2024.09.10标题:E2LLM:用于长语境理解和推理的编码器拉长大语言模型author:Zihan Liao, Jun Wang, Hang Yu, Lingxiao Wei, Jianguo Li, Jun Wang, Wei Zhang
qq_262498111 天前
人工智能·语言模型·nlp
Tiny-universe手戳大模型 TinyAgent--task3这里基于React的方式,我们手动制作了一个最小的Agent结构(其实更多的是调用工具),尝试将React结构修改为SOP结构。一步一步手写Agent,可以让我们对Agent的构成和运作更加的了解。