用大型语言模型进行复杂相对局部描述的地理定位

深度强化学习 / 强化学习培训 / 数字孪生培训 / 大模型培训 / 智能体培训 / 具身智能培训

地理参照文本文件通常采用两种方法:一是基于地名录的方法,通过地名分配地理坐标;二是通过语言建模方法,将文本术语与地理位置相关联。然而,许多位置描述通过空间关系来相对地指定方位,这使得仅依赖地名或地理指示词进行地理编码往往不够精确。这一问题在生物标本采集记录中尤为常见------在使用全球定位系统(GPS)之前的记录,其位置常以叙述性文字而非坐标形式记载。尽管准确的地理参照对生物多样性研究至关重要,但该过程仍依赖大量人工操作,因此迫切需要自动化地理参照解决方案。

本文探讨了大型语言模型(LLMs)在自动化处理复杂位置描述的地理参照方面的潜力,重点关注生物多样性标本收藏领域。我们首先确定了有效的提示模式,随后采用量化低秩自适应方法(QLoRA),基于多地区、多语言的生物多样性数据集对大型语言模型进行了微调。在训练数据量固定的条件下,我们的方法优于现有基准模型,在不同数据集中平均有65%的记录定位在10公里半径范围内。其中最佳结果(纽约州数据集)达到85%记录在10公里范围内,67%在1公里范围内。实验表明,所选大型语言模型在处理冗长复杂描述时表现优异,凸显了其在精细位置描述地理参照应用中的巨大潜力。

本文提出的基于大型语言模型的复杂相对局部描述地理定位方法,为解决开放环境下依赖自然语言的空间定位难题提供了创新思路。该方法通过大模型对非结构化文本中多层次、多参照物的复杂空间关系(如"路口东北角红色建筑后的街心公园")进行深度语义解析与空间推理,将其转化为机器可理解的结构化地理查询,并与多源地理信息数据进行动态关联与验证。实验表明,该方法在开放场景中显著提升了基于模糊描述的定位成功率与精度,为下一代智能地理信息系统、无障碍导航及沉浸式数字孪生应用提供了关键技术支持,推动了人机自然交互与空间智能计算的深度融合。

原文链接:https://arxiv.org/html/2512.14228v1

相关推荐
魏祖潇2 小时前
DDD、TDD、SDD——AI 时代工程师的三件秩序乐器
人工智能·ai编程
Bigfish_coding2 小时前
前端转agent-【python】-18 Agent 与本地应用结合:让 AI 操作你的浏览器
人工智能
网易云信2 小时前
OpenClaw最佳实践:部署在圈组的AI团队
人工智能·agent
爱读源码的大都督2 小时前
Claude Code源码解析(一):为什么Claude Code系统提示词中需要有tools?
人工智能
没落英雄2 小时前
2. 让 Agent 能读写文件、执行命令 —— LocalShellBackend 实战
前端·人工智能·架构
Daybreak2 小时前
一次阿里云百炼异常扣费的排查和修复总结
人工智能
十九画生2 小时前
LLM 是怎么预测下一个词的?从 Token 到 Transformer 的内部流程
人工智能
程序员cxuan2 小时前
Anthropic 大面积封号,连大 V 都忍不了开喷了。
人工智能·后端·程序员
用户852495071842 小时前
大模型是怎么学会"接话"的?从 Token 到自注意力一次讲清楚
人工智能