语言模型

Jamence3 小时前
人工智能·语言模型·自然语言处理
多模态大语言模型arxiv论文略读(六十二)➡️ 论文标题:MileBench: Benchmarking MLLMs in Long Context ➡️ 论文作者:Dingjie Song, Shunian Chen, Guiming Hardy Chen, Fei Yu, Xiang Wan, Benyou Wang ➡️ 研究机构: The Chinese University of Hong Kong, Shenzhen, Shenzhen Research Institute of Big Data ➡️ 问题背景:尽管多模态大语言模型
知来者逆13 小时前
人工智能·深度学习·语言模型·自然语言处理·llm
在与大语言模型交互中的礼貌现象:技术影响、社会行为与文化意义的多维度探讨关于是否值得对 AI 保持礼貌的公众意见,几乎和咖啡或红酒的最新研究结果一样频繁变化——这个月被推崇备至,下个月又受到质疑。即便如此,越来越多的用户现在在提示语中加入“请”或“谢谢”,这不仅仅是因为习惯,或者担心粗鲁的交流会延续到现实生活中,而是因为他们相信礼貌能够带来更好、更高效的结果。
果冻人工智能1 天前
大数据·人工智能·深度学习·语言模型·自然语言处理·ai员工
AI能否取代软件架构师?我将4个大语言模型进行了测试前言:随着AI技术的飞速发展,‘AI能否取代软件架构师’这一问题已成为热门话题。今天,我们将一起探讨生成式AI能否取代软件架构师的工作。如果你正在关注AI如何在架构设计中应用,或者有兴趣了解如何将AI技术落地,我作为一名🔧 技术实战派|AI软硬件一体解决者,可以为你提供更多的实践经验与帮助。欢迎私信我!
没有梦想的咸鱼185-1037-16631 天前
人工智能·python·机器学习·arcgis·语言模型·chatgpt·数据分析
【大语言模型ChatGPT4/4o 】“AI大模型+”多技术融合:赋能自然科学暨ChatGPT在地学、GIS、气象、农业、生态与环境领域中的应用以ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮,可以面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算法学习、论文检索、写作、翻译、润色、文献辅助阅读、文献信息提取、辅助论文审稿、新闻撰写、科技绘图、地学绘图(GIS地图绘制)、概念图生成、图像识别、教学课件、教学案例生成、基金润色、专业咨询、文件上传和处理、机器/深度学习训练与模拟、大模型API二次开发
大G哥1 天前
人工智能·语言模型·自然语言处理
ReSearch:基于强化学习的大语言模型推理搜索框架ReSearch是一种创新性框架,通过强化学习技术训练大语言模型执行"推理搜索",无需依赖推理步骤的监督数据。该方法将搜索操作视为推理链的有机组成部分,其中搜索的时机与方式由基于文本的推理过程决定,而搜索结果进一步引导后续推理。研究分析表明,ReSearch在强化学习训练过程中自然地形成了高级推理能力,包括反思与自我纠正机制。
仙人掌_lz1 天前
人工智能·python·ai·语言模型·自然语言处理·bert
微调ModernBERT为大型语言模型打造高效“过滤器”通过比较这些模型的三个核心方面,我们旨在为模型开发者突出 ModernBERT 的有效设计选择,并为未来的 BERT 类模型开发确定关键洞察。我们还将分享开发 jina-embeddings-v3 的经验,并讨论 jina-embeddings-v4 和 jina-reranker-v3 的计划改进。
一切皆有可能!!1 天前
人工智能·语言模型
(2025)图文解锁RAG从原理到实操RAG(检索增强生成)是一种将语言模型与可搜索知识库结合的方法,主要包含以下关键步骤:数据预处理检索系统构建
小马过河R2 天前
人工智能·microsoft·语言模型
在Cline上调用MCP服务之MCP实践篇上一篇《模型上下文协议(Model Context Protocol,MCP)初见概念篇》我们说到什么是模型上下文协议MCP并对其原理有所了解。今天我们就来实践一番。我们以Visual Studio Code上的Cline插件调用MCP为例来直观感受下MCP的调用流程实践,以此来加深对MCP概念的理解。
一点.点2 天前
论文阅读·人工智能·语言模型·自动驾驶
使用零样本LLM在现实世界环境中推广端到端自动驾驶——论文阅读《Generalizing End-To-End Autonomous Driving In Real-World Environments Using Zero-Shot LLMs》2024年12月发表,来自纽约stony brook大学、UIC和桑瑞思(数字化医疗科技公司)的论文。
一点.点2 天前
人工智能·语言模型·自动驾驶
LeapVAD:通过认知感知和 Dual-Process 思维实现自动驾驶飞跃——论文阅读《LeapVAD: A Leap in Autonomous Driving via Cognitive Perception and Dual-Process Thinking》2025年1月发表,来自浙江大学、上海AI实验室、慕尼黑工大、同济大学和中科大的论文。
一点.点3 天前
人工智能·语言模型·自动驾驶
WiseAD:基于视觉-语言模型的知识增强型端到端自动驾驶——论文阅读《WiseAD: Knowledge Augmented End-to-End Autonomous Driving with Vision-Language Model》2024年12月发表,来自新加坡国立和浙大的论文。
打小就很皮...3 天前
人工智能·语言模型·prompt
编写大模型Prompt提示词方法根据提示词的要求,大模型会返回一个 JSON 对象,示例如下:在实际开发中,需要对返回的 JSON 结果进行处理。以下是一个简单的 JavaScript 示例,展示如何解析和使用返回的结果:
AI蜗牛车3 天前
人工智能·语言模型·prompt·copilot·agent
【LLM+Code】Devin Prompt&Tools详细解读官网:https://devin.ai/大部分篇幅都是tools的直出的description和parameters的一些信息
Jamence3 天前
人工智能·语言模型·自然语言处理
多模态大语言模型arxiv论文略读(六十五)➡️ 论文标题:VS-Assistant: Versatile Surgery Assistant on the Demand of Surgeons ➡️ 论文作者:Zhen Chen, Xingjian Luo, Jinlin Wu, Danny T. M. Chan, Zhen Lei, Jinqiao Wang, Sebastien Ourselin, Hongbin Liu ➡️ 研究机构: Centre for Artificial Intelligence and Robotics (CAI
zzlyx993 天前
人工智能·语言模型·自然语言处理
探讨关于智能体(Agent)结合 Dify、大语言模型(LLM)以及 Qwen-3 模型的项目或概念Dify 是一个开源的 AI 框架,它可以帮助开发者快速搭建和部署 AI 应用。它可以作为一个基础架构,为智能体提供以下支持:
聚客AI3 天前
人工智能·语言模型·chatgpt·transformer·ai大模型·模型微调·deepseek
预训练模型实战手册:用BERT/GPT-2微调实现10倍效率提升,Hugging Face生态下的迁移学习全链路实践更多AI大模型应用开发学习内容,尽在聚客AI学院。预训练模型(Pre-trained Model, PTM)是在大规模通用数据上预先训练的模型,通过自监督学习掌握基础语义理解能力,可迁移到下游任务。典型代表:
Jamence4 天前
人工智能·语言模型·自然语言处理
多模态大语言模型arxiv论文略读(六十三)➡️ 论文标题:Auto-Encoding Morph-Tokens for Multimodal LLM ➡️ 论文作者:Kaihang Pan, Siliang Tang, Juncheng Li, Zhaoyu Fan, Wei Chow, Shuicheng Yan, Tat-Seng Chua, Yueting Zhuang, Hanwang Zhang ➡️ 研究机构: 浙江大学、新加坡国立大学、Skywork AI、南洋理工大学 ➡️ 问题背景:当前的多模态大语言模型(Multimodal
bullnfresh4 天前
人工智能·神经网络·语言模型
神经网络语言模型(NNLM)的原理与实现在NLP中,语言模型用来判断一句话是否符合正确的语法,广泛应用于信息检索、机器翻译、语音识别等重要任务中。传统的语言模型主要基于统计方法(如:N-Gram模型),虽然可解释性强、易于理解,但存在泛化能力差等问题。随着深度学习技术的发展,相关技术也应用到语言模型中,如神经网络语言模型(Neural Network Language Model模型)。
蜂耘4 天前
人工智能·语言模型
国产大模型新突破:小米大语言模型开源,推理性能超越o1-mini小米集团大模型团队4月30日正式宣布开源"Xiaomi MiMo"大语言模型。这款专为推理任务优化的7B参数模型,在多项基准测试中超越同规模主流模型,展现出小米在人工智能领域的技术实力。
三道杠卷胡4 天前
人工智能·python·计算机视觉·语言模型·aigc
【AI News | 20250507】每日AI进展1、CFWorkerACME SSL证书助手是一个免费开源的平台,基于Cloudflare Worker运行,旨在自动化SSL证书的申请和下发,尤其适用于多服务器或内网环境。它通过自动化的CNAME和DNS操作完成域名验证,支持Let’s Encrypt、ZeroSSL等多个证书提供商。相较于acme.sh,该平台通过一次CNAME设置即可永久使用,简化了通配符证书申请和多服务器同步。用户可选择使用演示平台或部署私有实例,后者安全性更高。