语言模型

是Dream呀2 小时前
语言模型·llm·aigc·文心一言·ernie-5.0
OpenAI与百度同日竞速,文心5.0以原生全模态重新定义AI理解力目录一、技术底层的硬实力1.万亿级参数高效推理2.基准测试实力二、多模态理解三、实战测试1.视频理解2.情绪识别
野生面壁者章北海4 小时前
人工智能·语言模型·自然语言处理
ICML2025|基于Logits的大语言模型端到端文本水印方法由澳门大学研究者联合完成的论文《An End-to-End Model for Logits-Based Large Language Models Watermarking》发表于2025年ICML国际机器学习大会。该研究针对当前大语言模型生成内容在版权溯源与真实性验证方面的难题,提出了一种创新性的端到端logits扰动水印模型。论文首次实现了编码器与解码器的联合优化,显著提升了水印检测的鲁棒性与文本质量之间的平衡。为解决端到端训练中的非可微问题,研究者提出了一种“在线提示”技术,使模型能够通过运行时大
DisonTangor7 小时前
人工智能·百度·语言模型·开源·aigc
【百度拥抱开源】介绍ERNIE-4.5-VL-28B-A3B-Thinking:多模态AI的重大突破基于强大的ERNIE-4.5-VL-28B-A3B架构全新升级的ERNIE-4.5-VL-28B-A3B-Thinking,在多模态推理能力上实现了质的飞跃。🧠✨通过大规模的中期训练阶段,模型吸收了海量且高度多样化的优质视觉语言推理数据。这种超大规模训练显著提升了模型的表征能力,同时加深了视觉与语言模态间的语义对齐——解锁了前所未有的精细化图文推理能力。📊
野生面壁者章北海8 小时前
人工智能·语言模型·自然语言处理
NeurIPS 2024|大语言模型高保真文本水印新范式由法国雷恩大学研究者联合完成的论文《WaterMax: Breaking the LLM Watermark Detectability–Robustness–Quality Trade-off》发表于2024年NeurIPS大会。该研究聚焦于大语言模型文本生成的可追溯性与版权保护难题,提出了一种全新的水印框架WaterMax,突破了以往检测性–鲁棒性–文本质量三者无法兼得的瓶颈。与现有通过修改 logits 或采样分布的方案不同,该方法完全不改变模型权重与采样机制,而是通过多候选文本生成与选择策略实现水
走上未曾设想的道路8 小时前
语言模型
vllm缓存使用基础调优实验我在使用显卡时发现,vllm会倾向用直接占用所有显存,纵然是一个很小的模型的情况下。我更期待在同一张先看上部署多个模型,并行使用。
Ma04071314 小时前
人工智能·语言模型·自然语言处理
【论文阅读17】-LLM-TSFD:一种基于大型语言模型的工业时间序列人机回路故障诊断方法题目:Brain-Like Cognition-Driven Model Factory for IIoT Fault Diagnosis by Combining LLMs With Small Models
喜欢吃豆17 小时前
人工智能·语言模型·自然语言处理·大模型·parquet
Parquet 范式:大语言模型训练数据格式优化的基础解析将数据格式转换为 Apache Parquet 并非一种随意的偏好,而是针对大规模数据处理(尤其是大语言模型 (LLM) 训练)的一项基础性能优化。Parquet 格式通过其列式存储架构,在 I/O 效率、存储成本和查询性能方面提供了数量级的提升。
电科_银尘1 天前
人工智能·语言模型·自然语言处理
【大语言模型】-- 私有化部署文章目录一、按交付形态 一体机 整机柜出厂即交付,插电即用 纯软件 仅授权模型+推理框架,客户自购服务器 私有化 SaaS 模型以容器/Helm 包交付,部署在客户私有 K8s 上
雾江流1 天前
人工智能·语言模型·自然语言处理·软件工程
RikkaHub 1.6.11 | 开源的本地大型语言模型聚合应用,支持多种AI服务提供商RikkaHub是一款专为Android设计的一体化AI助手应用。作为一款开源的本地大型语言模型聊天客户端,它让用户可以自由配置多种AI服务提供商(例如OpenAI、Anthropic、Google等),并支持文字、图片、文档等多种形式的输入。该应用不仅内置了Markdown渲染、Latex支持、代码高亮显示以及Mermaid流程图绘制等功能,还提供了诸如消息分支、Prompt变量设定、搜索引擎集成及角色卡导入等高级功能,极大地丰富了用户的对话与创作体验。
甄心爱学习1 天前
数学建模·语言模型·全文检索
信息检索11-语言模型token化后可能有顺序可能无序无序为词包模型布尔检索-共现矩阵(无序)向量空间模型-换为tf-idf权重
开发者导航2 天前
语言模型·开源·llama
【开发者导航】轻量可微调且开源的大语言模型家族:LLaMAHello大家好!我是助你打破信息差的 开发者导航。今天给大家分享的开源项目是【LLaMA】,一个【轻量可微调且开源的大语言模型家族工具】,希望这篇文章能够对你有所帮助。
Funny_AI_LAB2 天前
人工智能·算法·语言模型·音视频
李飞飞联合杨立昆发表最新论文:超感知AI模型从视频中“看懂”并“预见”三维世界2025 年 11 月,由谢赛宁领导,杨立昆(Yann LeCun)、李飞飞(Li Fei-Fei)参与指导的团队的新论文“Cambrian-S: Towards Spatial Supersensing in Video”的起点。 论文地址: [Cambrian-S: Towards Spatial Supersensing in Video] 项目地址:https://github.com/cambrian-mllm/cambrian-s
DisonTangor2 天前
语言模型·自然语言处理·ai作画·开源
FIBO是首个基于长结构化描述训练、专为JSON设计的开源文本生成图像模型。多数文生图模型擅长想象——而非控制。FIBO专为专业工作流打造,非日常使用。通过长达1000+单词的结构化JSON标注训练,FIBO能精准可复现地控制光照、构图、色彩及相机参数。结构化标注促进原生解耦能力,支持针对性迭代优化而无需担心提示偏移。仅凭80亿参数,FIBO即实现高画质、强提示遵循与专业级控制——完全基于授权数据训练。
Ma0407132 天前
人工智能·语言模型·自然语言处理
【论文阅读15】-DiagLLM:基于大型语言模型的多模态推理,用于可解释的轴承故障诊断题目:DiagLLM: multimodal reasoning with large language model for explainable bearing fault diagnosis
啥都鼓捣的小yao2 天前
人工智能·语言模型·自然语言处理
一、什么是语言模型?各位读者好,欢迎收看我的新专栏大语言模型实战系列,本专栏主要讲述大模型实际操作部门内容,不会特别涉及底层概念,主要是了解和用,这次为第一节,什么是语言模型?
带电的小王2 天前
人工智能·语言模型·自然语言处理
【AI大模型技术】4.预训练语言模型(PLMs,Pre-trained Langue Models);5.Transformers Tutorial更多内容:XiaoJ的知识星球.几个PLMs:word2vec(第一个PLM),GPT,BERT,…PLMs具有强大可移植性。
Jonathan Star2 天前
语言模型·oracle·langchain
LangChain 是一个 **大语言模型(LLM)应用开发框架**LangChain 是一个 大语言模型(LLM)应用开发框架,核心目标是解决 LLM 与外部工具、数据、流程的“连接与协同”问题,让开发者快速构建复杂的 AI 应用(而非仅调用单轮 LLM API)。其核心价值是“模块化”和“可组合性”,将 LLM 应用的关键组件拆分为独立模块,再通过“链(Chain)”和“代理(Agent)”串联成端到端流程。
Allen200003 天前
人工智能·语言模型·自然语言处理
Hello-Agents task2 大语言模型基础参考链接:hello-agents/docs/chapter3 at main · datawhalechina/hello-agents
我怎么又饿了呀3 天前
人工智能·语言模型·自然语言处理
DataWhale-HelloAgents(第二部分:大语言模型基础)Hello-Agents 教程学习链接 github地址:https://github.com/datawhalechina/hello-agents cookbook版本:https://book.heterocat.com.cn/
汗流浃背了吧,老弟!3 天前
人工智能·语言模型
基于OpenAI与DashScope的AI知识面试模拟系统实现实现一个基于大语言模型的AI面试模拟程序,用户可通过命令行与AI面试官进行多轮对话,测试对AI相关知识的掌握程度。系统需支持问题生成、回答评价及连续对话能力。