多模态模型文本预处理方式

句子级别

句子级别的表征编码一整个句子到一个特征中。如果一个句子有多个短语,提取这些短语丢弃其他的单词。

缺点:这种方式会丢失句子中细粒度的信息。

单词级别

将句子中的类别提取出来,结合成一个句子。

缺点:会在类别之间建立不必要的联系,尤其多个类别以随机顺序排列。

子句级别

将句子中的类别提取出来,结合成一个句子,并使用注意力掩码遮蔽掉不相关类别的注意力。保持每个单词特征的细粒度意思。

相关推荐
维元码簿18 分钟前
Claude Code 深度拆解:工具系统——权限、沙盒与错误处理
ai·agent·claude code·ai coding
张忠琳21 分钟前
【vllm】(六)vLLM v1 Sample — 模块超深度分析之一
ai·架构·vllm
一只AI打工虾的自我修养24 分钟前
DeepSeek V4 Hybrid Attention Architecture 技术解析
人工智能·ai·开源·aigc
薛定谔的猫36926 分钟前
基于 MCP (Model Context Protocol) 的智能 Agent 开发指南
ai·llm·agent·mcp·software engineering
阿珊和她的猫35 分钟前
大模型在客服场景:落地路径 + 效果评估
ai·agent·llama·cli·mcp
阿泽的AI工具笔记1 小时前
OpenClaw 接入大模型 API 的完整配置流程(Windows 实测可用)
windows·ai
ofoxcoding1 小时前
OpenClaw 自动化交易机器人怎么配置?从零搭建 + 踩坑全记录(2026)
运维·ai·机器人·自动化
FIT2CLOUD飞致云10 小时前
支持Hermes Agent与MongoDB管理,1Panel v2.1.9版本发布
ai·开源·1panel
Agent产品评测局11 小时前
临床前同源性反应种属筛选:利用AI Agent加速筛选的实操方案 —— 2026企业级智能体选型与技术落地指南
人工智能·ai·chatgpt
Hanniel11 小时前
Claude CLI免费安装和配置
ai·claude