多模态模型文本预处理方式

句子级别

句子级别的表征编码一整个句子到一个特征中。如果一个句子有多个短语,提取这些短语丢弃其他的单词。

缺点:这种方式会丢失句子中细粒度的信息。

单词级别

将句子中的类别提取出来,结合成一个句子。

缺点:会在类别之间建立不必要的联系,尤其多个类别以随机顺序排列。

子句级别

将句子中的类别提取出来,结合成一个句子,并使用注意力掩码遮蔽掉不相关类别的注意力。保持每个单词特征的细粒度意思。

相关推荐
崔lc3 小时前
Springboot项目集成Ai模型(阿里云百炼-DeepSeek)
java·spring boot·后端·ai
井云智能AI矩阵系统6 小时前
井云科技|智能体变现新路径:从开发到盈利的关键跨越
ai·智能体·coze·智能体变现·智能体接入小程序·智能体网站·智能体小程序
仙人掌_lz7 小时前
如何打造一款金融推理工具Financial Reasoning Workflow:WebUI+Ollama+Fin-R1+MCP/RAG
人工智能·搜索引擎·ai·金融·llm·rag·mcp
小白跃升坊1 天前
通过 MCP 服务对接 PostgreSQL 问数 (详细实操说明)
ai·linux操作系统·mcp
幼稚园的山代王1 天前
Prompt Enginering(提示工程)先进技术
java·人工智能·ai·chatgpt·langchain·prompt
wang_yb1 天前
概率图模型:机器学习的结构化概率之道
ai·databook
程序员鱼皮1 天前
我做了个 AI 高考分数预测器,这次终于能上清华了!
计算机·ai·互联网
vlln1 天前
2025年与2030年AI及AI智能体 (Agent) 市场份额分析报告
人工智能·深度学习·神经网络·ai
huan_19931 天前
Spring AI中使用ChatMemory实现会话记忆功能
ai·spring ai·模型记忆·springai开发·chatmemory
远方16092 天前
14-Oracle 23ai Vector Search 向量索引和混合索引-实操
数据库·ai·oracle