知识图谱(六)之数据处理

一处理步骤

1.1获取token

1.2token转标签

使用词表把原始数据转换为标签类型:

比如:

打标数据存在字典里面.

先判断遍历字典是不是打标数据,如果不是,标记为o

如果是打标数据:

比如:

右腹部:是身体部位,打标的结果是BODY.,然后判断是不是开头,是开头标记为B,不是开头标记为I.

1.2.1整体处理思路:
  • 现在我们有一个json文件,先把json文件加载为字典:

原始的json文件:

  • 然后使用中文作为key查询他的英文:
  • 得到英文后,使用遍历开始索引到结束索引的方式拼接B,I

遍历原始的数据,通过索引和标签的字典,将相应的位置打上标签(根据索引查字典,如果可以查到结果,那把value作为实体标签,如果查不到,则打上o标签)

1.2.2难点
  • 获取所有的数据
  • 获取原始数据对应的标注数据
相关推荐
apcipot_rain21 小时前
计科八股20260611——推荐系统协同过滤、信息安全、团队协作、知识图谱
人工智能·知识图谱
高洁011 天前
人人可用的智能体来了
python·深度学习·机器学习·数据挖掘·知识图谱
悦数图数据库1 天前
GraphRAG 企业落地实战 | 从知识图谱构建到智能问答全流程 悦数图数据库
知识图谱
GIS数据转换器1 天前
基于3D GIS的监控视频精准标定平台
人工智能·物联网·3d·音视频·无人机·知识图谱
奶油话梅糖2 天前
IMA 知识库体验(内有资源分享):把资料变成可以提问的 AI 知识助手
人工智能·ai·aigc·知识图谱·知识库·学习工具·ima
呆呆敲代码的小Y2 天前
CodeGraph 使用教程:专为代码库打造的知识图谱
人工智能·ai·llm·知识图谱·代码库·codegraph·代码知识库
高洁012 天前
知识图谱与推荐系统实战
深度学习·机器学习·transformer·virtualenv·知识图谱
夜郎king2 天前
SpringBoot 整合 Neo4j 实战:从零搭建经典小说知识图谱完整方案
spring boot·知识图谱·neo4j
dyxal2 天前
期货波动知识图谱:从零构建金融期货波动关系图谱(附代码实战)
人工智能·金融·知识图谱
羊羊小栈3 天前
基于知识图谱(Neo4j)和大语言模型(LLM)的图检索增强(GraphRAG)的数控车床主轴系统故障诊断智能问答系统
人工智能·语言模型·毕业设计·知识图谱·创业创新·neo4j·大作业