中图分类法的正则表达式参考

文章目录

  • [1. 中图分类法](#1. 中图分类法)
  • [2. 正则表达式](#2. 正则表达式)
  • [3. 使用方法](#3. 使用方法)
  • [4. 参考](#4. 参考)

1. 中图分类法

中图分类法,全称为《中国图书馆图书分类法》,简称《中图法》,是中国国内普遍采用的一种图书分类体系,用于组织和管理图书馆藏书,方便读者查找和借阅图书资料。它是一种按照学科性质和内容,结合图书资料本身的特点,将图书划分为多个类别,并使用汉语拼音字母与阿拉伯数字相结合的混合制号码进行标识的方法。

《中图法》最初起源于20世纪50年代,历经多次修订和完善,形成了较为成熟的分类体系。其基本结构包括五大部类:马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书,并在此基础上进一步细分为22个基本大类。每个大类下面还有更加详细的二级、三级甚至更多级别的子类目。

分类法的目的是使同类图书集中在一起,便于图书管理和读者查找,同时也能体现学科之间的逻辑关系和知识体系的构建。随着图书情报学的发展和信息技术的应用,《中图法》也在不断修订更新以适应新的学术研究和信息服务需求。

一级类列表:

  1. A: 马克思主义、列宁主义、毛泽东思想、邓小平理论
  2. B: 哲学、宗教
  3. C: 社会科学总论
  4. D: 政治、法律
  5. E: 军事
  6. F: 经济
  7. G: 文化、科学、教育、体育
  8. H: 语言、文字
  9. I: 文学
  10. J: 艺术
  11. K: 历史、地理
  12. N: 自然科学总论
  13. O: 数理科学和化学
  14. P: 天文学、地球科学
  15. Q: 生物科学
  16. R: 医药、卫生
  17. S: 农业科学
  18. T: 工业技术
  19. U: 交通运输
  20. V: 航空、航天
  21. X: 环境科学、安全科学
  22. Z: 综合性图书

中图分类法作为一种图书分类法,旨在将图书馆藏书和其他资料按照主题或内容分类,以便更好地组织和检索图书馆的馆藏。更详细的中图分类号查询参考这里

2. 正则表达式

目前对于中图分类号的正则表达式网上并没有找到可用的版本,我结合了中图分类号的一些通用规则写了一版正则表达式:

python 复制代码
patten = "((?:[A-KN-SU-VXZ][-/]?[0-9]{2,3}(?:.[0-9]{1,3})?)|(?:(?:T-0[19])|(?:T-1[89])|(?:T-29)|(?:T-6[235])|(?:T-9)|(?:T[B-V][-/]?[0-9]{1,3})))"

说明:这个表达式可以找出大部分的中图分类号,但是有误匹配的概率,对于大部分场景应该足够使用了!

3. 使用方法

以 Python 为例:

python 复制代码
text = "CAEBN:1-001-00-905700-0分类号: I247.5 A849.13"
patten = "((?:[A-KN-SU-VXZ][-/]?[0-9]{2,3}(?:.[0-9]{1,3})?)|(?:(?:T-0[19])|(?:T-1[89])|(?:T-29)|(?:T-6[235])|(?:T-9)|(?:T[B-V][-/]?[0-9]{1,3})))"
code_list = re.findall(patten, text)
print(code_list)

输出:

bash 复制代码
['I247.5', 'A849.13']

4. 参考

http://www.ztflh.com/

相关推荐
人工智能训练3 小时前
【极速部署】Ubuntu24.04+CUDA13.0 玩转 VLLM 0.15.0:预编译 Wheel 包 GPU 版安装全攻略
运维·前端·人工智能·python·ai编程·cuda·vllm
yaoming1683 小时前
python性能优化方案研究
python·性能优化
码云数智-大飞4 小时前
使用 Python 高效提取 PDF 中的表格数据并导出为 TXT 或 Excel
python
biuyyyxxx6 小时前
Python自动化办公学习笔记(一) 工具安装&教程
笔记·python·学习·自动化
极客数模6 小时前
【2026美赛赛题初步翻译F题】2026_ICM_Problem_F
大数据·c语言·python·数学建模·matlab
小鸡吃米…7 小时前
机器学习中的代价函数
人工智能·python·机器学习
Li emily8 小时前
如何通过外汇API平台快速实现实时数据接入?
开发语言·python·api·fastapi·美股
m0_561359678 小时前
掌握Python魔法方法(Magic Methods)
jvm·数据库·python
Ulyanov9 小时前
顶层设计——单脉冲雷达仿真器的灵魂蓝图
python·算法·pyside·仿真系统·单脉冲
2401_838472519 小时前
使用Python进行图像识别:CNN卷积神经网络实战
jvm·数据库·python