论文格式txt转为json

1 <>样式抽取并to excel

对于以下这种文献类型

python 复制代码

<REC>
<篇名>=博物馆阐释中几个基本问题辨析
<作者>=周婧景;李无言;
<机构>=复旦大学文物与博物馆学系;上海科技馆科学传播中心;
<中文关键词>=博物馆阐释;;诠释学;;探究型阐释;;阐释功能;;阐释要素
<中文摘要>=阐释学的要旨是鼓励人们在理解的基础上创建个人意义，因此，它将成为推动中国博物馆由"藏品导向"向"观众导向"转型的核心议题。阐释学从文化、自然遗产领域被引介至博物馆领域并开枝展叶，但围绕该议题一直存在由直觉和经验所导致的认知模糊甚至误区。类型上，博物馆的阐释属于探索型阐释，不可将其任意发展为独断型阐释；功能上，有效的阐释将有助于理解博物馆信息、增强差异化体验、改善后续行为；要素上，在借鉴阐释学模型等代表性成果的基础上，提出博物馆阐释的成功离不开六大要素，即主题性、舒适度、组织性、相关性、趣味性和评估性。
<英文篇名>=On Museum Interpretation in Definition,Essence,Effects and Elements
<英文作者>=Zhou Jingjing
;Li Wuyan;
<英文摘要>=Hermeneutics as a subject of understanding and interpretation aims to inspire people to role-play positively on the understanding basis,so which plays significantly in the transition of Chinese museums to develop from 'collection-oriented' to 'audience-oriented'.In spite of some cognition confusion and misunderstanding over the topics concerned from individual intuition and experience in practice,Hermeneutics is being applied to the fields of museuology as it has been to the studies of cultural and natural heritages.Museum interpretation is explorative rather than dogmatic in essence.Effective museum interpretation makes better sense of the content of exhibition so as to cultivate unusual experience useful to improve the follow-up.It is summed up by the typical cases achieved by hermeneutic model that any ideal museum interpretation depends on the six factors covering theme,comfort level,organization,correlation,amusement and assessment.
<英文关键词>=museum interpretation;;Hermeneutics;;explorative interpretation;;role of interpretation;;factors of interpretation
<引文>=<1>李无言为本文通讯作者,电子邮箱:kid0206@163.com。
<2>[美]海伦·凯勒著,王珊、陈珩译《假如给我三天光明》,上海译文出版社,2019年,第160-163页。
<3>李德庚《流动的博物馆》,文化艺术出版社,2021年,第15页。
<1>苏东海《博物馆物论》,《中国博物馆》2005年第1期,第4页。
<2>Sam H.Ham,Interpretation:Making a Difference on Purpose,Fulcrum Publishing,2013,p.13.
<3>张浩军《Interpretation:对"诠释"的诠释》,《现代哲学》2016年第3期,第83页。
<4>前揭张浩军《Interpretation:对"诠释"的诠释》,第83页。
<1>冯寿农编《法国文学批评史》,上海外语教育出版社,2019年,第19-20页。
<2>[美]米歇尔·刘易斯·伯克、[美]艾伦·布里曼、[美]廖福挺主编,沈崇麟、赵锋、高勇主译《社会科学研究方法百科全书·第2卷》,重庆大学出版社,2017年,第554页。
<3>[德]海德格尔著,陈嘉映、王庆节译《存在与时间》,商务印书馆,2015年,第48页。
<4>前揭[德]海德格尔《存在与时间》,第48页。
<5>Herausgegeben von Joachim Ritter,Historisches W?rterbuch der Philosophie,Band 3,Darmstadt:Wissenschaftliche Buchgesellschaft,1974,S.1061.
<6>Richard E.Palmer,Hermeneutics,Northwestern University Press,1969,pp.33-45.
<7>周婧景、严建强《阐释系统:一种强化博物馆展览传播效应的新探索》,《东南文化》2016年第2期,第120页。
<1>Herausgegeben von Joachim Ritter&Karlfried Gründer,Historisches Worterbuch der Philosophie,Band 4,Darmstadt:Wissenschaftliche Buchgesellschaft,1976,S.514.
<2>Herausgegeben von Joachim Ritter&Karlfried Gründer,ibid.,S.515.
<3>Herausgegeben von Joachim Ritter&Karlfried Gründer,ibid.,S.515.
<4>前揭张浩军《Interpretation:对"诠释"的诠释》,第85页。
<5>[德]汉斯-格奥尔格·伽达默尔著,洪汉鼎译《诠释学2:真理与方法:补充和索引(修订译本)》,商务印书馆,2017年,第IV页。
<6>洪汉鼎编著《<真理与方法>解读》,商务印书馆,2018年,第284页。
<7>前揭洪汉鼎编著《<真理与方法>解读》,第285页。
<1>[美]史蒂芬·威尔著,张誉腾译《博物馆重要的事》,台北:台北五观艺术管理有限公司,2015年,第53页。
<2>经济合作与发展组织编、周加仙等译《理解脑------新的学习科学的诞生(第2版)》,教育科学出版社,2020年,第28页。
<3>Trautmann,C,"Nice to Necessary:The Path to Significance and Support for Science Centers,"in The Informal Learning Review,2011(111),p.1.
<4>前揭[美]史蒂芬·威尔著,张誉腾译《博物馆重要的事》,第89页。
<5>前揭[美]史蒂芬·威尔著,张誉腾译《博物馆重要的事》,第88页。
<1>Sam H.Ham,ibid.p.193-237;Freeman Tilden,R.Bruce Craig(ed.),In terpreting Our Heritage,The University of North Carolina Press,2007,p35-51.
<2>前揭[美]史蒂芬·威尔著,张誉腾译《博物馆重要的事》,第45页。
<3>Sam H.Ham,ibid.,p.10.
<4>Sam H.Ham,ibid.,p.73.
<5>Sam H.Ham,ibid.,p.194.
<6>Marcella Wells,Barbara Butler,&Judith Koke,Interpretive Planning for Museums:Integrating Visitor Perspectives in Decision Makzing,Left Coast Press,2013,p.16.
<1>[美]塔妮亚·露娜、[美]莉安娜·伦宁格著,汪建军译《惊讶心理学:拥抱不可预测性并策划让人意想不到的事》,中国青年出版社,2015年,第261-262页。
<2>前揭[美]塔妮亚·露娜、[美]莉安娜·伦宁格著,汪建军译《惊讶心理学:拥抱不可预测性并策划让人意想不到的事》,第178页。
<3>Freeman Tilden,R.Bruce Craig(ed.),ibid.,p.71.
<4>Sam H.Ham,ibid.,pp.200-209.
<5>Stern,M.,Powell,R.,Martin,E.,&McLean,K.,Identifying best practices for live interpretive programs in the United States National Park Service,Virginia Tech University,2012,p.38.
<1>Sam H.Ham,ibid.,pp.84-144.
<2>周婧景《"阐释性展览":试论当代展览阐释的若干问题》,《东南文化》2019年第6期,第95-103页。
<3>方欣《建立中国博物馆展览民间评价体系探索》,《中国博物馆》2012年第1期,第84-91页。
<4>[美]美国博物馆协会编著,湖南省博物馆译《美国博物馆国家标准及最佳做法:汉英对照》,外文出版社,2010年,第57-58页。
<5>Sam H.Ham,ibid.,p.89.
<6>Sam H.Ham,ibid.,pp.100-109.
<7>Scott G Eberle,"How a Museum Discovered the Transforming Power of Play",Journal of Museum Education,2008,33(3),pp.265-272.
<8>Stephen Bitgood,"Museum Fatigue:A new look at an old problem",The Informal Learning Review,2009(97),pp.18-22.
<1>Robinson,E.,The behavior of the museum visitor.New Series No.5,Washington DC:American Association of Museums,1928,pp.43-68.
<2>Sam H.Ham,ibid.,pp.105-106.
<3>[美]约翰·D·布兰思福特等编著,程可拉、孙亚玲、王旭卿译《人是如何学习的:大脑、心理、经验及学校(扩展版)》,华东师范大学出版社,2012年,第9页。
<4>Sam H.Ham,ibid.,2013,p.118.
<1>前揭[美]美国博物馆协会编著,湖南省博物馆译《美国博物馆国家标准及最佳做法:汉英对照》,第57页。
<2>Ross J Loomis,"Planning for the visitor:the challenge of visitor studies",in Sandra Bicknell,Graham Farmelo(eds.),Museum visitor studies in the 90s,London:Science Museum,1993,p.13.
<3>周婧景《"阐释与阐释规划":影响当代博物馆转型的议题》,《东南文化》2022年第5期,第143页。
<1>苏东海《博博物馆沉思------苏东论文选(卷三)》,文物出版社,2010年,第360页。
<1>前揭苏东海《博物馆沉思------苏东海论文选(卷三)》,第390页。
<2>沈辰《众妙之门:六谈当代博物馆》,文物出版社,2019年,第88页。
<3>陈淳《考古研究的经验主义与理性主义》,《南方文物》2010年第1期,第18页。
<基金>=国家社会科学基金专项一般项目"博物馆基于实物的体验式学习对少年儿童精神素养的培养及加强研究"（项目编号：22VSZ109）;;
上海市哲学社会科学规划课题"博物馆基于实物的学习对日常学习模式的启发及构建研究"（项目编号：2021BTQ002）的部分成果之一
<光盘号>=HIST2312
<文献号>=0
<中文刊名>=故宫博物院院刊
<英文刊名>=Palace Museum Journal
<拼音刊名>=GGBW
<年>=2023
<期>=11
<CN>=11-1202/G2
<ISSN>=0452-7402
<文件名>=GGBW202311008
<页>=115-126+151
<分类号>=G260
<专题代码>=I144;
<子栏目代码>=2;
<专辑代码>=F;I;
<更新日期>=2023-11-21 13:01
<制作日期>=2023-12-07
<专题子栏目代码>=I144_2;
<第一责任人>=周婧景;
<核心期刊>=Y
<中英文篇名>=博物馆阐释中几个基本问题辨析
<复合关键词>=博物馆阐释;;诠释学;;探究型阐释;;阐释功能;;阐释要素
<中英文摘要>=阐释学的要旨是鼓励人们在理解的基础上创建个人意义，因此，它将成为推动中国博物馆由"藏品导向"向"观众导向"转型的核心议题。阐释学从文化、自然遗产领域被引介至博物馆领域并开枝展叶，但围绕该议题一直存在由直觉和经验所导致的认知模糊甚至误区。类型上，博物馆的阐释属于探索型阐释，不可将其任意发展为独断型阐释；功能上，有效的阐释将有助于理解博物馆信息、增强差异化体验、改善后续行为；要素上，在借鉴阐释学模型等代表性成果的基础上，提出博物馆阐释的成功离不开六大要素，即主题性、舒适度、组织性、相关性、趣味性和评估性。
<主题>=阐释学:3.6*13.7704;解释学:3.6*13.7704;阐释功能:1.8*9.0139;博物馆阐释:1.2*5.23971;问题辨析:2*8.82703;篇长:296
<出版日期>=2023-11-20
<机标关键词>=阐释学,诠释学,探索型,博物馆信息,个人意义,中国博物馆,探究型,主题性,核心议题,开枝,
<SYS_VSM>=阐释学:9179,诠释学:2319,探索型:1777,博物馆信息:1439,个人意义:1415,中国博物馆:1067,探究型:928,主题性:690,核心议题:540,开枝:539,
<来源数据库>=期刊
<页数>=13
<文件大小>=1987K
<中英文作者>=周婧景;李无言;
<中英文刊名>=故宫博物院院刊
<DOI>=CNKI:SUN:GGBW.0.2023-11-008
<允许全文上网>=Y
<允许检索>=Y
<印刷页码>=114-125+150
<原文格式>=D
<下载频次>=601
<被引频次>=1
<FFD>=1.393920
<文献标识码>=21
<期刊标识码>=QS0101;
<来源标识码>=P01;P0209;P13;
<影响因子>=0.595
<专题整刊代码>=F097
<复合专题代码>=I144;F097;
<网络总库专辑代码>=I;F;
<语种>=中文;
<年期>=202311
<基金代码>=0002;2779;
<出版单位>=故宫博物院院刊
<作者代码>=25739918;48050645;
<机构代码>=0075855;0898248;
<表名>=CJFD2023
<TABLENAME>=CJFDLAST2023
<他引频次>=0
<是否基金文献>=Y
<机构作者代码>=0075855:25739918;0898248:48050645;
<卷期号>=No.259
<注册DOI>=10.16319/j.cnki.0452-7402.2023.11.003
<THNAME>=GGBW202311
<CSSCI期刊>=Y
<热度>=0
<省代码>=0009;
<出版物代码>=CJFD_GGBW
<行业分类代码>=12802470401
<SYS_NVSM>=阐释学:3.6*13.7704;解释学:3.6*13.7704;阐释功能:1.8*9.0139;博物馆阐释:1.2*5.23971;问题辨析:2*8.82703;篇长:296
<NVSM_分组>=阐释学;阐释功能;博物馆阐释;问题辨析;
<SMARTS>=博物馆阐释中几个基本问题辨析
<SMARTS_NVSM>=博物馆阐释中几个基本问题辨析
<第一作者H指数>=20
<CI指数>=121.838
<英文第一作者>=Zhou Jingjing
<第一机构>=复旦大学文物与博物馆学系;
<第一作者代码>=25739918;
<第一机构代码>=0075855;
<旧版主题>=博物馆阐释中几个基本问题辨析
<主要主题>=博物馆阐释;问题辨析;
<次要主题>=阐释学;阐释功能;
<机构作者名称>=复旦大学文物与博物馆学系_周婧景;;
上海科技馆科学传播中心_李无言;;
<人工标识码>=23
<五版分类号>=G260
<新作者代码>=000036935655;000002525763
<新机构作者代码>=0075855:000036935655;0898248:000002525763
<REC>
<篇名>=非物质文化遗产数字藏品的传播策略探究
<作者>=林雨甜;
<机构>=上海市外国语大学贤达经济人文学院;
<中文关键词>=非物质文化遗产;;数字化;;传播策略;;图形设计
<中文摘要>=本文主要讨论了非物质文化遗产数字化的现状和挑战，以及非物质文化遗产数字藏品的传播策略。首先概述了现有的非物质文化遗产数字化项目，接着讨论了数字化非物质文化遗产的主要挑战。此外，还探讨了图形设计在非物质文化遗产数字化中的现状和挑战。在非物质文化遗产数字藏品的传播策略部分，提出了传播策略的设定，通过一个关于中国皮影戏的实例，详细说明了如何制定传播策略，包括分析目标受众、设计传播内容、选择传播渠道等方面的具体操作。总之，这篇文章为非物质文化遗产数字化和传播提供了全面的分析和指导。
<引文>=[1]刘以敖.非物质文化遗产数字藏品的文化传播策略探究[J].新闻研究导刊,2022,13(22):221-223.
[2]丁小然.新媒体时代下非物质文化遗产传播策略探究[J].文化创新比较研究,2022,6(14):66-69.
[3]罗宇蕾.非物质文化遗产的传播特点及传播策略探究[J].时代报告：学术版,2019(02):211.
[4]何婷.新媒体时代下非物质文化遗产品牌化传播的策略探究[J].文化产业,2022(30):70-72.
[5]庞斯元.融媒体时代非物质文化遗产辽砚传播与发展的策略探究[J].传播力研究,2020,4(05):13-14.
<小标题>=一、非物质文化遗产数字化的现状和挑战
	（一）现有的非物质文化遗产数字化项目概述
	（二）数字化非物质文化遗产的主要挑战
	（三）图形设计在非物质文化遗产数字化中的现状和挑战
二、非物质文化遗产数字藏品的传播策略
	（一）传播策略的设定
		1. 目标受众的分析
		2. 传播内容的设计
		3. 传播渠道的选择
		4. 传播策略的实例
	（二）图形设计在传播策略中的应用
		1. 提高传播效果
		2. 传达文化信息
		3. 创造传播创新
三、结论
<光盘号>=HIST2312S1
<文献号>=0
<中文刊名>=新楚文化
<拼音刊名>=XCWH
<年>=2023
<期>=27
<CN>=42-1932/G1
<ISSN>=2097-2261
<文件名>=XCWH202327019
<页>=65-67
<分类号>=G206;G894
<专题代码>=H134;I141;I144;
<子栏目代码>=1;2;92;
<专辑代码>=F;H;I;
<更新日期>=2023-12-15 18:23
<制作日期>=2023-12-19
<专题子栏目代码>=H134_92;I141_1;I144_2;
<第一责任人>=林雨甜;
<中英文篇名>=非物质文化遗产数字藏品的传播策略探究
<复合关键词>=非物质文化遗产;;数字化;;传播策略;;图形设计
<中英文摘要>=本文主要讨论了非物质文化遗产数字化的现状和挑战，以及非物质文化遗产数字藏品的传播策略。首先概述了现有的非物质文化遗产数字化项目，接着讨论了数字化非物质文化遗产的主要挑战。此外，还探讨了图形设计在非物质文化遗产数字化中的现状和挑战。在非物质文化遗产数字藏品的传播策略部分，提出了传播策略的设定，通过一个关于中国皮影戏的实例，详细说明了如何制定传播策略，包括分析目标受众、设计传播内容、选择传播渠道等方面的具体操作。总之，这篇文章为非物质文化遗产数字化和传播提供了全面的分析和指导。
<主题>=非物质文化遗产:12.2*48.2528;传播策略:6.6*24.4711;图形设计:3*13.1071;策略探究:2*5.59662;篇长:281
<出版日期>=2023-09-28
<机标关键词>=传播策略,物质文化遗产,传播渠道,受众,皮影戏,图形,实例,
<SYS_VSM>=传播策略:7651,物质文化遗产:6428,传播渠道:320,受众:121,皮影戏:22,图形:11,实例:1,
<来源数据库>=期刊
<页数>=3
<文件大小>=1263K
<中英文作者>=林雨甜;
<中英文刊名>=新楚文化
<DOI>=CNKI:SUN:XCWH.0.2023-27-019
<文章属性>=A;;2097-2261(2023)27-0063-03
<允许全文上网>=Y
<允许检索>=Y
<印刷页码>=63-65
<原文格式>=D
<下载频次>=175
<被引频次>=1
<FFD>=1.322788
<文献标识码>=21
<期刊标识码>=QS0104
<影响因子>=0
<专题整刊代码>=F090
<复合专题代码>=H134;I141;I144;F090;
<网络总库专辑代码>=H;I;F;
<语种>=中文;
<年期>=202327
<期刊栏目层次>=文化新融通
<出版单位>=新楚文化
<作者代码>=59350673;
<机构代码>=1749764;
<表名>=CJFD2023
<TABLENAME>=CJFDLAST2023
<他引频次>=0
<机构作者代码>=1749764:59350673;
<卷期号>=No.039
<THNAME>=XCWH202327
<热度>=0
<出版物代码>=CJFD_XCWH
<行业分类代码>=12802310201
<FILETYPE>=XML;EPUB;
<SYS_NVSM>=非物质文化遗产:12.2*48.2528;传播策略:6.6*24.4711;图形设计:3*13.1071;策略探究:2*5.59662;篇长:281
<NVSM_分组>=非物质文化遗产;传播策略;图形设计;策略探究;
<SMARTS>=非物质文化遗产数字藏品的传播策略探究
<SMARTS_NVSM>=非物质文化遗产数字藏品的传播策略探究
<第一作者H指数>=1
<CI指数>=0
<第一机构>=上海市外国语大学贤达经济人文学院;
<第一作者代码>=59350673;
<第一机构代码>=1749764;
<旧版主题>=非物质文化遗产数字藏品的传播策略探究
<主要主题>=非物质文化遗产;传播策略;策略探究;
<次要主题>=图形设计;
<机构作者名称>=上海市外国语大学贤达经济人文学院_林雨甜;;
<五版分类号>=G206;G262
<新作者代码>=000059390961
<新机构作者代码>=1749764:000059390961

方法1：直接re匹配

有一些内容没有被抽取出来

python 复制代码

parsed_records = []
with open("CPFDFD.txt",'r',encoding='GB18030') as f:
    text = f.read()
    for record in text.split('<REC>'):
        fields = re.findall(r"\n<(.*?)>=(.*?)(?=(<.*?>=|$))", record, re.S)
        #.*? 是非贪婪模式，匹配尽量短的内容。
        #这是一个正向前瞻断言，表示字段值的结尾必须是：另一个字段的开头（如 <论文作者>=）。或到达字符串的末尾 $。
        parsed_records.append({field[0]: field[1].strip() for field in fields})

# 转换为 DataFrame
df = pd.DataFrame(parsed_records)

方法二：纯粹切割的方法，切割不到就粘贴连接

python 复制代码

parsed_records = []
with open("CJFDFD.txt",'r',encoding='GB18030',errors='ignore') as f:
    text = f.read()
    for record in list(filter(bool,text.split('<REC>'))):
        # 使用filter函数去除空字符串
        #
        line = re.split('\n<',record)
        
        
        # 修复非法切割段
        current_segment = ""
        line_right = []
        for chunk in reversed(line):#返回一个反向的迭代器，而不修改原始列表。 合并错误，不能这么写
            current_segment +=  chunk
            if ">=" in current_segment:
                line_right.append(current_segment)
                current_segment = ''  # 开始新段
            else:
                current_segment += "\n<" + chunk  # 拼接到上一段
        
        
        #print(line_right)
        line = list(filter(bool, line_right))
        parsed_records.append({})
        for i in line:
            lines = i.split('>=',1)
            # 去除开头的《符号
            if lines[0].strip().startswith('<'):
                lines[0] = lines[0].strip().lstrip('<')
                
            try:
                #parsed_records[-1].append([lines[0],lines[1]])
                parsed_records[-1][lines[0]]=lines[1]
            except:
                print(lines)
    

# 转换为 DataFrame
df = pd.DataFrame(parsed_records)

# 导出为 Excel 文件
output_file = "CJFDFD.xlsx"
df.to_excel(output_file, index=False)
print(f"Data has been saved to {output_file}")

方法3：成功！！！是匹配+切割的方法

python 复制代码

parsed_records = []
with open("CPFDFD.txt",'r',encoding='GB18030',errors='ignore') as f:
    text = f.read()
    for record in list(filter(bool,text.split('<REC>'))):
        # 使用filter函数去除空字符串
        index = re.findall('\n<.*?>=',record)
        value = re.split('\n<.*?>=',record)
        if value[0]=='':
            value=value[1:]
            
        # 确保每个匹配的标题和值一一对应
        record_data = {}
        for i in range(len(index)):
            # 取出标题名称（去除前面的 '\n< 和 >= 符号）
            title = index[i].strip().replace('<','').replace('>=','')
            record_data[title] = value[i].strip() 
        
        # 将记录添加到 parsed_records 列表
        parsed_records.append(record_data)

# 使用 pandas 创建 DataFrame
df = pd.DataFrame(parsed_records)

df

导出：不能直接to_excel，因为有bug

python 复制代码

import xlsxwriter
# 创建一个 Excel writer 对象
workbook = xlsxwriter.Workbook(r"CPFDFD.xlsx")
worksheet = workbook.add_worksheet()
# 写入列名到 Excel 文件
for col_num, value in enumerate(df.columns):
    worksheet.write(0, col_num, value)

# 写入 DataFrame 中的数据到 Excel 文件
for row_num, row_data in df.fillna('').iterrows():
    for col_num, value in enumerate(row_data):
        # 因为第一行被用于列名，所以+1从第二行写
        worksheet.write(row_num + 1, col_num, value)  

# 保存并关闭 Excel 文件
workbook.close()