用python自动标注word试题选项注意事项

  1. 先把word内容全选,再右键以文本形式保存,防止有的题ABCD是文本,有的题ABCD选项是word编号;

  2. 如果ABCD选项有大量缺项,以A为一个循环切换答案输入:

在此之前,用查找补充齐A,保证每题都有A选项。查找时,可以100个为一组,再用2分法加速找到缺A项的题:

程序模板:

python 复制代码
from docx import Document
from docx.shared import RGBColor

# 读取 Word 文件
word_file_path = 'D:/实验室/小任务/标答案/仅保留文本.docx'  # 替换为你的 Word 文件路径
doc = Document(word_file_path)

# 给定的列表(例如:['a', 'b', 'd'])
highlight_str = ["ABCCBCCBABABBABABDABBBCBBBDCADADBCDBAADDDADCAABBBADBABBDACCBAAAACDCAADBCBCCBDBBDDCBACCBBBBBBBBBBBBBBCBCDBDBCBDDAADBBCCCCDCBABBABBCAABCAA"]
highlight_list = list(highlight_str[0])  # 将字符串转为字符列表

# 用于追踪"abcd"循环的计数器
abcd_count = 0
# 用于追踪 highlight_list 中当前的字母索引
highlight_index = -1

# 定义一个函数用于在字符后添加文本
def add_text(paragraph, highlight_list):
    global abcd_count
    global highlight_index
    # 遍历段落的所有 runs
    runs = paragraph.runs

    for run in runs:
        # 遍历当前 run 中的每个字符
        for i, char in enumerate(run.text):
            if char in 'ABCD':  # 只处理字母 A, B, C, D
                if char == 'A':
                    abcd_count = 0
                    highlight_index = highlight_index + 1

                # 如果当前字符是需要标记的字母
                if char == highlight_list[highlight_index]:
                    # 在字符后追加 "[正确答案]",并设置为红色
                    run.text = run.text[:i + 1] + '【正确答案】'  # 在字符后追加文本
                    # run.font.color.rgb = RGBColor(255, 0, 0)  # 设置文本为红色

                    # 打印调试信息
                    print(f"Added '[正确答案]' after char: {char} at index {highlight_index}")

                # 每次遇到一个字母,我们更新计数器和列表索引
                abcd_count += 1


# 遍历文档中的段落并处理
for para in doc.paragraphs:
    add_text(para, highlight_list)

# 保存更新后的 Word 文件
highlighted_file_path = 'D:/实验室/小任务/标答案/标记测试.docx'
doc.save(highlighted_file_path)

print(f"文档已保存,路径为:{highlighted_file_path}")

答案放这就好:

感悟:

word自动化处理编程本身不难,难在word格式不规则的话,就得找到规则的部分加以利用,必要时得对word进行些预处理。

不然的话,就得提升程序的鲁棒性,能识别处理同一个东西的不同形式,如大小写、字体样式等等。

相关推荐
图灵学术计算机论文辅导17 分钟前
傅里叶变换+attention机制,深耕深度学习领域
人工智能·python·深度学习·计算机网络·考研·机器学习·计算机视觉
ruleslol1 小时前
python30-正则表达式
python·正则表达式
vincent_hahaha1 小时前
关于simplifyweibo_4_moods数据集的分类问题
python
qq_526099132 小时前
工控机的用途与介绍:工业自动化的重要引擎
嵌入式硬件·自动化·电脑
三年呀2 小时前
**标题:发散创新之力,探索隐私计算的未来**隐私计算,作为当下数字化时代的热门话题,正受
python
R-G-B3 小时前
OpenCV Python——报错AttributeError: module ‘cv2‘ has no attribute ‘bgsegm‘,解决办法
人工智能·python·opencv·opencv python·attributeerror·module ‘cv2‘·no attribute
DavieLau3 小时前
C#项目WCF接口暴露调用及SOAP接口请求测试(Python版)
xml·服务器·开发语言·python·c#
白露与泡影4 小时前
Spring容器初始化源码解析
java·python·spring
码界筑梦坊4 小时前
98-基于Python的网上厨房美食推荐系统
开发语言·python·美食
计算机源码社4 小时前
分享一个基于Hadoop的二手房销售签约数据分析与可视化系统,基于Python可视化的二手房销售数据分析平台
大数据·hadoop·python·数据分析·毕业设计项目·毕业设计源码·计算机毕设选题