AI办公自动化:用kimi批量把word转换成txt文本

在Kimichat中输入提示词:

你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下:

打开文件夹:F:\aword

读取里面docx格式的word文档,

提取word文档中的第一行文字作为txt文本文档的标题名,

将word文档转换为txt文档;

重命名txt文档;

注意:每一步相关信息都要输出到屏幕;

在 Windows 系统中,默认的文件编码是 GBK,它不支持某些特殊的 Unicode 字符,为了解决这个问题,可以在打开文件进行写入操作时,指定使用 utf-8 编码

kimichat生成Python源代码:

import os

from docx import Document

定义文件夹路径

folder_path = 'F:\\aword'

确保文件夹存在

if not os.path.exists(folder_path):

print(f"文件夹 {folder_path} 不存在。")

else:

列出文件夹中所有的docx文件

docx_files = f for f in os.listdir(folder_path) if f.endswith('.docx')

检查是否有docx文件

if not docx_files:

print("没有找到docx格式的Word文档。")

else:

for docx_file in docx_files:

构建完整的文件路径

docx_file_path = os.path.join(folder_path, docx_file)

读取Word文档

doc = Document(docx_file_path)

try:

提取第一行文字作为标题

title = doc.paragraphs0.text.strip()

print(f"提取的标题为: {title}")

构建txt文件的完整路径

txt_file_path = os.path.join(folder_path, f"{title}.txt")

将Word文档转换为txt

with open(txt_file_path, 'w', encoding='utf-8') as txt_file:

for para in doc.paragraphs:

txt_file.write(para.text + '\n')

print(f"文档 {docx_file} 已转换为txt格式。")

except IndexError:

print(f"文档 {docx_file} 中没有文本。")

except Exception as e:

print(f"处理文档 {docx_file} 时发生错误: {e}")

在vscode中运行源代码,成功。

相关推荐
pp起床2 分钟前
黑马点评 - 短信验证码登录实现
java·开发语言·tomcat
芒鸽2 分钟前
在仓颉语言里造一个没有反射的服务端框架
开发语言·华为·harmonyos
CodeStats12 分钟前
《源纹天书》第121-125章:源匠归来——全栈重构与归元圣域的2.0时代
java·开发语言·源纹天书
binbin_5213 分钟前
UIAbility 与 WindowStage:窗口创建、加载、销毁的完整链路
开发语言·javascript·深度学习·华为·harmonyos
AI人工智能+电脑小能手13 分钟前
【大白话说Java面试题 第154题】【06_Spring篇】第14题:Spring 支持的 Bean 作用域
java·开发语言·spring·面试
枳实-叶18 分钟前
【Linux驱动开发】第23天:spi_driver 的 probe / remove 函数实现规范
linux·驱动开发·c#
旖-旎31 分钟前
QT界面优化(6)
开发语言·c++·qt
AI科技星31 分钟前
基于超复数广义分形流形的电磁耦合与缪子反常磁矩几何理论
开发语言·平面·重构·概率论·量子计算·乖乖数学·全域数学
组合缺一36 分钟前
用 ChatModel 构建 LLM 驱动的 Java 应用
java·开发语言·ai·llm·solon·rag
长明37 分钟前
C#项目组织与概念梳理
后端·c#