本文主要介绍Python操作Word docx的常用方法,非常详细,有一定的参考价值。感兴趣的朋友一定要看!
安装
Docx是非标准库,可以在命令行(终端)使用pip安装。
Pipinstallpython-docx一定要注意,安装的时候是python-docx,但实际调用的时候是docx!
前置知识
单词一般可以分为三个部分:
文件
段落段落
文本块运行
也就是Document - Paragraph - Run,最常见的三层架构。block Run这个词最难理解,无法完成。如图,两个符号之间的短句就是一个字块。
这通常是可以理解的,但是如果这个短句子中有多种不同的 样式,则会被划分成多个文字块以图片中的第一个黄色圆圈为例,如果你给这个短句添加一些细节。
此时就有4个文字块,同时,有时在一个Word文档中有一个表,然后就会产生一个新的文档结构。
此时的结构与Excel非常相似,可以看作是文档-表格-行/列-单元格四级结构。
Word读取
1.打开Word。
Mdocximportdocumentpath=.wordfile=文档(路径)2。获取段落。
word文件由一个或多个段落组成。
段落=wordfile。第3段。获取段落的文本内容。
获取文本。文字。
第:段打印(段落.文本)4。获取文本块的文本内容。
段落由一个或多个连续文本块组成。
ForparagraphinFordfile。段落:用于段落。runs:打印(运行。正文)5。遍历表格。
上面的操作完成了经典三级结构的遍历,遍历的表非常相似。
# traverse for bleinword file . tables : for row intable . row : force linrow . cells 3360 print(cell . text)# traverse for bleinword file . tables : by column。
for column in table.columns: for cell in column.cells: print(cell.text)
写入Word
1. 创建Word
只要不指定路径,就默认为创建新Word文件
from docx import Document wordfile = Document()
2. 保存文件
对文档的修改和创建都切记保存
wordfile.save(...) ... 放需要保存的路径
3. 添加标题
wordfile.add_heading(…, level=…)
4. 添加段落
wordfile.add_paragraph(...)
wordfile = Document() wordfile.add_heading('一级标题', level=1) wordfile.add_paragraph('新的段落')
5. 添加文字块
wordfile.add_run(...)
6. 添加分页
wordfile.add_page_break(...)
7. 添加图片
wordfile.add_picture(..., width=…, height=…)
设置样式
1. 文字字体设置
2.文字其他样式设置
from docx import Document from docx.shared import RGBColor, Pt wordfile = Document(file)for paragraph in wordfile.paragraphs: for run in paragraph.runs: run.font.bold = True # 加粗 run.font.italic = True # 斜体 run.font.underline = True # 下划线 run.font.strike = True # 删除线 run.font.shadow = True # 阴影 run.font.size = Pt(20) # 字号 run.font.color.rgb = RGBColor(255, 0, 0) # 字体颜色
3. 段落样式设置
默认对齐方式是左对齐,可以自行修改
以上是“Python操作Word文档docx的常用方法有哪些”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注行业资讯频道!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/57894.html