# 导入库,pip install python-docx
from docx import Document
# 创建word
my_word = Document()
# 保存word
my_word.save('MyWord.docx')
# 导入库,pip install python-docx
from docx import Document
# 打开word
my_word = Document('MyWord.docx')
# 导入库
from docx import Document
# 创建word
word = Document()
# 输出段落数
print(len(word.paragraphs)) # 输出0
# 添加段落
p1 = word.add_paragraph('Richie')
# 输出段落数
print(len(word.paragraphs)) # 输出1
# 输出段落内容
print(p1.text) # 输出Richie
# 修改段落内容
p1.text = 'Taylor Swift'
# 输出段落内容
print(p1.text) # 输出Taylor
# 保存word
word.save('MyWord.docx')
word中内容如下:
# 导入库
from docx import Document
# 打开word
word = Document('MyWord.docx')
# 添加段落
p = word.add_paragraph('Richie')
print(p.text) # 输出Richie
# 删除段落内容 1.赋值空字符串
p.text = ''
print(p.text) # 输出空字符串
p.text = 'Richie'
print(p.text) # 输出Richie
# 删除段落内容 2.clear()方法
p.clear()
print(p.text) # 输出空字符串
# 导入库
from docx import Document
# 创建word
word = Document()
# 添加段落
p1 = word.add_paragraph('这是段落一')
p2 = word.add_paragraph('这是段落二')
p3 = word.add_paragraph('这是段落三')
print(len(word.paragraphs)) # 输出3
# 插入段落
p2.insert_paragraph_before('这是插入进来的段落,在段落二之前')
print(len(word.paragraphs)) # 输出4
# 保存word
word.save('MyWord.docx')
word内容如下:
# 导入库
from docx import Document
# 创建word
word = Document()
# 添加段落
p1 = word.add_paragraph('这是段落一')
# 插入分页符,分页符也算一个段落
word.add_page_break()
p2 = word.add_paragraph('这是段落二')
p3 = word.add_paragraph('这是段落三')
print(len(word.paragraphs)) # 输出4
# 插入段落
p2.insert_paragraph_before('这是插入进来的段落,在段落二之前')
print(len(word.paragraphs)) # 输出5
# 保存word
word.save('MyWord.docx')
word内容如下:
# 导入库
from docx import Document
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
# 创建word
word = Document()
# 添加段落
p1 = word.add_paragraph('左对齐')
p2 = word.add_paragraph('居中对齐')
p3 = word.add_paragraph('右对齐')
p4 = word.add_paragraph('两端对齐')
p5 = word.add_paragraph('分散对齐')
# 设置对齐方式
p1.alignment = WD_PARAGRAPH_ALIGNMENT.LEFT
p2.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
p3.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
p4.alignment = WD_PARAGRAPH_ALIGNMENT.JUSTIFY
p5.alignment = WD_PARAGRAPH_ALIGNMENT.DISTRIBUTE
# 保存word
word.save('MyWord.docx')
效果如下:
因为是枚举,所以从源码中可知,可以简化写法:
查看有哪些自带样式:
# 导入库
from docx import Document
from docx.enum.style import WD_STYLE_TYPE
# 创建word
word = Document()
# 查看段落自带样式有哪些
styles = word.styles
paragraph_styles = [style for style in styles if style.type == WD_STYLE_TYPE.PARAGRAPH]
for style in paragraph_styles:
print(style.name)
-------------------------------------
Normal # 正文
Header
Footer
Heading 1 # 标题一
Heading 2 # 标题二
Heading 3
Heading 4
Heading 5
Heading 6
Heading 7
Heading 8
......还有很多不予展示了
使用这些样式:
# 导入库
from docx import Document
# 创建word
word = Document()
# 添加段落
p1 = word.add_paragraph('段落一', style='Normal')
p2 = word.add_paragraph('段落二', style='Header')
p3 = word.add_paragraph('段落三', style='Heading 1')
p4 = word.add_paragraph('段落四', style='Heading 2')
p5 = word.add_paragraph('段落五', style='Heading 3')
# 保存word
word.save('MyWord.docx')
效果如下:
# 导入库
from docx import Document
from docx.shared import Pt
# 创建word
word = Document()
# 添加段落
p1 = word.add_paragraph('床前明月光,疑是地上霜。举头望明月,低头思故乡。床前明月光,疑是地上霜。举头望明月,低头思故乡。床前明月光,疑是地上霜。举头望明月,低头思故乡。', style='Normal')
# 行间距
p1.paragraph_format.line_spacing = Pt(20)
# 首行缩进
p1.paragraph_format.first_line_indent = Pt(10)
# 用来对比的段落
p2 = word.add_paragraph('床前明月光,疑是地上霜。举头望明月,低头思故乡。床前明月光,疑是地上霜。举头望明月,低头思故乡。床前明月光,疑是地上霜。举头望明月,低头思故乡。', style='Normal')
# 保存word
word.save('MyWord.docx')
效果如下:
首先看一下此时word里的内容:
此时word里的这一段内容,被python-docx自动分为5个Run对象(因为它们样式不同):“大家”、“好,”、“我”、“是”、“Richie”
代码如下:
# 导入库
from docx import Document
# 创建word
word = Document('./MyWord.docx')
# 获取第一个段落的内容
p = word.paragraphs[0]
# 循环所有run对象
for run in p.runs:
print(run.text)
-------------------------------------
大家
好,
我
是
Richie
添加Run,代码如下:
# 导入库
from docx import Document
# 创建word
word = Document('./MyWord.docx')
# 获取第一个段落的内容
p = word.paragraphs[0]
# 循环所有Run
for run in p.runs:
print(run.text)
# 添加Run,add_run()方法返回一个Run对象
p.add_run('!!!')
# 再次循环所有Run
print(' ')
for run in p.runs:
print(run.text)
-------------------------------------
大家
好,
我
是
Richie
大家
好,
我
是
Richie
!!!
修改Run,代码如下:
# 导入库
from docx import Document
# 创建word
word = Document('./MyWord.docx')
# 获取第一个段落的内容
p = word.paragraphs[0]
# 修改Run
print(p.runs[-1].text)
p.runs[-1].text = 'Taylor'
print(p.runs[-1].text)
-------------------------------------
Richie
Taylor
原数据如下:
删除Run,代码如下:
# 导入库
from docx import Document
# 创建word
word = Document('./MyWord.docx')
# 获取第一个段落的内容
p = word.paragraphs[0]
# 使用clear()方法,删除最后一个Run
p.runs[-1].clear()
# 当然也可以这样
# p.runs[-1].text = ''
# 保存word
word.save('MyWord.docx')
删除后如下:
# 导入库
from docx import Document
from docx.enum.text import WD_COLOR_INDEX
from docx.opc.oxml import qn
from docx.shared import Pt, RGBColor
# 创建word
word = Document('./MyWord.docx')
# 获取第一个段落的内容
p = word.paragraphs[0]
# 获取第一个Run对象
run = p.runs[0]
# Run样式
run.bold = True # 加粗
run.italic = True # 斜体
run.underline = True # 下划线
run.font.name = 'Times New Roman' # 设置西文
run.element.rPr.rFonts.set(qn('r:eastAsia'), '宋体') # 设置中文字体
run.font.size = Pt(30) # 字体大小
run.font.color.rgb = RGBColor(0, 0, 255) # 字体颜色
run.font.highlight_color = WD_COLOR_INDEX.YELLOW # 文本高亮颜色
run.font.shadow = True # 阴影
run.font.strike = True # 删除线
# 保存word
word.save('MyWord.docx')
为四位同学分别生成几个段落来模拟表彰,效果如下:
代码如下:
# 导入库
from docx import Document
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
from docx.shared import Pt
# 创建word
word = Document()
# 学生表
student_list = [
{
'专业': '工业工程',
'班级': '201',
'姓名': '吕全'
}, {
'专业': '服装与设计',
'班级': '204',
'姓名': 'Taylor'
}, {
'专业': '计算机',
'班级': '202',
'姓名': '刘志豪'
}, {
'专业': '化学',
'班级': '203',
'姓名': '陈泽'
}
]
# 开始制作案例
# 循环学生列表,为每个学生制作一个段落
for student in student_list:
# 创建一个段落
p = word.add_paragraph()
# 首行缩进
p.paragraph_format.first_line_indent = Pt(10)
# 创建Run
run1 = p.add_run('兹证明,')
run2 = p.add_run(f" {student['专业']} ")
run3 = p.add_run('专业')
run4 = p.add_run(f" {student['班级']} ")
run5 = p.add_run('班')
run6 = p.add_run(f" {student['姓名']} ")
run7 = p.add_run('同学')
run8 = p.add_run('近期学习表现良好,特此奖励10000元,望继续坚持,好好努力!')
# 创建新段落
p1 = word.add_paragraph('中原工学院')
p2 = word.add_paragraph('2023年12月28日')
# 靠右对齐
p1.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
p2.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
# 需要单独添加样式,且需要添加的样式一致的Run数组
need_handle = [run2, run4, run6]
# 循环该数组添加样式
for run in need_handle:
# 添加下划线
run.underline = True
# 循环所有run,设置通用样式
for run in p.runs:
# 设置字体大小
run.font.size = Pt(15)
# 保存word
word.save('MyWord.docx')