Python读写docx文件的方法


本文摘自php中文网,作者不言,侵删。

这篇文章主要介绍了关于Python读写docx文件的方法,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下

Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。

这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理,doc格式不是基于xml的。

1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档

1

2

3

4

5

6

7

8

#coding:utf-8

import docx

  

#新建文档

doc_new = docx.Document()

  

#读取文档

doc = docx.Document(ur'C:\1.docx')

2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。

1

doc.save(path_or_stream)

3、对象集合。python-docx包含了word文档的相关对象集合。

1

2

3

4

5

doc.paragraphs #段落集合

doc.tables #表格集合

doc.sections #节 集合

doc.styles #样式集合

doc.inline_shapes #内置图形 等等...

4、插入段落。段落是word最基本的对象之一。

1

2

3

4

5

6

doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段”

#默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式

doc.add_paragraph(u'第二段',style='Heading 2')

  

#这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式

print [s.name for s in doc.styles if s.type==1]

5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。

1

2

3

4

5

6

7

8

9

10

11

12

#coding:utf-8

from docx import Document

from docx.shared import RGBColor #这个是docx的颜色类

  

#新建文档

doc = Document()

  

#新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格)

style = doc.styles.add_style('style name 1', 2)

  

#设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试)

style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)

阅读剩余部分

相关阅读 >>

rectangle是什么意思,如何利用elipse和rectangle画图

Python基于递归算法实现的汉诺塔与fibonacci数列

Python安装了怎么用

什么是copy函数?直接赋值与copy的区别是什么?

Python中日期和时间格式化输出的方法小结_Python

怎么在cmd运行Python

Python能解偏微分方程吗

Python是c语言编的吗

Python socket之客户端和服务端握手详细介绍

Python中面向对象该如何编程

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...