本文摘自php中文网,作者不言,侵删。
Python可以利用python-docx模块处理word文档,处理方式是面向对象的。安装 :在cmd命令行中输入 pip install python-docx
最后提示Successfully installed,表示成功地安装完成
代码:
1 2 3 4 5 6 7 8 9 10 | # encoding=utf-8
import docx
#获取文档对象
file=docx.Document( "E:\\pythoncode\\T11308010102mayuwen.docx" )
print ( "段落数:" +str(len(file.paragraphs)))#段落数
#输出每一段的内容
for para in file.paragraphs:
print (para.text)
|
结果如图:
阅读剩余部分
相关阅读 >>
Python针对任意多的分隔符拆分字符串(附代码)
Python socket之客户端和服务端握手详细介绍
Python怎么彻底卸载
Python idle怎么生成程序文件
range的用法介绍
Python面向对象编程中类和实例的简单讲解(附示例)
微信跳一跳Python辅助脚本实例分享
序列化和反序列化的详细介绍
Python 怎么获取文件名
为什么要设计好目录结构?
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » python读取word中的文本内容