本文摘自php中文网,作者不言,侵删。
这篇文章主要介绍了关于Ubuntu下使用python读取doc和docx文档的内容方法,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下读取docx文档
使用的包是python-docx
1. 安装python-docx包
1 |
|
2. 使用python-docx包读取数据
1 2 3 4 5 |
|
python-docx这个包是不能处理doc文档的,要读取doc文档内容的话需要使用antiword这个工具。
读取doc文档
1. 到网站下载antiword。
2. 下载完毕之后解压,在解压得到的文件夹中依次运行make和make install命令。
3. 使用antiword读取doc文档内容
1 2 3 4 5 |
|
相关推荐:
基于python批量处理dat文件及科学计算的方法
用python处理MS Word的实例
以上就是Ubuntu下使用python读取doc和docx文档的内容方法的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
Python中如何django使用haystack:全文检索的框架的实例讲解
更多相关阅读请进入《Python》频道 >>

Python编程 从入门到实践 第2版
python入门书籍,非常畅销,超高好评,python官方公认好书。