本文摘自php中文网,作者(*-*)浩,侵删。
本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来.首先,我们读入一些模块,以进行文件操作。(推荐学习:Python视频教程)
1 2 |
|
演示目录下,有两个文件夹,分别是pdf和newpdf。
我们指定 pdf 文件所在路径为其中的pdf文件夹。
1 |
|
我们希望获得所有 pdf 文件的路径。用glob,一条命令就能完成这个功能。
1 |
|
看看我们获得的 pdf 文件路径是否正确。
相关阅读 >>
更多相关阅读请进入《Python》频道 >>

Python编程 从入门到实践 第2版
python入门书籍,非常畅销,超高好评,python官方公认好书。