python如何清除html文件中的内容


本文摘自php中文网,作者coldplay.xixi,侵删。

python清除html文件中内容的方法:1、使用join方法,代码为【pat = re.compile('>(.*?)<')''.join(pat.findall(test))】;2、使用compile方法。

本教程操作环境:windows7系统、python3.9版,DELL G3电脑,该方法适用于所有品牌电脑。

python清除html文件中内容的方法:

方法1:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

In [97]: str_ = ''

    ...: flag = 1

    ...: for ele in test:

    ...:     if ele == "<":

    ...:         flag = 0

    ...:     elif ele == '>':

    ...:         flag = 1

    ...:         continue

    ...:     if flag == 1:

    ...:         str_ += ele

    ...:        

In [98]: str_

Out[98]: 'just for testjust for testtest'

In [99]: str_ = ''

    ...: flag = 1

    ...: for ele in test:

    ...:     if ele == "<":

    ...:         flag = 0

    ...:     elif ele == '>':

    ...:         flag = 1

    ...:         ele = ' '

    ...:     if flag == 1:

    ...:         str_ += ele

    ...:        

In [100]: str_

Out[100]: ' just for test   just for test  test '

方法2:

1

2

3

4

5

6

import re

In [156]: pat = re.compile('(?<=\>).*?(?=\<)')

In [157]: pat.findall(test)

Out[157]: ['just for test', '', '', 'just for test', '', 'test']

In [158]: ''.join(pat.findall(test))

Out[158]: 'just for testjust for testtest'

方法3:

1

2

pat = re.compile('>(.*?)<')

''.join(pat.findall(test))

方法4:

1

2

3

In [167]: pat = re.compile('<[^>]+>', re.S)

In [168]: pat.sub('', test)

Out[168]: 'just for testjust for testtest'

大量免费学习推荐,敬请访问python教程(视频)

以上就是python如何清除html文件中的内容的详细内容,更多文章请关注木庄网络博客!!

相关阅读 >>

Python为什么要缩进控制

Python3列表的基础学习(附示例)

Python用什么数据库

Python安装了怎么用

Python中remove函数的用法是什么?

Python如何把数字变成日期

如何将Python中文件写入txt

Python中sep是什么意思

Python string、 bytes、 bytearray类型详解

Python使用matplotlib绘制3d图形(代码示例)

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...