python如何实现敏感词替换


本文摘自php中文网,作者coldplay.xixi,侵删。

python实现敏感词替换的方法:首先倒入敏感词文本;然后当用户输入敏感词匹配成功,则用【*】代替,代码为【new_string = string.replace(words,"*"*len(words))】。

python实现敏感词替换的方法:

思路

这道题练习的是字符串的替换,不过如果不小心的话很容易把过程想简单。在过程中会涉及到递归方法的使用,在Windows下用python2还涉及到编码的转换,要考虑到的是过滤完一遍字符串后可能并没有过滤完的情况,例如在过滤一遍并将敏感字符串替换之后剩余字符串中新组成了敏感词语的情况。这种情况就要用递归来解决,直到过滤替换完一遍之后的结果和过滤之前一样没有发生改变才能视为替换完成,否则在逻辑上是有疏漏的。

编写脚本

代码如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

# -*- coding: utf-8 -*-

import os

curr_dir = os.path.dirname(os.path.abspath(__file__))

filtered_words_txt_path = os.path.join(curr_dir,'filtered_words.txt')

import chardet

def filter_replace(string):

    string = string.decode("gbk")

    filtered_words = []

    with open(filtered_words_txt_path) as filtered_words_txt:

        lines = filtered_words_txt.readlines()

        for line in lines:

            filtered_words.append(line.strip().decode("gbk"))

    print replace(filtered_words, string)

def replace(filtered_words,string):

    new_string = string

    for words in filtered_words:

        if words in string:

            new_string = string.replace(words,"*"*len(words))

    if new_string == string:

        return new_string

    else:

        return replace(filtered_words,new_string)

if __name__ == '__main__':

    filter_replace(raw_input("Type:"))

运行测试结果:

6b587d7eeddf78176c44c7ed75248e2.png

相关免费学习推荐:python教程(视频)

以上就是python如何实现敏感词替换的详细内容,更多文章请关注木庄网络博客!!

相关阅读 >>

Python怎么彻底卸载

新浪新闻详情页的数据抓取实例

Python数据类型的区别

Python列表的基本操作有哪些

Python函数与方法的区别

Python socket之客户端和服务端握手详细介绍

Python为什么是脚本语言

Python怎么下载包

Python编程时如何添加中文注释

Python语言有什么特点

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...