本文摘自php中文网,作者angryTom,侵删。

python统计单词出现次数
做单词词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名字关联一个电话号码。
下面是具体的实现代码,实现了从importthis.txt文件读取单词,并统计出现次数最多的5个单词。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 | # -*- coding:utf-8 -*-
import io
import re
class Counter:
def __init__(self, path):
"" "
:param path: 文件路径
"" "
self.mapping = dict()
with io.open(path, encoding= "utf-8" ) as f:
data = f.read()
words = [s.lower() for s in re.findall( "\w+" , data)]
for word in words:
self.mapping[word] = self.mapping.get(word, 0) + 1
def most_common(self, n):
assert n > 0, "n should be large than 0"
return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]
if __name__ == '__main__' :
most_common_5 = Counter( "importthis.txt" ).most_common(5)
for item in most_common_5:
print (item)
|
执行效果:
阅读剩余部分
相关阅读 >>
Python如何去除字符串中不想要的字符
Python如何转换时间戳
Python tuple有什么用
Python压缩文件的效率高吗?
java和Python先学哪个
Python判断一个集合是否为另一个集合的子集方法
Python注释怎么写
Python注释是什么
实例详解Python基于回溯法子集树模板解决最佳作业调度
Python和selenium开发环境搭建的图文教程
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » python统计单词出现次数