本文摘自php中文网,作者小云云,侵删。
本文主要为大家详细介绍了python如何统计序列中的元素,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能帮助到大家。问题1:
随机数列[12,5,8,7,8,9,4,8,5,...] 中出现次数最高的3个元素,他们出现的次数
问题2:
对某英文文章的单词,进行词频统计,找出出现次数最搞得10个单词,他们出现的次数是多少?
上面问题都是以字典的形式保存结果
如何解决问题1?
方法1:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 | #!/usr/bin/python3
from random import randint
def count_seq(data):
# 初始化统计结果字典,data中的key作为结果字典的key,0作为每个key的初始值
result_c = dict.fromkeys(data, 0)
# 循环data,对字典中中碰到的值进行 +1 ,循环完成后就是结果
for x in data:
result_c[x] += 1
return result_c
if __name__ == '__main__' :
# 生成20个随机数
data = [randint(0, 20) for _ in range(20)]
print (data)
# 结果
result_c = count_seq(data)
for i in result_c:
print (i, result_c[i])
|
方法2:
使用 collections下Counter对象
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | #!/usr/bin/python3
from random import randint
from collections import Counter
def count_seq(data):
# 创建Counter对象,并把打他传递进去
median_c = Counter(data)
# 返回统计最大的3个数
return median_c.most_common(3)
if __name__ == '__main__' :
# 生成20个随机数
data = [randint(0, 20) for _ in range(20)]
print (data)
# 结果
result_c = count_seq(data)
print (result_c, dict(result_c))
|
问题2如何解决?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | import re
from collections import Counter
def count_words():
# 读取文件
with open( 'english_article' , 'r' , encoding= 'utf-8' ) as data:
print ()
# 文件单词分割
data_list = re.split( '\W+' , data.read())
# 单词统计
words = Counter(data_list)
# 取单词统计最大的10个值
return words.most_common(10)
if __name__ == '__main__' :
result = count_words()
print (result)
|
以上就是python统计序列中元素的方法的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
Python中sep是函数吗?该怎么使用?
Python怎么找出最大数
简单介绍Python编程中的字符串编码问题
详解Python之urllib爬虫、request模块和parse模块
Python中如何从列表中删除none值
Python线程下thread对象的用法介绍(附实例)
Python中怎么代码换行
Python程序的两种运行方式是什么
Python ord()是什么?ord()有什么用?
Python接口如何返回json字符串
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » python统计序列中元素的方法