本文摘自php中文网,作者不言,侵删。
下面为大家分享一篇pandas 实现将重复表格去重,并重新转换为表格的方法,具有很好的参考价值,希望对大家有所帮助。一起过来看看吧在python处理数据时,经常用到DataFrame和set。
1 2 3 4 5 | train=pd.read_csv( 'XXX.csv' )#读取文件
train=train[ 'item_id' ]#选择要去重的列
train=set(train)#去重
data=pd.DataFrame(list(train),columns=[ 'item_id' ])#因为set是无序的,必须要经过list处理后才能成为DataFrame
data.to_csv( 'xxx.csv' ,index=False)#保存表格
|
记得导入pandas哦~
以上就是pandas 实现将重复表格去重,并重新转换为表格的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
Python实现二分查找与快速排序实例详解
Python中有map方法吗
Python编程能做什么开发
在Python中遍历列表的方法有哪些
Python的安装方法以及io编程的简单介绍
Python lambda怎么用
Python中怎么删除列表中的元素
Python怎么查看变量类型
paramiko模块安装使用说明
如何用Python统计不同字符个数
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » pandas 实现将重复表格去重,并重新转换为表格