本文摘自php中文网,作者不言,侵删。
下面为大家分享一篇pandas 实现将重复表格去重,并重新转换为表格的方法,具有很好的参考价值,希望对大家有所帮助。一起过来看看吧在python处理数据时,经常用到DataFrame和set。
1 2 3 4 5 | train=pd.read_csv( 'XXX.csv' )#读取文件
train=train[ 'item_id' ]#选择要去重的列
train=set(train)#去重
data=pd.DataFrame(list(train),columns=[ 'item_id' ])#因为set是无序的,必须要经过list处理后才能成为DataFrame
data.to_csv( 'xxx.csv' ,index=False)#保存表格
|
记得导入pandas哦~
以上就是pandas 实现将重复表格去重,并重新转换为表格的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
Python如何删除txt文件
Python如何生成随机数字
Python元组的知识详解
自学Python可以做什么兼职
Python有spark库么
Python中实现指定时间调用函数的方法讲解
Python sort函数怎么用
什么是Python对象摧毁?Python中的对象摧毁(垃圾回收)机制是什么?
Python变量赋值的步奏详解
Python是解释型语言吗
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » pandas 实现将重复表格去重,并重新转换为表格