本文摘自php中文网,作者不言,侵删。
下面为大家分享一篇pandas 实现将重复表格去重,并重新转换为表格的方法,具有很好的参考价值,希望对大家有所帮助。一起过来看看吧在python处理数据时,经常用到DataFrame和set。
1 2 3 4 5 | train=pd.read_csv( 'XXX.csv' )#读取文件
train=train[ 'item_id' ]#选择要去重的列
train=set(train)#去重
data=pd.DataFrame(list(train),columns=[ 'item_id' ])#因为set是无序的,必须要经过list处理后才能成为DataFrame
data.to_csv( 'xxx.csv' ,index=False)#保存表格
|
记得导入pandas哦~
以上就是pandas 实现将重复表格去重,并重新转换为表格的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
Python时间戳怎么获得?如何获得当前时间戳?
Python数字怎么转对应中文
anaconda的新手使用大全
Python中fun是什么意思
numpy 进行数组拼接,分别在行和列上合并的实例
Python怎么写图形界面gui
Python循环函数
Python中“end=”是什么意思?
Python中socket模块详解
jupyter 常用快捷键 及 常用方法笔记
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » pandas 实现将重复表格去重,并重新转换为表格