我有这样一个csv 格式的文件,类似如下数据:
wintonzhang,kobebryant
wintonzhang,thescript
wintonzhang,tomhanks
wintonzhang,VictoriaJustice
mynte,shek0309
shek0309,aboluowang
shek0309,aiww
shek0309,aoi_sola
shek0309,AshlynnBrookeX
shek0309,BarackObama
mema55159,13super10
mema55159,18_asooma
mema55159,59arb
mema55159,121_remo
mema55159,123Kyuna
mema55159,222amam
我想做的是,如果一个词在全文中只出现过一次,那么就把这个词所在的行删除。
实际需要处理的数据有十几万行,在 Excel 中有办法处理,但速度实在太慢了。
不知道还有什么简单易行的方法。
谢谢!
wintonzhang,kobebryant
wintonzhang,thescript
wintonzhang,tomhanks
wintonzhang,VictoriaJustice
mynte,shek0309
shek0309,aboluowang
shek0309,aiww
shek0309,aoi_sola
shek0309,AshlynnBrookeX
shek0309,BarackObama
mema55159,13super10
mema55159,18_asooma
mema55159,59arb
mema55159,121_remo
mema55159,123Kyuna
mema55159,222amam
我想做的是,如果一个词在全文中只出现过一次,那么就把这个词所在的行删除。
实际需要处理的数据有十几万行,在 Excel 中有办法处理,但速度实在太慢了。
不知道还有什么简单易行的方法。
谢谢!
