pandas如何去除重复值

张开发
2026/4/16 9:25:22 15 分钟阅读

分享文章

pandas如何去除重复值
pandas如何去除重复值pandas如何去除重复值在我们做数据分析时我们所要处理的数据中难免会出现重复的数据有些是我们需要的有些是我们不需要的甚至还会影响我们接下来数据分析的准确度。接下来给大家介绍去除重复值的方法。dic {地市: [廊坊,廊坊,廊坊,张家口,张家口,张家口,廊坊,承德,承德,承德,石家庄,石家庄,石家庄,石家庄],组号:[1,2,1,2,1,2,1,2,1,2,1,2,1,2],数量:[11,12,13,14,15,16,17,18,19,20,21,22,23,24]}p_city pd.DataFrame(dic)print(p_city )输出print(p_city.head(10))输出pfp_city.drop_duplicates(subset[地市,组号],keepfirst)print(pf)输出接下来我们解释一下p_city.head(10)获取数据的前十条pfp_city.drop_duplicates(subset[地市, 组号], keepfirst)这个是最关键的语句了。首先subset参数是一个列表这个列表是需要你填进行相同数据判断的条件。keep的取值有三个分别是first、last、falsekeepfirst时保留相同数据的第一条。keeplast时保存相同数据的最后一条。keepfalse时所有相同的数据都不保留。

更多文章