主线 1:打基础(1-3)3 数据分析与可视化3.3 Pandas 数据处理3.4 数据清洗本页总览数据清洗 本节定位很多新人第一次学数据清洗时,最容易把它理解成: 哪个函数能把脏数据处理掉 但更稳的理解应该是: 先判断问题类型,再决定删、补、改还是保留。 所以这节最重要的不是背函数,而是建立一个清洗顺序和判断习惯。 学习目标 掌握缺失值的检测、删除和填充策略 学会处理重复值 了解异常值检测方法 掌握数据类型转换和字符串处理 先建立一张地图 数据清洗更适合按“先检查,再决定怎么处理”来理解: 所以这节真正想解决的是: 真实数据最常见的问题有哪些 你第一次拿到脏数据时,最稳的排查顺序是什么 为什么需要数据清洗?