数据合并
学习目标
- 掌握
merge(SQL 风格连接) - 了解
join(基于索引的连接) - 掌握
concat(拼接操作) - 理解不同合并策略的选择
为什么需要合并数据?
真实的数据往往分散在多张表中。比如一个电商系统可能有:
- 用户表:用户ID、姓名、注册时间
- 订单表:订单ID、用户ID、商品、金额
- 商品表:商品ID、名称、类别、价格
要分析"每个用户买了什么商品",就需要把这些表合并起来。
merge:SQL 风格连接
merge 是最强大的合并方式,类似 SQL 的 JOIN。
准备示例数据
import pandas as pd
# 用户表
users = pd.DataFrame({
"用户ID": [1, 2, 3, 4],
"姓名": ["张三", "