Pandas | 缺失数据填充

时间:2024-10-14 11:04:16

1、首先,我们创建一个只有时间索引的DataFramet = pd.DataFrame(index=p颊俄岿髭d.date_range(x.index[0], y.index[-1]))注意这里的起始时间和终止时间的选择

Pandas | 缺失数据填充

2、然后,把星期数据集的数据映射过去,同时使用前一个数据作为缺失数据的填充t = pd.DataFrame(index=pd.date忧溲枷茫_range(x.index[0], y.index[-1]))x = t.join(x).fillna(method='pad')

Pandas | 缺失数据填充

3、对比一下此时的两个数据集,发现有多余的数据。等于说步骤②的代码,只是做了一个数据集的填充。

Pandas | 缺失数据填充

4、对于x数据集起始时间早于y数据集的情况,使用y数据集的索引进行映射即可if x.index[0] < y.index[0]: x = pd.DataFrame(index=y.index).join(x)

5、对于x数据集起始时间不早于y数据集的情况,则需要额外处理x = pd.DataFrame(index=y[x.index[0]::].index).join(x)y = y[x.index[0]::]

Pandas | 缺失数据填充

6、下面是最后的结果

Pandas | 缺失数据填充
© 手抄报圈