python – 将多列转换为一行(Pandas / Numpy)

我想将多个属性的月度数据组合成一个包含整年数据的行.这是一个与 Combine multiple time-series rows into one row with Pandas类似的问题.如果我的几个月完成,这个问题的解决方案对我有用,但是对于我的大多数数据而言,个别年份的月份都会丢失.如果只有12月的数据,则解决方案将填充第一列而不是第12列.

例如,我只使用1月到6月.

以下是我的数据示例：

ex_df = pd.DataFrame({'year': [1966, 1966, 1966, 1967, 1967, 1967], 'month': [1, 2, 6, 2, 3, 4], 'A': [10, 5, 0, np.nan, 25, 0], 'B': [-100, -80, 100, -120, 0, 60], 'C': [-1, -18, -2, -11, 10, 6]})

这是最佳解决方案：

sol_df = pd.DataFrame({'year': [1966, 1967], 'A1': [10, np.nan], 'A2': [5, np.nan],'A3': [np.nan, 25],'A4': [np.nan, 0],'A5': [np.nan, np.nan],'A6': [0, np.nan],'B1': [-100, np.nan],  'B2': [-80, -120], 'B3': [np.nan, 0], 'B4': [np.nan, 60], 'B5': [np.nan, np.nan], 'B6': [100, np.nan],'C1': [-1, np.nan],  'C2': [-18, -11], 'C3': [np.nan, 10], 'C4': [np.nan, 6], 'C5': [np.nan, np.nan], 'C6': [-2, np.nan] })

A,B,C是属性,数字对应于月份.

最佳答案

使用：

df = ex_df.set_index(['year','month']).unstack()
df.columns = ['{}{}'.format(x, y) for x, y in df.columns]
df = df.reset_index()
print (df)
   year    A1   A2    A3   A4   A6     B1     B2   B3    B4     B6   C1    C2  \
0  1966  10.0  5.0   NaN  NaN  0.0 -100.0  -80.0  NaN   NaN  100.0 -1.0 -18.0   
1  1967   NaN  NaN  25.0  0.0  NaN    NaN -120.0  0.0  60.0    NaN  NaN -11.0   

     C3   C4   C6  
0   NaN  NaN -2.0

说明：

>重塑第一次set_index和unstack
>在列表理解的列中展平多索引
>在reset_index之前从索引创建列

点击查看更多相关文章

转载注明原文：python – 将多列转换为一行(Pandas / Numpy) - 乐贴网