dataprocess.py
import pandas as pd
#打开CSV文件
fileNameStr = 'BeijingPM20100101_20151231.csv'
orig_df = pd.read_csv(fileNameStr, encoding='utf-8')
# PM:计算每一行【即每一小时】的平均值(由于有四个街区的数据,所以需要先求解四个街区每小时的平均值)
orig_df['PM_ave'] = orig_df.iloc[:, 6:10].mean(axis=1)
# 按照年分组,计算每一年的平均值,并将计算结果输出
orig_df.groupby('year')['PM_ave'].mean().to_csv("YearPM_ave.csv")
print(orig_df.groupby('year')['PM_ave'].mean())
# 温度:按照年和月分组,计算每一年月的平均值,并将计算结果输出
orig_df.groupby(['year', 'month'])['TEMP'].mean().to_csv("MonthTEMP_ave.csv")
print(orig_df.groupby(['year', 'month'])['TEMP'].mean())
# PM:按照年和月分组,计算每一年月的平均值,并将计算结果输出
orig_df.groupby(['year', 'month'])['PM_ave'].mean().to_csv("MonthPM_ave.csv")
print(orig_df.groupby(['year', 'month'])['PM_ave'].mean())
年PM:
月平均气温
月PM变化