交通仿真结果分析与报告生成
在交通仿真软件中,结果分析与报告生成是至关重要的步骤。通过对仿真结果的分析,可以评估交通信号控制策略的有效性,优化交通流量,减少拥堵,提高道路安全性。本节将详细介绍如何在交通仿真软件中进行结果分析和报告生成,包括数据提取、统计分析、可视化展示和报告输出等技术内容。
数据提取
数据提取是从仿真结果中获取所需数据的过程。这些数据通常包括交通流量、车速、等待时间、延误等指标。数据提取的方法取决于仿真软件的输出格式和提供的 API。
1. 仿真结果文件解析
大多数交通仿真软件都会生成包含仿真结果的文件,这些文件可以是 CSV、JSON、XML 等格式。解析这些文件是数据提取的第一步。
1.1 CSV 文件解析
假设仿真软件生成了一个 CSV 文件,文件内容如下:
Time,Vehicle_ID,Speed,Position,Lane 0,1,0,0,1 1,1,5,5,1 2,1,10,15,1 3,1,15,30,1 4,1,20,50,1 0,2,0,0,2 1,2,5,5,2 2,2,10,15,2 3,2,15,30,2 4,2,20,50,2使用 Python 的pandas库可以轻松解析 CSV 文件:
importpandasaspd# 读取 CSV 文件df=pd.read_csv('simulation_results.csv')# 查看数据前几行print(df.head())1.2 JSON 文件解析
假设仿真软件生成了一个 JSON 文件,文件内容如下:
[{"Time":0,"Vehicle_ID":1,"Speed":0,"Position":0,"Lane":1},{"Time":1,"Vehicle_ID":1,"Speed":5,"Position":5,"Lane":1},{"Time":2,"Vehicle_ID":1,"Speed":10,"Position":15,"Lane":1},{"Time":3,"Vehicle_ID":1,"Speed":15,"Position":30,"Lane":1},{"Time":4,"Vehicle_ID":1,"Speed":20,"Position":50,"Lane":1},{"Time":0,"Vehicle_ID":2,"Speed":0,"Position":0,"Lane":2},{"Time":1,"Vehicle_ID":2,"Speed":5,"Position":5,"Lane":2},{"Time":2,"Vehicle_ID":2,"Speed":10,"Position":15,"Lane":2},{"Time":3,"Vehicle_ID":2,"Speed":15,"Position":30,"Lane":2},{"Time":4,"Vehicle_ID":2,"Speed":20,"Position":50,"Lane":2}]使用 Python 的json库可以解析 JSON 文件:
importjsonimportpandasaspd# 读取 JSON 文件withopen('simulation_results.json','r')asfile:data=json.load(file)# 将 JSON 数据转换为 DataFramedf=pd.DataFrame(data)# 查看数据前几行print(df.head())1.3 使用仿真软件 API
许多仿真软件提供了 API,允许用户直接从内存中提取数据。假设仿真软件提供了一个get_results方法,可以获取仿真结果:
# 假设仿真软件的 APIfromsimulation_apiimportget_results# 获取仿真结果results=get_results()# 将结果转换为 DataFramedf=pd.DataFrame(results)# 查看数据前几行print(df.head())数据清洗
数据清洗是确保数据质量的重要步骤。常见的数据清洗任务包括处理缺失值、异常值和数据类型转换等。
2.1 处理缺失值
假设数据中有一些缺失值:
# 生成包含缺失值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,None,20,0,5,10,15,20],'Position':[0,5,15,None,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行print(df.head())# 处理缺失值df.fillna(method='ffill',inplace=True)# 用前一个值填充缺失值# 查看处理后的数据print(df.head())2.2 处理异常值
假设数据中有一些异常值,可以使用统计方法或阈值方法进行处理:
# 生成包含异常值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,100,20,0,5,10,15,20],'Position':[0,5,15,30,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行print(df.head())# 识别并处理异常值df=df[df['Speed']<=30]# 过滤速度大于 30 的异常值# 查看处理后的数据print(df.head())2.3 数据类型转换
确保数据类型正确是数据清洗的重要部分。假设Time列的数据类型为字符串,需要转换为浮点数:
# 生成包含字符串类型 Time 列的 DataFramedf=pd.DataFrame({'Time':['0','1','2','3','4','0','1','2','3','4'],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,15,20,0,5,10,15,20],'Position':[0,5,15,30,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行print(df.head())# 转换 Time 列的数据类型df['Time']=df['Time'].astype(float)# 查看处理后的数据print(df.head())数据分析
数据分析是评估仿真结果的关键步骤。常见的分析方法包括统计分析、趋势分析和时间序列分析等。
3.1 统计分析
统计分析可以帮助我们了解数据的分布情况和基本特征。例如,计算每辆车的平均速度和最大速度:
# 计算每辆车的平均速度average_speed=df.groupby('Vehicle_ID')['Speed'].mean()print(average_speed)# 计算每辆车的最大速度max_speed=df.groupby('Vehicle_ID')['Speed'].max()print(max_speed)3.2 趋势分析
趋势分析可以帮助我们了解交通流量随时间的变化情况。例如,绘制每辆车的速度随时间变化的图表:
importmatplotlib.pyplotasplt# 绘制每辆车的速度随时间变化的图表forvehicle_id,groupindf.groupby('Vehicle_ID'):plt.plot(group['Time'],group['Speed'],label=f'Vehicle{vehicle_id}')plt.xlabel('Time (s)')plt.ylabel('Speed (km/h)')plt.title('Vehicle Speed over Time')plt.legend()plt.show()3.3 时间序列分析
时间序列分析可以帮助我们了解交通信号控制策略的效果。例如,计算每个时间段的平均延误时间:
# 假设延误时间数据df['Delay']=[0,1,2,3,4,0,1,2,3,4]# 计算每个时间段的平均延误时间average_delay=df.groupby('Time')['Delay'].mean()print(average_delay)# 绘制平均延误时间随时间变化的图表plt.plot(average_delay.index,average_delay.values)plt.xlabel('Time (s)')plt.ylabel('Average Delay (s)')plt.title('Average Delay over Time')plt.show()可视化展示
可视化展示是将分析结果以图形方式呈现,以便于理解和交流。常见的可视化工具包括matplotlib、seaborn和plotly等。
4.1 基本图表绘制
4.1.1 折线图
折线图适合展示时间序列数据:
# 绘制每辆车的速度随时间变化的折线图forvehicle_id,groupindf.groupby('Vehicle_ID'):plt.plot(group['Time'],group['Speed'],label=f'Vehicle{vehicle_id}')plt.xlabel('Time (s)')plt.ylabel('Speed (km/h)')plt.title('Vehicle Speed over Time')plt.legend()plt.show()4.1.2 柱状图
柱状图适合展示分类数据的分布情况:
# 绘制每辆车的平均速度柱状图average_speed.plot(kind='bar')plt.xlabel('Vehicle ID')plt.ylabel('Average Speed (km/h)')plt.title('Average Speed by Vehicle')plt.show()4.2 高级图表绘制
4.2.1 热力图
热力图适合展示多维数据的分布情况:
importseabornassns# 假设每辆车在每个时间段的延误时间数据df['Vehicle_Lane']=df['Vehicle_ID'].astype(str)+'_'+df['Lane'].astype(str)pivot_table=df.pivot_table(index='Time',columns='Vehicle_Lane',values='Delay')# 绘制热力图sns.heatmap(pivot_table,cmap='coolwarm')plt.xlabel('Vehicle and Lane')plt.ylabel('Time (s)')plt.title('Delay Heatmap')plt.show()4.2.2 交互式图表
交互式图表可以提供更丰富的数据展示和探索功能。例如,使用plotly绘制交互式折线图:
importplotly.expressaspx# 绘制交互式折线图fig=px.line(df,x='Time',y='Speed',color='Vehicle_ID',title='Vehicle Speed over Time')fig.show()报告生成
报告生成是将分析结果以文档形式呈现,以便于分享和存档。常见的报告生成工具包括Jupyter Notebook、Markdown和LaTeX等。
5.1 使用 Jupyter Notebook 生成报告
Jupyter Notebook 是一个强大的交互式文档工具,适合生成包含代码和图表的报告。以下是一个简单的 Jupyter Notebook 报告示例:
# 交通仿真结果分析报告 ## 数据提取 数据提取是从仿真结果中获取所需数据的过程。这些数据通常包括交通流量、车速、等待时间、延误等指标。数据提取的方法取决于仿真软件的输出格式和提供的 API。 ### 1. 仿真结果文件解析 大多数交通仿真软件都会生成包含仿真结果的文件,这些文件可以是 CSV、JSON、XML 等格式。解析这些文件是数据提取的第一步。 #### 1.1 CSV 文件解析 假设仿真软件生成了一个 CSV 文件,文件内容如下: ```csv Time,Vehicle_ID,Speed,Position,Lane 0,1,0,0,1 1,1,5,5,1 2,1,10,15,1 3,1,15,30,1 4,1,20,50,1 0,2,0,0,2 1,2,5,5,2 2,2,10,15,2 3,2,15,30,2 4,2,20,50,2使用 Python 的pandas库可以轻松解析 CSV 文件:
importpandasaspd# 读取 CSV 文件df=pd.read_csv('simulation_results.csv')# 查看数据前几行print(df.head())1.2 JSON 文件解析
假设仿真软件生成了一个 JSON 文件,文件内容如下:
[{"Time":0,"Vehicle_ID":1,"Speed":0,"Position":0,"Lane":1},{"Time":1,"Vehicle_ID":1,"Speed":5,"Position":5,"Lane":1},{"Time":2,"Vehicle_ID":1,"Speed":10,"Position":15,"Lane":1},{"Time":3,"Vehicle_ID":1,"Speed":15,"Position":30,"Lane":1},{"Time":4,"Vehicle_ID":1,"Speed":20,"Position":50,"Lane":1},{"Time":0,"Vehicle_ID":2,"Speed":0,"Position":0,"Lane":2},{"Time":1,"Vehicle_ID":2,"Speed":5,"Position":5,"Lane":2},{"Time":2,"Vehicle_ID":2,"Speed":10,"Position":15,"Lane":2},{"Time":3,"Vehicle_ID":2,"Speed":15,"Position":30,"Lane":2},{"Time":4,"Vehicle_ID":2,"Speed":20,"Position":50,"Lane":2}]使用 Python 的json库可以解析 JSON 文件:
importjsonimportpandasaspd# 读取 JSON 文件withopen('simulation_results.json','r')asfile:data=json.load(file)# 将 JSON 数据转换为 DataFramedf=pd.DataFrame(data)# 查看数据前几行print(df.head())1.3 使用仿真软件 API
许多仿真软件提供了 API,允许用户直接从内存中提取数据。假设仿真软件提供了一个get_results方法,可以获取仿真结果:
# 假设仿真软件的 APIfromsimulation_apiimportget_results# 获取仿真结果results=get_results()# 将结果转换为 DataFramedf=pd.DataFrame(results)# 查看数据前几行print(df.head())数据清洗
数据清洗是确保数据质量的重要步骤。常见的数据清洗任务包括处理缺失值、异常值和数据类型转换等。
2.1 处理缺失值
假设数据中有一些缺失值:
# 生成包含缺失值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,None,20,0,5,10,15,20],'Position':[0,5,15,None,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行print(df.head())# 处理缺失值df.fillna(method='ffill',inplace=True)# 用前一个值填充缺失值# 查看处理后的数据print(df.head())2.2 处理异常值
假设数据中有一些异常值,可以使用统计方法或阈值方法进行处理:
# 生成包含异常值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,100,20,0,5,10,15,20],'Position':[0,5,15,30,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行print(df.head())# 识别并处理异常值df=df[df['Speed']<=30]# 过滤速度大于 30 的异常值# 查看处理后的数据print(df.head())2.3 数据类型转换
确保数据类型正确是数据清洗的重要部分。假设Time列的数据类型为字符串,需要转换为浮点数:
# 生成包含字符串类型 Time 列的 DataFramedf=pd.DataFrame({'Time':['0','1','2','3','4','0','1','2','3','4'],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,15,20,0,5,10,15,20],'Position':[0,5,15,30,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行print(df.head())# 转换 Time 列的数据类型df['Time']=df['Time'].astype(float)# 查看处理后的数据print(df.head())数据分析
数据分析是评估仿真结果的关键步骤。常见的分析方法包括统计分析、趋势分析和时间序列分析等。
3.1 统计分析
统计分析可以帮助我们了解数据的分布情况和基本特征。例如,计算每辆车的平均速度和最大速度:
# 计算每辆车的平均速度average_speed=df.groupby('Vehicle_ID')['Speed'].mean()print(average_speed)# 计算每辆车的最大速度max_speed=df.groupby('Vehicle_ID')['Speed'].max()print(max_speed)3.2 趋势分析
趋势分析可以帮助我们了解交通流量随时间的变化情况。例如,绘制每辆车的速度随时间变化的图表:
importmatplotlib.pyplotasplt# 绘制每辆车的速度随时间变化的图表forvehicle_id,groupindf.groupby('Vehicle_ID'):plt.plot(group['Time'],group['Speed'],label=f'Vehicle{vehicle_id}')plt.xlabel('Time (s)')plt.ylabel('Speed (km/h)')plt.title('Vehicle Speed over Time')plt.legend()plt.show()3.3 时间序列分析
时间序列分析可以帮助我们了解交通信号控制策略的效果。例如,计算每个时间段的平均延误时间:
# 假设延误时间数据df['Delay']=[0,1,2,3,4,0,1,2,3,4]# 计算每个时间段的平均延误时间average_delay=df.groupby('Time')['Delay'].mean()print(average_delay)# 绘制平均延误时间随时间变化的图表plt.plot(average_delay.index,average_delay.values)plt.xlabel('Time (s)')plt.ylabel('Average Delay (s)')plt.title('Average Delay over Time')plt.show()可视化展示
基本图表绘制
4.1.1 折线图
折线图适合展示时间序列数据,可以直观地显示车辆速度随时间的变化趋势。以下是绘制每辆车的速度随时间变化的折线图的示例代码:
# 绘制每辆车的速度随时间变化的折线图forvehicle_id,groupindf.groupby('Vehicle_ID'):plt.plot(group['Time'],group['Speed'],label=f'Vehicle{vehicle_id}')plt.xlabel('Time (s)')plt.ylabel('Speed (km/h)')plt.title('Vehicle Speed over Time')plt.legend()plt.show()4.1.2 柱状图
柱状图适合展示分类数据的分布情况,例如每辆车的平均速度。以下是绘制每辆车的平均速度柱状图的示例代码:
# 绘制每辆车的平均速度柱状图average_speed.plot(kind='bar')plt.xlabel('Vehicle ID')plt.ylabel('Average Speed (km/h)')plt.title('Average Speed by Vehicle')plt.show()高级图表绘制
4.2.1 热力图
热力图适合展示多维数据的分布情况,例如每辆车在每个时间段的延误时间。以下是绘制热力图的示例代码:
importseabornassns# 假设每辆车在每个时间段的延误时间数据df['Vehicle_Lane']=df['Vehicle_ID'].astype(str)+'_'+df['Lane'].astype(str)pivot_table=df.pivot_table(index='Time',columns='Vehicle_Lane',values='Delay')# 绘制热力图sns.heatmap(pivot_table,cmap='coolwarm')plt.xlabel('Vehicle and Lane')plt.ylabel('Time (s)')plt.title('Delay Heatmap')plt.show()4.2.2 交互式图表
交互式图表可以提供更丰富的数据展示和探索功能,例如使用plotly绘制交互式折线图。以下是绘制交互式折线图的示例代码:
importplotly.expressaspx# 绘制交互式折线图fig=px.line(df,x='Time',y='Speed',color='Vehicle_ID',title='Vehicle Speed over Time')fig.show()报告生成
报告生成是将分析结果以文档形式呈现,以便于分享和存档。常见的报告生成工具包括Jupyter Notebook、Markdown和LaTeX等。
5.1 使用 Jupyter Notebook 生成报告
Jupyter Notebook 是一个强大的交互式文档工具,适合生成包含代码和图表的报告。以下是一个简单的 Jupyter Notebook 报告示例:
# 交通仿真结果分析报告 ## 数据提取 ### CSV 文件解析 ```python import pandas as pd # 读取 CSV 文件 df = pd.read_csv('simulation_results.csv') # 查看数据前几行 df.head()JSON 文件解析
importjsonimportpandasaspd# 读取 JSON 文件withopen('simulation_results.json','r')asfile:data=json.load(file)# 将 JSON 数据转换为 DataFramedf=pd.DataFrame(data)# 查看数据前几行df.head()使用仿真软件 API
fromsimulation_apiimportget_results# 获取仿真结果results=get_results()# 将结果转换为 DataFramedf=pd.DataFrame(results)# 查看数据前几行df.head()数据清洗
处理缺失值
# 生成包含缺失值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,None,20,0,5,10,15,20],'Position':[0,5,15,None,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行df.head()# 处理缺失值df.fillna(method='ffill',inplace=True)# 用前一个值填充缺失值# 查看处理后的数据df.head()处理异常值
# 生成包含异常值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,100,20,0,5,10,15,20],'Position':[0,5,15,30,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行df.head()# 识别并处理异常值df=df[df['Speed']<=30]# 过滤速度大于 30 的异常值# 查看处理后的数据df.head()数据类型转换
# 生成包含字符串类型 Time 列的 DataFramedf=pd.DataFrame({'Time':['0','1','2','3','4','0','1','2','3','4'],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,15,20,0,5,10,15,20],'Position':[0,5,15,30,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行df.head()# 转换 Time 列的数据类型df['Time']=df['Time'].astype(float)# 查看处理后的数据df.head()数据分析
统计分析
统计分析可以帮助我们了解数据的分布情况和基本特征。例如,计算每辆车的平均速度和最大速度:
# 计算每辆车的平均速度average_speed=df.groupby('Vehicle_ID')['Speed'].mean()average_speed# 计算每辆车的最大速度max_speed=df.groupby('Vehicle_ID')['Speed'].max()max_speed趋势分析
趋势分析可以帮助我们了解交通流量随时间的变化情况。例如,绘制每辆车的速度随时间变化的图表:
importmatplotlib.pyplotasplt# 绘制每辆车的速度随时间变化的图表forvehicle_id,groupindf.groupby('Vehicle_ID'):plt.plot(group['Time'],group['Speed'],label=f'Vehicle{vehicle_id}')plt.xlabel('Time (s)')plt.ylabel('Speed (km/h)')plt.title('Vehicle Speed over Time')plt.legend()plt.show()时间序列分析
时间序列分析可以帮助我们了解交通信号控制策略的效果。例如,计算每个时间段的平均延误时间:
# 假设延误时间数据df['Delay']=[0,1,2,3,4,0,1,2,3,4]# 计算每个时间段的平均延误时间average_delay=df.groupby('Time')['Delay'].mean()average_delay# 绘制平均延误时间随时间变化的图表plt.plot(average_delay.index,average_delay.values)plt.xlabel('Time (s)')plt.ylabel('Average Delay (s)')plt.title('Average Delay over Time')plt.show()可视化展示
基本图表绘制
4.1.1 折线图
折线图适合展示时间序列数据,可以直观地显示车辆速度随时间的变化趋势。以下是绘制每辆车的速度随时间变化的折线图的示例代码:
# 绘制每辆车的速度随时间变化的折线图forvehicle_id,groupindf.groupby('Vehicle_ID'):plt.plot(group['Time'],group['Speed'],label=f'Vehicle{vehicle_id}')plt.xlabel('Time (s)')plt.ylabel('Speed (km/h)')plt.title('Vehicle Speed over Time')plt.legend()plt.show()4.1.2 柱状图
柱状图适合展示分类数据的分布情况,例如每辆车的平均速度。以下是绘制每辆车的平均速度柱状图的示例代码:
# 绘制每辆车的平均速度柱状图average_speed.plot(kind='bar')plt.xlabel('Vehicle ID')plt.ylabel('Average Speed (km/h)')plt.title('Average Speed by Vehicle')plt.show()高级图表绘制
4.2.1 热力图
热力图适合展示多维数据的分布情况,例如每辆车在每个时间段的延误时间。以下是绘制热力图的示例代码:
importseabornassns# 假设每辆车在每个时间段的延误时间数据df['Vehicle_Lane']=df['Vehicle_ID'].astype(str)+'_'+df['Lane'].astype(str)pivot_table=df.pivot_table(index='Time',columns='Vehicle_Lane',values='Delay')# 绘制热力图sns.heatmap(pivot_table,cmap='coolwarm')plt.xlabel('Vehicle and Lane')plt.ylabel('Time (s)')plt.title('Delay Heatmap')plt.show()4.2.2 交互式图表
交互式图表可以提供更丰富的数据展示和探索功能,例如使用plotly绘制交互式折线图。以下是绘制交互式折线图的示例代码:
importplotly.expressaspx# 绘制交互式折线图fig=px.line(df,x='Time',y='Speed',color='Vehicle_ID',title='Vehicle Speed over Time')fig.show()报告生成
5.1 使用 Jupyter Notebook 生成报告
Jupyter Notebook 是一个强大的交互式文档工具,适合生成包含代码和图表的报告。以下是一个简单的 Jupyter Notebook 报告示例:
# 交通仿真结果分析报告 ## 数据提取 ### CSV 文件解析 ```python import pandas as pd # 读取 CSV 文件 df = pd.read_csv('simulation_results.csv') # 查看数据前几行 df.head()JSON 文件解析
importjsonimportpandasaspd# 读取 JSON 文件withopen('simulation_results.json','r')asfile:data=json.load(file)# 将 JSON 数据转换为 DataFramedf=pd.DataFrame(data)# 查看数据前几行df.head()使用仿真软件 API
fromsimulation_apiimportget_results# 获取仿真结果results=get_results()# 将结果转换为 DataFramedf=pd.DataFrame(results)# 查看数据前几行df.head()数据清洗
处理缺失值
# 生成包含缺失值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,None,20,0,5,10,15,20],'Position':[0,5,15,None,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行df.head()# 处理缺失值df.fillna(method='ffill',inplace=True)# 用前一个值填充缺失值# 查看处理后的数据df.head()处理异常值
# 生成包含异常值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,100,20,0,5,10,15,20],'Position':[0,5,15,30,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行df.head()# 识别并处理异常值df=df[df['Speed']<=30]# 过滤速度大于 30 的异常值# 查看处理后的数据df.head()数据类型转换
# 生成包含字符串类型 Time 列的 DataFramedf=pd.DataFrame({'Time':['0','1','2','3','4','0','1','2','3','4'],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,15,20,0,5,10,15,20],'Position':[0,5,15,30,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行df.head()# 转换 Time 列的数据类型df['Time']=df['Time'].astype(float)# 查看处理后的数据df.head()5.2 使用 Markdown 生成报告
Markdown 是一种轻量级的标记语言,适合生成简洁的文本报告。以下是一个简单的 Markdown 报告示例:
# 交通仿真结果分析报告 ## 数据提取 ### CSV 文件解析 ```python import pandas as pd # 读取 CSV 文件 df = pd.read_csv('simulation_results.csv') # 查看数据前几行 df.head()JSON 文件解析
importjsonimportpandasaspd# 读取 JSON 文件withopen('simulation_results.json','r')asfile:data=json.load(file)# 将 JSON 数据转换为 DataFramedf=pd.DataFrame(data)# 查看数据前几行df.head()使用仿真软件 API
fromsimulation_apiimportget_results# 获取仿真结果results=get_results()# 将结果转换为 DataFramedf=pd.DataFrame(results)# 查看数据前几行df.head()数据清洗
处理缺失值
# 生成包含缺失值的 DataFramedf=pd.DataFrame({'Time':[0,1,2,3,4,0,1,2,3,4],'Vehicle_ID':[1,1,1,1,1,2,2,2,2,2],'Speed':[0,5,10,None,20,0,5,10,15,20],'Position':[0,5,15,None,50,0,5,15,30,50],'Lane':[1,1,1,1,1,2,2,2,2,2]})# 查看数据前几行df.head()# 处理缺失值df.fillna(method='ffill',inplace=True)# 用前一个值填充缺失值# 查看处理后的数据df.head()