在数据分析和处理中,如何有效地从时间格式的数据中提取和计算统计信息是一个常见的问题。本文将介绍如何使用R语言中的aggregate函数来计算骑行时长(ride_length)的平均值,并且将结果按会员类型(member_casual)分类展示。
数据背景
我们有一个包含骑行数据的data.frame,其中包含以下几列:
rideable_type:骑行车辆类型。day_of_week:骑行发生的星期几。ride_length:骑行时长,格式为hh:mm:ss。member_casual:骑行者身份,区分会员(member)和非会员(casual)。
问题描述
我们的目标是计算ride_length的平均值,并按member_casual进行分组。以下是尝试解决这个问题的一些步骤和遇到的挑战:
使用
lubridate库:df %>% group_by(member_casual) %>% seconds