中国大学MOOC(icourse163.org)是国内最大的在线教育平台之一,汇聚了全国数百所高校的优质课程资源。本文将带你使用 Python 爬取 MOOC 平台课程数据,从学科分布、院校贡献、学习热度等多维度进行深度分析。
一、项目概述
1.1 目标
- 爬取中国大学MOOC平台全部课程的基础信息(课程名、院校、学科、人数、评分等)
- 爬取课程详情页的章节目录、讲师团队、学员评价等深度数据
- 使用 SQLite 实现增量存储与去重
- 基于 pyecharts 构建多维度可视化分析
- 生成课程热度排行榜与学科趋势报告
1.2 技术栈
| 组件 | 用途 |
|---|---|
| DrissionPage |