news 2026/4/16 0:05:38

边走边聊 Python 3.8:Chapter 9:pandas 数据处理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
边走边聊 Python 3.8:Chapter 9:pandas 数据处理

Chapter 9:pandas 数据处理

数据处理是现代编程的核心能力,而 pandas 是 Python 世界最强大的数据工具。本章将带你理解 DataFrame 的结构、索引、筛选、清洗、导出等关键操作,并通过真实数据集完成一次完整的数据分析流程。你会发现:当你能驾驭数据,你就能驾驭信息。


“数据不会说话,但 pandas 能让它开口。”

大家好!前面我们用 requests/Scrapy 抓了豆瓣 Top 250,也讲了 HTTP 和 Scrapy 框架。今天进入数据处理阶段:把爬来的 CSV/JSON/Excel 变成有用报表。主角就是pandas—— Python 数据处理的“瑞士军刀”。

本篇全部代码在Python 3.8 + Windows 7上实测通过(2026 年最新兼容版),老机器也能流畅运行。目标:拿自己过去一年的手机记账 CSV,自动生成月度收支报表并导出 Excel。

1. 准备工作(Win7 + Python 3.8 专属安装)

  1. 确认版本

    python --version

    必须是Python 3.8.x

  2. 安装 pandas 兼容版(一次搞定):

    pip install pandas==2.0.3 numpy==1.24.4 openpyxl
    • pandas==2.0.3是最后一个官方完美支持 Python 3.8 的版本(Win7 64位/32位都有 wheel)。
    • numpy 是 pandas 底层引擎,必须先装兼容版。
    • openpyxl 用来导出 Excel(第8篇已装)。

    Win7 安装坑:如果报 “Microsoft Visual C++ 14.0 required”,先安装 Visual C++ Build Tools 2019(Win7 兼容版),勾选 Desktop development with C++。

    安装完验证:

    importpandasaspdprint(pd.__version__)# 应显示 2.0.3

2. pandas 基础:Series 和 DataFrame

底层原理(简单说)
pandas 底层完全依赖numpy

  • Series= 一维数组(numpy.ndarray + 索引)
  • DataFrame= 多列 Series 拼成的表格(类似 Excel)
    所有运算都是向量化(vectorized),用 C 语言底层执行,速度比纯 Python 循环快几十倍。
    源码里 DataFrame 就是一个 dict,key 是列名,value 是 Series。

实战代码(直接复制运行):

importpandasaspdimportnumpyasnp# Series(一维)s=pd.Series([100,200,300],index=['一月','二月','三月'])print(s)print("类型:",type(s))# <class 'pandas.core.series.Series'>print("底层 numpy 数组:",s.values)# numpy.ndarray# DataFrame(二维)data={'日期':['2025-01-15','2025-02-20','2025-03-10'],'类别':['餐饮','交通','购物'],'金额':[45.5,12.0,88.0]}df=pd.DataFrame(data)print(df)print("形状:",df
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 0:00:21

3个让你效率翻倍的离线思维导图技巧:DesktopNaotu深度指南

3个让你效率翻倍的离线思维导图技巧&#xff1a;DesktopNaotu深度指南 【免费下载链接】DesktopNaotu 桌面版脑图 (百度脑图离线版&#xff0c;思维导图) 跨平台支持 Windows/Linux/Mac OS. (A cross-platform multilingual Mind Map Tool) 项目地址: https://gitcode.com/gh…

作者头像 李华
网站建设 2026/4/15 23:58:40

2026年3月 GESP CCF编程能力等级认证Python二级真题

答案和更多内容请查看网站&#xff1a;【试卷中心 ----->电子学会 ----> Python ----> 二级】 网站链接 青少年软件编程历年真题模拟题实时更新 青少年软件编程&#xff08;Python&#xff09;等级考试试卷&#xff08;二级&#xff09; 一、单选题 …

作者头像 李华
网站建设 2026/4/15 23:58:26

【uniapp2.0】真机测试中安全区域与导航栏样式冲突的解决方案

1. 真机测试中的安全区域与导航栏冲突现象 最近在uniapp2.0项目中做真机测试时&#xff0c;发现一个奇怪的现象&#xff1a;在iPhone设备上运行应用时&#xff0c;页面底部总会出现一块莫名其妙的空白区域。这块空白区域的高度刚好和导航栏高度一致&#xff0c;导致页面布局整体…

作者头像 李华