news 2026/4/15 19:09:51

Python酷库之旅-第三方库Pandas(051)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python酷库之旅-第三方库Pandas(051)

Pandas 简介

Pandas 是 Python 中用于数据分析和操作的核心库,提供高效的数据结构(如DataFrameSeries)以及数据处理工具,广泛应用于数据清洗、转换、分析和可视化场景。

核心数据结构

DataFrame
二维表格型数据结构,类似电子表格或 SQL 表,支持行标签和列标签。

import pandas as pd df = pd.DataFrame({"A": [1, 2, 3], "B": ["x", "y", "z"]})

Series
一维带标签数组,可视为 DataFrame 的单列。

s = pd.Series([10, 20, 30], name="values")

数据读取与写入

支持多种格式:

# 从 CSV 读取 df = pd.read_csv("data.csv") # 写入 Excel df.to_excel("output.xlsx", index=False) # 支持 JSON、SQL、HTML 等格式

数据操作

筛选与查询

# 选择列 df["A"] # 条件筛选 df[df["A"] > 1] # 多条件 df[(df["A"] > 1) & (df["B"] == "y")]

聚合与分组

# 分组统计 df.groupby("B")["A"].sum() # 多列聚合 df.agg({"A": "mean", "B": "count"})

缺失值处理

# 检测缺失值 df.isnull() # 填充或删除 df.fillna(0) df.dropna()

时间序列处理

内置时间类型转换与重采样:

# 转换时间列 df["date"] = pd.to_datetime(df["date"]) # 按周重采样 df.resample("W", on="date").sum()

性能优化技巧

  • 使用df.apply()替代循环。
  • 避免链式操作,优先使用df.loc[]
  • 大数据集考虑dtype优化(如category类型)。

集成其他工具

  • 可视化:结合matplotlibseaborn直接绘图。
  • 机器学习:与scikit-learn无缝衔接,输入数据格式多为 DataFrame。

学习资源

  • 官方文档:pandas.pydata.org
  • 《Python for Data Analysis》书籍(作者:Pandas 创始人 Wes McKinney)。

通过掌握上述功能,可高效完成从数据预处理到分析的全流程任务。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/13 13:52:48

ArcGIS大师之路500技---060打断相交线

文章目录前言一、需求说明二、打断相交线前言 本文介绍使用打断相交线工具实现在相交的地方分割所有选定的线要素,并删除任何重叠的线段,拓扑容差用于搜索相交点。 一、需求说明 样例数据如下图,四条线两两相交,并且选中的线是两…

作者头像 李华
网站建设 2026/4/4 23:41:52

2024年IEEE TITS SCI2区TOP,考虑无人机能耗与时间窗的卡车–无人机协同路径规划,深度解析+性能实测

目录1.摘要2.问题描述3.提出的算法4.结果展示5.参考文献6.代码获取7.算法辅导应用定制读者交流1.摘要 在考虑客户时间窗的条件下,本文研究多卡车–多次访问无人机协同配送问题,综合建模无人机能耗及载重变化对能耗率的影响。通过MILP模型刻画问题&#…

作者头像 李华
网站建设 2026/4/11 19:22:52

选对交流状态采集模块,让工业自动化更高效、更稳定

交流状态采集模块是工业自动化系统中的数据感知核心部件,主要用于实时采集交流回路的电压、电流、频率、功率因数、有功/无功功率等关键电气参数,再通过标准化工业通信协议将数据上传至PLC、SCADA、物联网云平台等上层系统,为设备监控、能耗管…

作者头像 李华
网站建设 2026/4/10 11:41:13

中小工厂也能用上的远程控制系统,门槛到底有多低?

在工业4.0浪潮推动下,传统工业生产模式面临设备管控分散、运维响应滞后、生产效率受限等痛点。工业远程控制系统借助物联网技术打破空间壁垒,实现对工业设备全生命周期的精准管控、数据实时交互与智能决策,成为企业数字化转型的核心支撑。工业…

作者头像 李华
网站建设 2026/4/9 5:18:20

教学场景的智能化转型:当AI云桌面与私有化部署成为关键基石

在教育信息化迈向深水区的今天,教学模式的革新与数据安全的保障成为并重的核心议题。传统的计算机实验室与管理模式,正面临资源调配僵化、运维负担沉重、跨平台协作困难以及数据安全风险等多重挑战。在此背景下,融合了人工智能技术的云桌面解…

作者头像 李华
网站建设 2026/3/21 1:24:06

嵌入式第四十五篇——51单片机基础

一、GPIO(Genral Purpose Input Output,通用输入输出) 1、输出模式:控制引脚输出高电平/低电平(给定控制信号) (1)开漏输出 (2)推挽输出 (3)复用开漏 (4)复用推挽 2、输入模式:检测引脚的电平(接收外部信号…

作者头像 李华