news 2026/1/18 6:58:58

Pandas数据处理技巧全解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Pandas数据处理技巧全解析

Pandas数据处理技巧全解析

主要章节与要点

  1. UFO 报告数据(uforeports.csv

    • 读取:ufo = pd.read_csv('uforeports.csv')
    • 统计并查看类别分布:ufo['Shape Reported'].value_counts(dropna=False)(包括缺失值)
    • 填充缺失值:ufo['Shape Reported'].fillna(value='VARIOUS', inplace=True)将缺失值用VARIOUS替换
    • 常见行/列选择:使用loc选择指定行/列(例如ufo.loc[[0,1,2], :]ufo.loc[:, ['Colors Reported','Shape Reported','State']]
    • 条件过滤:ufo[ufo.City == 'Oakland']ufo.loc[ufo.City == 'Oakland','State']
    • 用例演示:删除列(.drop())、查看尾部数据(.head()/.tail()等)
  2. pandas 索引(Index)及drinksbycountry.csv

    • 读取:drinks = pd.read_csv('drinksbycountry.csv')
    • 查看索引与列:drinks.indexdrinks.columnsdrinks.shape
    • 将列设为索引:drinks.set_index('country', inplace=True),随后可用drinks.loc['Brazil','beer_servings']用国家名访问行。
    • 重置索引并恢复默认整数索引:drinks.reset_index(inplace=True)
    • 修改索引名称:drinks.index.name = 'country'drinks.index.name = None
    • 按索引或列进行统计:drinks.describe()和对统计结果的定位(例如drinks.describe().loc['25%','beer_servings']
  3. 选择多行多列与位置索引

    • loc用法:基于标签选择行列(可用行标签切片、列表或布尔掩码)。
    • iloc用法:基于整数位置选择(例如ufo.iloc[:,0:4])。
    • 列范围切片:ufo.loc[:, 'Colors Reported':'Time'](使用列名范围切片)
  4. 其它实用示例

    • 读取无表头、使用自定义分隔符的文件:pd.read_table('movieusers.csv', header=None, sep='|')
    • 统计并排序:drinks.continent.value_counts().sort_index()

关键代码片段(摘录并简短说明)

  • 填充缺失值并统计:
ufo['Shape Reported'].value_counts(dropna=False)ufo['Shape Reported'].fillna(value='VARIOUS',inplace=True)ufo['Shape Reported'].value_counts()

说明:先查看包含 NaN 的统计,再用fillna填充,最后确认填充结果。

  • 索引设置与定位:
drinks=pd.read_csv('drinksbycountry.csv')drinks.set_index('country',inplace=True)drinks.loc['Brazil','beer_servings']

说明:把country设置为索引后,可直接用国家名定位对应行的数据。

  • loc/iloc示例:
# 基于标签选择:ufo.loc[[0,1,2],:]# 基于位置选择:ufo.iloc[:,0:4]# 选择列范围:ufo.loc[:,'Colors Reported':'Time']
  • 描述性统计定位:
drinks.describe().loc['25%','beer_servings']
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/25 2:43:31

终极Microsoft.UI.Xaml完整指南:从零构建Fluent设计应用

终极Microsoft.UI.Xaml完整指南:从零构建Fluent设计应用 【免费下载链接】microsoft-ui-xaml Windows UI Library: the latest Windows 10 native controls and Fluent styles for your applications 项目地址: https://gitcode.com/GitHub_Trending/mi/microsoft…

作者头像 李华
网站建设 2026/1/17 23:12:30

DETR目标检测终极实战:构建稳健性检测系统的完整指南

DETR目标检测终极实战:构建稳健性检测系统的完整指南 【免费下载链接】detr End-to-End Object Detection with Transformers 项目地址: https://gitcode.com/gh_mirrors/de/detr 在工业级目标检测应用中,单一模型往往难以应对复杂多变的实际场景…

作者头像 李华
网站建设 2026/1/16 1:48:24

[包含核心关键词的强力标题]

[包含核心关键词的强力标题] 【免费下载链接】VmwareHardenedLoader Vmware Hardened VM detection mitigation loader (anti anti-vm) 项目地址: https://gitcode.com/gh_mirrors/vm/VmwareHardenedLoader [前100字内自然融入核心关键词的内容... [操作性副标题1] [使…

作者头像 李华
网站建设 2025/12/24 23:01:03

面部表情识别终极指南:基于PyTorch的高性能深度学习实现

面部表情识别终极指南:基于PyTorch的高性能深度学习实现 【免费下载链接】Facial-Expression-Recognition.Pytorch A CNN based pytorch implementation on facial expression recognition (FER2013 and CK), achieving 73.112% (state-of-the-art) in FER2013 and …

作者头像 李华
网站建设 2025/12/24 19:15:03

基于微信小程序的水上警务通设计与开发毕业设计项目源码

基于微信小程序的水上警务通系统,直击 “水上执法信息查询慢、出警调度不及时、证据留存不规范、群众报案渠道少” 的核心痛点,依托微信小程序轻量化、易触达的优势,构建 “执法管控 出警调度 便民服务 数据溯源” 的一体化水上警务管理平…

作者头像 李华