news 2026/5/12 18:18:09

CSV的使用方法介绍

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CSV的使用方法介绍

CSV(Comma-Separated Values)格式的数据文件片段,通常用于存储表格型数据。这种格式可以用在 Excel、Python、R、数据库等工具中进行读取和处理。


📌 一、CSV 格式简介

CSV 是一种纯文本格式,每行代表一条记录,字段之间用逗号(,)分隔。
第一行通常是列名(header),后续每一行是一条数据。

你的 CSV 示例结构如下:

1id,category,name_cn,name_en,unit,value,value_low,value_high,year,source,region,gwp_version,stage_e 2F001,能源-电力,华东电网-电力因子(GHG2022),East China Grid electricity factor (GHG2022),kgCO2e/kWh,0.483,0.45,0.52,"2023","临时默认-供方/文献","中国","AR6","B"

✅ 二、如何使用这个 CSV?

方法 1:用 Excel 打开
  1. 将这段文本保存为.csv文件(如emission_factors.csv
  2. 双击打开,Excel 会自动识别并显示成表格形式。
  3. 可以直接查看、筛选、排序、计算等。

⚠️ 注意:如果包含中文或特殊字符,建议保存为 UTF-8 编码,否则可能出现乱码。


方法 2:用 Python 读取(推荐)
python
1import pandas as pd 2 3# 读取 CSV 文件 4df = pd.read_csv('emission_factors.csv', encoding='utf-8') 5 6# 查看前几行 7print(df.head()) 8 9# 按类别筛选,比如“燃料” 10fuel_data = df[df['category'] == '燃料'] 11 12# 查询某个因子的值 13r410a_gwp = df[df['name_cn'] == 'R410A GWP'] 14print(r410a_gwp[['value', 'value_low', 'value_high']])

🔧 安装依赖:pip install pandas


方法 3:用 R 语言读取

编辑

1library(readr) 2df <- read_csv("emission_factors.csv", locale = locale(encoding = "UTF-8")) 3head(df)

方法 4:用数据库导入(如 SQLite / MySQL)

你可以将 CSV 导入数据库:

sql

1-- SQLite 示例 2.import emission_factors.csv emission_factors

或者通过编程方式(Python + sqlite3)批量插入。


🧩 三、字段说明(根据你的数据)

字段含义
id唯一标识符
category分类(如能源、燃料、制冷剂等)
name_cn中文名称
name_en英文名称
unit单位(如 kgCO2e/kWh)
value排放因子主值
value_low,value_high不确定性范围
year数据年份
source来源描述
region地理区域
gwp_version全球变暖潜势版本(如 AR6)
stage_e生命周期阶段

💡 四、典型用途

这类数据常用于:

  • 碳排放核算(如企业碳盘查)
  • LCA(生命周期评估)
  • 清洁生产与绿色供应链管理
  • 政府或行业标准参考

例如:

计算某工厂用电量 1000 kWh,则其 CO₂ 排放为:
1000 × 0.483 = 483 kgCO₂e(基于 F001 行)


✅ 五、注意事项

  1. 编码问题:确保保存时使用 UTF-8 编码,避免中文乱码。
  2. 引号包围:某些字段含逗号或空格,需要用双引号包裹(如"2023")。
  3. 缺失值:有些字段可能为空(如""),需注意处理。
  4. 更新频率:注意yearsource,不同来源的数据精度差异大。

📎 六、小技巧

  • 使用 Google Sheets 在线编辑 CSV。
  • 使用 VS Code 或 Notepad++ 查看原始文本。
  • 如果需要转换为 JSON 或其他格式,可用 Pandas 轻松实现。

python

1df.to_json('emission_factors.json', orient='records', force_ascii=False)

遇到的“字体不识别”问题,其实是CSV 文件中的中文字符在 Excel 中显示为乱码(如“鏁芥箘-鐢”),这是典型的编码格式不匹配导致的问题。


❌ 问题原因

你在用 Excel 打开 CSV 文件时看到的乱码(如鏁芥箘-鐢),是因为:

🚫CSV 文件是以 UTF-8 编码保存的,但 Excel 默认用 ANSI 或 GBK 等编码打开,导致中文无法正确解析。

Excel 在读取 CSV 时,不会自动识别 UTF-8 编码,尤其是当文件没有 BOM(Byte Order Mark)头时,它会误判为其他编码,从而造成乱码。


✅ 正确解决方案

✅ 方法一:使用「文本导入向导」(推荐)

这是最可靠的方式,适用于所有版本的 Excel。

操作步骤:
  1. 打开Excel
  2. 点击菜单栏 →数据从文本/CSV
  3. 选择你的.csv文件
  4. 在弹出窗口中点击加载
  5. 出现「文本导入向导」,选择:
    • 文件原点:选择“65001: Unicode (UTF-8)”
    • 分隔符号:勾选逗号
    • 列数据格式:默认即可
  6. 点击完成

✅ 这样就能正确显示中文了!

💡 提示:如果你是 Windows 系统,也可以尝试右键点击 CSV 文件 → “打开方式” → “Excel”,然后手动选择编码。


✅ 方法二:添加 BOM 头(让 Excel 自动识别)

将 CSV 文件保存为带有BOM 的 UTF-8格式,这样 Excel 可以自动识别。

如何操作?
✔️ 使用记事本(Notepad):
  1. 打开你的 CSV 文件
  2. 点击「文件」→「另存为」
  3. 选择保存类型为:“所有文件”
  4. 文件名后缀写.csv
  5. 在编码下拉框中选择:“UTF-8 with BOM”
  6. 保存

⚠️ 注意:不是所有编辑器都支持“带 BOM”的 UTF-8,建议使用 Notepad++ 或 VS Code。


✅ 方法三:用 Python 生成正确的 CSV(推荐用于自动化)

如果你是从代码生成或处理这个 CSV,可以用 Python 正确写出带 BOM 的 UTF-8 文件:

python

1import pandas as pd 2 3# 假设 df 是你的 DataFrame 4df.to_csv('emission_factors.csv', encoding='utf-8-sig', index=False)

🔍utf-8-sig表示 UTF-8 + BOM,Excel 能自动识别。


✅ 方法四:用在线工具转换

你可以上传 CSV 到以下网站进行编码转换:

  • https://www.online-convert.com
  • 或使用 Text Encoding Converter

选择输入编码为 UTF-8,输出为 UTF-8 with BOM,再下载即可。


🛠 额外建议

项目建议
✅ 文件扩展名必须是.csv,不要改成.txt
✅ 编码格式保存为UTF-8 with BOM或使用utf-8-sig
✅ 字符集不要包含特殊符号、制表符等(除非明确需要)
✅ 工具推荐优先使用VS Code / Notepad++ / Python编辑 CSV

🧪 验证是否成功

你可以测试一下:

  • 打开 Excel → 数据 → 从文本/CSV
  • 选择文件 → 设置编码为 UTF-8
  • 查看是否显示正常中文,例如:
    1F001,能源-电力,华东电网-电力因子(GHG2022),...

如果显示的是“鏁芥箘-鐢”,说明还是没用对编码;如果是“能源-电力”,就成功了!


🔚 总结

问题原因解决方案
中文乱码Excel 误判编码使用「文本导入向导」选择 UTF-8
乱码持续存在文件无 BOM用记事本另存为 UTF-8 with BOM
自动化处理需要稳定输出用 Python 写入utf-8-sig
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/12 18:17:52

龙为权,凰为心:凰标守住文化最柔软的底线@凤凰标志

龙为权凰为心 中国文艺生态的双轨平衡宣言秩序权力与创作初心&#xff0c;一刚一柔&#xff0c; 如日月轮值&#xff0c;缺一不可。 龙标掌「权」&#xff0c;凰标守「心」&#xff0c; 双轨并行&#xff0c;方可让文化既筋骨强健&#xff0c;又血肉温润。一、龙标&#xff1a;…

作者头像 李华
网站建设 2026/5/12 18:14:30

Linux Idle 调度器的 cpuidle_select:Idle 状态的智能选择

简介在 Linux 内核调度体系中&#xff0c;除了 CFS 普通调度、RT 实时调度、Deadline 硬实时调度之外&#xff0c;Idle 空闲调度器是整个系统功耗管理与基础调度闭环中最容易被忽视、却至关重要的一环。当 CPU 运行队列中没有就绪用户任务、内核任务可调度时&#xff0c;内核会…

作者头像 李华
网站建设 2026/5/12 18:13:42

HFSS进阶实战:波导S参数仿真与场分布可视化

1. 波导仿真基础与HFSS环境准备 波导作为微波工程中的核心传输结构&#xff0c;其性能分析离不开专业的电磁仿真工具。HFSS&#xff08;High Frequency Structure Simulator&#xff09;作为业界公认的三维全波电磁场仿真黄金标准&#xff0c;能够精确模拟各类波导结构的电磁特…

作者头像 李华
网站建设 2026/5/12 18:13:42

特征分箱实战:从WOE/IV评估到有监督分箱的金融风控应用

1. 特征分箱在金融风控中的核心价值 我第一次接触特征分箱是在做一个信用卡违约预测项目时。当时模型对收入这个特征的拟合效果总是不理想&#xff0c;直到我把连续的收入数值分成了"低中高"三个区间&#xff0c;AUC指标立刻提升了8%。这种化腐朽为神奇的效果让我意识…

作者头像 李华