news 2026/5/13 18:11:32

UnicodeDecodeError: ‘charmap‘ codec can‘t decode byte 0x81 in position 17: character maps to <undefi

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
UnicodeDecodeError: ‘charmap‘ codec can‘t decode byte 0x81 in position 17: character maps to <undefi

目录

    • 问题
    • 原因分析
      • 1. **编码不匹配**
      • 2. **常见场景**
    • 解决方案
      • **方案1:设置正确的字符集连接MySQL**
      • **方案2:Python脚本中的解决方案**
      • **方案3:检查并设置系统环境编码**
      • **方案4:MySQL服务器端配置检查**
      • **方案5:在代码中明确处理编码**
    • 预防措施
    • 调试步骤

问题

连接MySQL服务,查询到结果后,本地解析报错
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 17: character maps to <undefined>

这个错误通常是由于字符编码不一致导致的。

原因分析

1.编码不匹配

  • MySQL服务器使用的字符集(如UTF-8)与本地解码时使用的字符集(如Windows的cp1252、gbk等)不一致
  • 特别是当数据中包含非ASCII字符(如中文、特殊符号)时容易出现

2.常见场景

  • 在Windows系统或某些终端环境中运行Linux命令/脚本
  • MySQL数据包含中文或其他多字节字符
  • 默认编码设置不正确

解决方案

方案1:设置正确的字符集连接MySQL

# 在连接时指定字符集mysql -hhostname-u username -p --default-character-set=utf8mb4 database_name# 或者在查询前设置mysql -hhostname-u username -p mysql>SET NAMES'utf8mb4';mysql>SELECT * FROM table;

方案2:Python脚本中的解决方案

如果使用Python连接MySQL:

importpymysql# 正确设置连接字符集connection=pymysql.connect(host='localhost',user='username',password='password',database='dbname',charset='utf8mb4',cursorclass=pymysql.cursors.DictCursor)# 或者使用mysql-connectorimportmysql.connector conn=mysql.connector.connect(charset='utf8mb4',use_unicode=True,# ... 其他参数)

方案3:检查并设置系统环境编码

# 查看当前系统编码echo$LANGlocale# 设置正确的编码(添加到~/.bashrc或~/.profile)exportLANG=en_US.UTF-8exportLC_ALL=en_US.UTF-8# 临时设置exportPYTHONIOENCODING=utf-8

方案4:MySQL服务器端配置检查

-- 查看当前字符集设置SHOWVARIABLESLIKE'character_set%';SHOWVARIABLESLIKE'collation%';-- 修改表的字符集(如果需要)ALTERTABLEyour_tableCONVERTTOCHARACTERSETutf8mb4COLLATEutf8mb4_unicode_ci;

方案5:在代码中明确处理编码

对于Python脚本:

# 方法1:指定编码打开文件withopen('output.txt','w',encoding='utf-8')asf:f.write(data)# 方法2:手动解码decoded_string=byte_data.decode('utf-8',errors='ignore')# 或 errors='replace'# 方法3:使用编解码器模块importcodecswithcodecs.open('file.txt','r',encoding='utf-8')asf:content=f.read()

预防措施

  1. 统一使用UTF-8/UTF8MB4

    • MySQL连接、表字段、应用程序统一使用utf8mb4
    • 这是最推荐的做法
  2. 检查MySQL配置

    -- 永久修改配置(在my.cnf中)[client]default-character-set=utf8mb4[mysql]default-character-set=utf8mb4[mysqld]character-set-server=utf8mb4 collation-server=utf8mb4_unicode_ci
  3. Python环境设置

    # 在脚本开头添加importsysimportio sys.stdout=io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')

调试步骤

  1. 首先确认MySQL数据的实际编码
  2. 检查连接时的字符集设置
  3. 验证本地环境的编码配置
  4. 逐步测试每个环节的编码转换

建议使用UTF-8系列编码(特别是utf8mb4)作为标准,可以避免大部分字符编码问题。

最后排查下来,上面报错问题原因是连接MySQL 8时,连接参数中字符集使用了’utf-8’ 导致的。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 6:04:40

【超详细】大模型学习路线图,从入门到应用(建议收藏)

本文为非从业者提供了一条大模型学习的快速入门路径&#xff0c;强调入门难度不高且投入不大。文章从神经网络基础开始&#xff0c;逐步介绍CNN、RNN、Transformer结构&#xff0c;再到大模型原理、训练优化、部署应用等&#xff0c;最后涵盖GPU算力知识。作者建议采用工程师式…

作者头像 李华
网站建设 2026/5/11 16:14:04

GLM-ASR-Nano-2512:中文方言识别与低音量语音处理的最佳开源方案

GLM-ASR-Nano-2512是智谱Z.AI开源的1.5B参数语音识别模型&#xff0c;专注于中文方言识别和低音量语音处理&#xff0c;性能超越Whisper。支持粤语等多种方言&#xff0c;能识别低音量语音&#xff0c;错误率仅4.10%。适合企业会议转写、客服中心等场景&#xff0c;支持本地部署…

作者头像 李华
网站建设 2026/5/10 5:48:34

智能摄像头在智能车道路视频采集中的关键技术及应用解析

摄像头在智能车道路视频采集中的应用&#xff0c;主要依赖于其高精度图像捕捉、多角度采集、实时处理与传输以及智能分析等能力&#xff0c;以下是对其关键环节及技术要点的详细分析&#xff1a;一、摄像头在智能车道路视频采集中的核心作用高精度图像捕捉 &#xff1a;摄像头作…

作者头像 李华
网站建设 2026/5/10 2:05:48

学霸同款2026 AI论文写作软件TOP9:研究生开题报告必备测评

学霸同款2026 AI论文写作软件TOP9&#xff1a;研究生开题报告必备测评 2026年学术写作工具测评&#xff1a;为何需要这份榜单&#xff1f; 随着人工智能技术的不断进步&#xff0c;AI论文写作软件已成为研究生群体提升科研效率的重要工具。然而&#xff0c;市场上产品繁多&…

作者头像 李华
网站建设 2026/5/9 22:53:48

基于Java的工程机械设备智慧管理系统的设计与实现全方位解析:附毕设论文+源代码

1. 为什么这个毕设项目值得你 pick ? 工程机械设备智慧管理系统主要功能模块涵盖机械设备档案管理、供应商管理和客户管理等&#xff0c;适用于普通员工和部门领导角色。该系统使用SpringMVC开发框架与MySQL数据库构建&#xff0c;旨在提高管理水平并优化资源配置效率。相较于…

作者头像 李华