news 2026/4/15 10:21:45

效率爆炸!我用 Python + DeepSeek 写了个“能听懂人话”的 OCR 神器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
效率爆炸!我用 Python + DeepSeek 写了个“能听懂人话”的 OCR 神器

还在手动敲表格?还在为截图里的数据抓狂?
今天给大家分享一个我刚刚撸出来的 Python 神器——智能 OCR 表格提取助手。它不仅能一键把图片变 Excel,更厉害的是,它接入了DeepSeek V3,能自动帮你补全数据!


🔥 核心痛点,一键解决

作为一名经常和数据打交道的打工人,我最烦的就是:

  1. 截图转表格:对方发来一张截图,让我做成 Excel,几百行数据敲到手断。

  2. 表头乱飞:普通 OCR 识别出来全是散的,表头和数据混在一起,排序一按全乱了。

  3. 数据缺失:表格里只有“某某基金”,领导非要我填上“基金代码”,我又得一个个去百度。

于是,这个工具诞生了!


✨ 四大杀手级功能

1. 🖼️ 图片秒变可编辑表格

依托RapidOCR引擎,识别速度飞快。识别后的文字直接变成一个类似 Excel 的界面,双击就能改,右键就能删

2. 🔒 独创“表头/标题锁定”技术

这是市面上很多免费 OCR 工具都没有的细节!

  • 一键锁定表头:右键“将首行设为表头”,排序时它纹丝不动。
  • 智能识别标题:支持“标题+表头”双重锁定,完美还原复杂报表结构。

3. 🤖 DeepSeek AI 智能补全(王炸功能)

这是最硬核的地方!如果你的表格里有“基金名称”或者“公司名”,但缺少代码:

  • 选中那一列。
  • 右键点击DeepSeek: 智能补全基金代码
  • 见证奇迹:AI 会自动联网查询,并直接在表格里帮你插入一列新的代码

4. 📤 格式完美导出

所见即所得,你调整好的表格,直接导出为 Excel,连标题和列宽都给你安排得明明白白。


💻 核心代码大赏

不仅要好用,还要硬核。看看这几行代码,你就知道它为什么这么强。

📌 1. DeepSeek 深度集成 (AI Worker)

我们利用QThread实现了异步 AI 调用,界面不卡顿,体验丝般顺滑。

classDeepSeekWorker(QThread):finished=pyqtSignal(dict)defrun(self):# 直接调用 DeepSeek 官方 APIclient=OpenAI(api_key=self.api_key,base_url="https://api.deepseek.com")# 精心设计的 Prompt,强制输出 JSON 格式,方便程序解析prompt=f""" 你是一个专业的金融数据助手。请根据以下基金名称列表,查找并返回对应的中国基金代码。 要求:返回结果必须是严格的 JSON 格式 (Key: 名称, Value: 代码)。 列表:{json.dumps(self.fund_names,ensure_ascii=False)}"""response=client.chat.completions.create(model="deepseek-chat",messages=[{"role":"user","content":prompt}],stream=False)# 解析结果并回传给主界面self.finished.emit(json.loads(response.choices[0].message.content))

📌 2. 智能行列重组算法

普通的 OCR 只会给你一堆坐标,我们写了个算法,把它们“拼”回表格。

defsmart_merge_lines(self,result):# 先按 Y 轴聚类,判断是否在同一行# 再按 X 轴排序,还原列顺序boxes.sort(key=lambdab:b["cy"])# ... (省略中间复杂的几何计算) ...ifabs(box["cy"]-last_box["cy"])<avg_h*0.6:current_row.append(box)# 归为同一行# ...returnfinal_rows

🏆 为什么选择它?

  • 隐私安全:OCR 识别完全在本地运行,你的财务报表图片不会上传到任何云端(除非你主动点击 DeepSeek 查询)。
  • 极致轻量:基于 PyQt5 开发,启动秒开,不像 Electron 应用那样吃内存。
  • 无限扩展:今天它可以补全基金代码,明天改改 Prompt,它就能补全“英文翻译”、“股票市盈率”或者“公司地址”!

💡 总结:这不仅仅是一个 OCR 工具,它是你数据处理流程中的AI 增效器

增强 DeepSeek 的提示词策略,增加了 强力模糊匹配 :

  • 明确告诉 AI 注意 QDIL -> QDII 这种常见 OCR 错误。
  • 让 AI 忽略 A 、 C 、 混合 等后缀,专注于核心名称的匹配。
  • 要求 AI 在不确定时, 优先返回最相似的代码 ,而不是直接放弃。

👉 想要源码?
(关注公众号“向左向右立正”)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 8:50:35

联合编程(加载单个工具,ini读写,图片读写,setting存储)

加载单个工具例子//保存到一个地方 让vs进行读取namespace 加载单个pma工具 {public partial class Form1 : Form{CogPMAlignTool pma;public Form1(){InitializeComponent();cogRecordDisplay1.Fit();}//窗体加载事件private void Form1_Load(object sender, EventArgs e){//加…

作者头像 李华
网站建设 2026/4/12 11:53:50

C++优先队列详解与仿函数应用

基本特性头文件&#xff1a;#include <queue>命名空间&#xff1a;std底层实现&#xff1a;通常基于堆&#xff08;heap&#xff09;数据结构实现默认行为&#xff1a;大顶堆&#xff08;最大元素优先出队&#xff09;时间复杂度&#xff1a;插入元素&#xff1a;O(log n…

作者头像 李华
网站建设 2026/4/13 21:06:30

智能升级,效率飞跃——建广数科AI助手赋能企业数字化转型

在数字化转型浪潮中&#xff0c;企业如何让内部运营更智能、更高效&#xff1f;建广数科自主开发的AI助手产品线&#xff0c;正以其精准的场景化服务与强大的技术能力&#xff0c;为这一问题提供了领先的解决方案。作为企业级智能服务平台&#xff0c;AI助手基于自然语言处理与…

作者头像 李华
网站建设 2026/4/13 8:55:11

docker 镜像导入导出

如果原文件是用 docker save 导出的&#xff0c;应该用 docker load 而非 docker import&#xff1a;# 错误方式&#xff08;丢失元数据&#xff09; docker import mysql.tar mysql8:8.4# 正确方式&#xff08;保留完整元数据&#xff09; docker load -i mysql.tar

作者头像 李华
网站建设 2026/4/12 7:46:35

SpringBoot+Vue 政府管理系统管理平台源码【适合毕设/课设/学习】Java+MySQL

摘要 随着信息技术的快速发展&#xff0c;政府管理系统的数字化和智能化已成为提升行政效率和服务质量的重要手段。传统的政府管理模式依赖于纸质文件和人工操作&#xff0c;不仅效率低下&#xff0c;还容易出现数据丢失和错误。为了解决这些问题&#xff0c;基于现代信息技术…

作者头像 李华
网站建设 2026/4/14 3:12:20

Java SpringBoot+Vue3+MyBatis 网络海鲜市场系统系统源码|前后端分离+MySQL数据库

摘要 随着互联网技术的快速发展和电子商务的普及&#xff0c;线上交易平台已成为现代商业活动的重要组成部分。海鲜市场因其产品特殊性&#xff0c;对运输、储存和交易时效性要求较高&#xff0c;传统线下交易模式难以满足消费者对便捷性和多样性的需求。网络海鲜市场系统的开发…

作者头像 李华