人工智能实战:RAG 一遇到表格就答错?PDF 表格解析、结构化切分与单元格级检索完整方案
一、问题场景:普通文本问答很准,一遇到表格就翻车
很多企业知识库里的关键信息并不是普通段落,而是表格。
例如:
1. 报销标准表 2. 产品价格表 3. SLA 等级表 4. 权限矩阵表 5. 薪资等级表 6. 项目排期表 7. 参数配置表纯文本 RAG 做得不错,不代表表格问答也能做好。
我之前遇到过一个典型问题。
原始表格如下:
| 城市类型 | 普通员工 | 销售客户拜访 |
|---|---|---|
| 一线城市 | 500元 | 650元 |
| 二线城市 | 350元 | 450元 |
用户问:
销售去二线城市拜访客户,住宿费最多报销多少?