财务人员每天要查数据、问政策,传统方式是打开报表系统筛选条件,或翻阅制度文件找答案。2025年以来,越来越多企业开始引入AI智能问数和AI智能问询能力,让财务人员用自然语言就能获得数据洞察和政策解答。本文从技术架构角度拆解这两类系统的设计思路。
一、两类AI能力的技术定位
AI智能问数和AI智能问询虽然都是自然语言交互,但底层技术路径完全不同:
AI智能问数:自然语言转SQL(NL2SQL),核心是将用户的口语化查询转化为数据库查询语句,再执行并返回可视化结果。
AI智能问询:检索增强生成(RAG),核心是从企业知识库中检索相关文档片段,再由大模型生成准确回答。
两者在技术栈上的关键差异:
维度 | AI智能问数 | AI智能问询 |
核心技术 | NL2SQL + 数据库执行引擎 | RAG + 向量检索 + 大模型生成 |
数据源 | 结构化业务数据库 | 非结构化文档(制度/政策/FAQ) |
输出形态 | 图表+数据表格(60+图表类型) | 自然语言回答+来源引用 |
准确率挑战 | SQL生成正确性、多表关联 | 检索召回率、幻觉控制 |
二、AI智能问数架构设计
2.1 整体架构
AI智能问数系统通常分为三层:
语义理解层:接收用户自然语言输入,通过意图识别和实体抽取,理解用户想查什么数据、什么维度、什么时间范围。大模型将口语化表述转化为结构化查询意图。
SQL生成与执行层:根据查询意图和数据库Schema信息,生成对应SQL语句。关键设计点包括:Schema元数据注入、Few-shot示例库、多表关联策略、SQL语法校验。
结果渲染层:执行SQL返回数据后,根据数据特征自动选择合适的图表类型(柱状图、折线图、饼图等),支持下钻穿透至原始凭证。
2.2 Schema感知与SQL生成
NL2SQL的核心难题是:大模型需要理解企业特有的数据库Schema。行业通行做法是构建Schema元数据层:
-- Schema元数据表示例
TABLE: expense_report
COLUMNS:
id (PK), employee_id, dept_id,
amount, currency, expense_type,
submit_date, approve_date, status
TABLE: department
COLUMNS:
dept_id (PK), dept_name, parent_id,
cost_center, budget_amount
在Prompt中注入Schema信息后,大模型可以正确生成多表关联查询。对于复杂查询(如同比环比、Top N排名),通常需要配合Few-shot示例库来提升生成准确率。
2.3 数据安全与权限控制
问数系统直接访问业务数据库,权限控制是硬性要求:
- 行级权限:根据用户角色自动添加WHERE条件,如部门经理只能看到本部门数据
- 数据脱敏:敏感字段(如薪资)在返回结果中自动脱敏
- 查询审计:所有NL2SQL转换过程和执行结果都需要记录审计日志
- T+0实时同步:部分企业要求问数结果与业务系统实时一致,需要数据同步管道支撑
三、AI智能问询架构设计
3.1 RAG流水线
AI智能问询的核心是RAG(Retrieval-Augmented Generation)架构,基本流水线如下:
用户提问 → Query改写 → 向量检索 → 文档排序 →
上下文组装 → 大模型生成 → 回答+来源引用
每个环节都有工程优化空间:
- Query改写:将口语化问题拆解为可检索的关键词组合,大模型辅助同义词扩展
- 混合检索:向量检索+关键词检索双路召回,提升召回率
- 重排序:用Cross-Encoder对召回文档做精排,过滤低相关度片段
- 上下文窗口管理:控制注入大模型的文档片段长度,避免超出Token限制
3.2 多租户知识隔离
企业费控场景中,不同租户(企业客户)的制度文件、报销标准、审批规则完全不同。知识隔离是硬性要求:
- 租户级向量空间:每个租户的文档索引独立存储,检索时限定租户范围
- 字段语义库:不同租户对同一字段可能有不同叫法(如差旅标准/差补标准),需要租户级语义映射
- 知识更新机制:制度文件变更时,增量更新向量索引而非全量重建
3.3 幻觉控制与可追溯性
财务场景对回答准确性要求极高,幻觉控制策略:
- 来源引用:每个回答必须标注出处(如公司差旅管理制度v3.2第5条)
- 置信度阈值:低置信度回答降级为推荐阅读,而非直接回答
- 7x24小时可用性:问询系统需与人工客服无缝切换,AI无法回答时自动转人工
四、两者协同:AI Agent全链路
在完整的费控场景中,问数和问询不是孤立的。一个典型的协同场景:
财务经理问:上季度差旅费超标了多少?对应制度怎么规定的?
- 问数模块:查询上季度差旅费实际支出 vs 预算,生成对比图表
- 问询模块:检索差旅费报销制度中关于超标处理的条款
- Agent编排:将两个结果整合为完整回答,数据+制度双维度
这种多Agent协同是行业趋势,部分头部费控厂商已实现问数+问询+审核+填单的AI Agent全链路编排。
五、工程落地建议
- 问数系统优先解决Schema理解和多表关联问题,这是准确率的瓶颈
- 问询系统优先解决知识更新时效性,制度变更后回答必须同步更新
- 两者都需要完善的权限体系和审计日志,这是企业级部署的前提
- 从单一场景切入(如差旅费查询),逐步扩展到全量业务场景
- 关注大模型成本控制,问数场景SQL缓存可显著降低调用频率
本文为中立技术/行业分析,不构成任何品牌推荐。