抽凭工具 v1.0 使用指南

抽凭工具是一款本地运行的审计凭证智能识别工具。上传凭证文件(PDF/图片),自动完成文字识别和关键字段提取,生成 Excel 结果。

⚡ 数据安全:所有文件在您电脑本地处理,不上传至任何第三方服务器(OCR和AI识别通过API调用百度云和阿里云,仅传输图片数据进行识别)。

一、启动工具

Mac:双击 启动.command
Windows:双击 启动.bat

首次运行会自动安装依赖(约需1-2分钟),之后自动打开浏览器进入工具页面。

二、获取 API Key

工具需要两个 API Key,都是免费注册即可使用:

服务用途注册地址费用
百度云 OCR文字识别console.bce.baidu.com¥0.002/次(约2000次/月免费额度)
阿里云 DashScopeAI 字段提取dashscope.console.aliyun.com免费100万 Tokens(qwen3.6-flash 模型)

百度云 OCR 注册步骤

  1. 打开 百度智能云控制台
  2. 登录后点击「创建应用」→ 选择「通用文字识别(标准版)」→ 创建
创建百度OCR应用

▲ 选择「通用文字识别(标准版)」

  1. 创建后在应用列表可以看到 API KeySecret Key
  2. 将两个 Key 复制保存
百度云API Key获取步骤

▲ 百度云控制台 → 文字识别 → 应用列表 → 复制 API Key 和 Secret Key

阿里云 DashScope 注册步骤

  1. 打开 DashScope API-KEY 管理
  2. 登录阿里云账号(没有则注册并实名认证)
  3. 点击「创建 API-KEY」→ 复制保存
  4. 在模型用量中检查 qwen3.6-flash 或其他模型额度充足
阿里云DashScope API Key获取步骤

▲ 阿里云 DashScope → API-KEY 管理 → 创建并复制 Key

三、配置工具

首次打开工具,点击首页顶部的 ❶ 模型配置 → 点击配置模型

文字识别模型 标签页:
填入百度云的 API Key 和 Secret Key → 点击「测试连接」→ 显示 ✅连接正常 → 保存
关键字段判断模型 标签页:
填入阿里云的 API Key → 选择模型(推荐 qwen3.6-flash 免费)→ 点击「测试连接」→ 保存
保存位置 标签页:
确认结果保存路径(默认 ./outputs 即可)→ 保存
设置页面

四、处理凭证

1. 上传文件:拖拽或点击上传 PDF/JPG/PNG 格式的凭证文件(单次最多100页)
2. 选择模式:整套(每套凭证独立展示)或 非整套(按类型汇总)
3. 开始处理:点击按钮,等待 OCR 识别和 AI 提取
4. 下载结果:完成后下载 Excel 文件

处理过程中可以返回首页继续上传其他文件,任务在后台排队处理,右侧「历史结果」面板可实时查看进度。

五、查看历史结果

右侧「历史结果」面板显示所有处理记录:

六、常见问题

Q: 启动脚本闪退?
A: Mac 打开终端执行 python3 --version,如果没有,请安装 Python 3.9+。Windows 用 python --version

Q: 测试连接失败?
A: 检查 API Key 是否完整复制(不要有空格),确认百度/阿里云账户余额充足、未欠费。

Q: 处理很慢?
A: 处理速度取决于文件页数和选择的模型。qwen3.6-flash 约 20秒/页。OCR 阶段约15-30秒。

Q: Excel 结果不对?
A: AI 识别存在一定误差,建议人工核对关键字段(金额、日期、交易对手)。


抽凭工具 v1.0