• 自定义KV模板
  • 自定义表格模板
  • 单据票证信息抽取
  • 表格信息抽取
  • 长文档信息抽取
功能简介
自定义表格模板是针对固定版式的单页有框线表格表单数据提供一款定制化产品。用户仅需通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域,字段属性等,无需进行数据标注和模型训练,即可实现相同版式数据的自定义结构化识别抽取。经过配置调优的模板识别准确率可达85%以上。
同时工具箱中还提供分类器管理工具与字段类型管理工具,支持用户通过同一接口完成不同类型数据的自动分类路由与高精度识别。
功能优势
低样本

仅需提供一张样图即可完成模板搭建,无需标注

低门槛

通过拖拉拽可视化配置即可完成模板定义,无需二次开发

高效率

3-5分钟即可完成一个模板的配置

应用场景
少样本冷启动适用于业务数据样本少(少于20张)、需要快速上线验证的场景
数据版式固定版式固定的列表型有框线表格和KV型有框线表格,样式&元素&表头保持不变,但可以有单元格高度的调整或行数增加,例如医疗票据、体检报告识别等保险理赔、银行转账、年报审计、业务数据结构化等场景
体检报告
说明
  • 表格模板同时支持Key-Value型/列表型表格表单数据与表格线外字段识别
  • 暂不支持跨页的表格或字段识别
  • 列表型表格,表头区域需保持不变,识别区域可以有行数的变化,暂不支持合并单元格
年报审计
  • 表格内识别字段粒度最小为单元格,不支持小于单元格内的区域粒度识别
  • Key-Value型表格,可以有单元格高度的调整,不支持单元格的增加、拆分、删除
操作指南

创建自定义表格模板的流程如下图所示,仅需四步操作即可完成创建。更多信息及操作详见操作指南

操作指南

操作视频