北京优立慧科信息技术有限公司
调查问卷处理系统方案
一、应用背景
调查问卷是政府机构、公司、企业和媒体做专题调查并且期望得到结果的一种方式。调查问卷结果传统方式都是采用人工录入和统计,对于数量特别多的问卷,处理起来会花费大量的人力和时间,甚至不能在期望的时间内完成。
有些调查问卷也是客户、会员等资料的收集渠道。因此调查问卷的结果除了进行必要的保存以及分析外,还需要进行必要的影像管理和查询。
优立慧科调查问卷处理系统利用先进快速的扫描设备扫描问卷,然后将扫入的问卷图像进行自动分类、识别,辅之以少量的人工校对和干预,得出所需的电子数据,从而代替人工录入。对于不能识别的字符,如手写汉字,系统通过自动切取图像区域,直接放置在录入窗口,以非常人性化的界面,方便人工录入。
优立慧科调查问卷处理系统可帮助用户节省大量的人工录入工作,大大提高工作效率。此外,系统采集到的原始问卷影像,为日后问卷查询、存档、保管提供方便、简捷和安全的影像管理,也为问卷信息提供了宝贵的知识库。
二、系统功能
识别关键标识字段,并利用该字段自动建立索引。
建立问卷数据库,影像化保存相关身份信息。
调查问卷内容评价的自动录入以及手写汉字的快速录入。
对评价做初步分析统计分析。
对于识别结果按用户要求进行数据对接。
三、系统结构示意图

系统架构
对于问卷单次处理数量特别大的用户我们建议系统中采用流水线工作方式,分别实现扫描—识别—校对—统计功能,其中扫描和识别同时实现、校对和统计同一岗位实现,比对功能主要针对同一填表者多次填表基本信息的对应,计算机自动与数据库比对完成对应。
对于问卷单次处理数量不是特别大的用户我们建议使用单机方式实现,即可在一台普通PC上实现扫描、识别、检查、校对等功能。
四、系统优点
调查问卷影像化自动识别的技术难点在于调查问卷影像中的信息识别和关键影像分割、保存处理上。优立慧科影像化自动识别是基于全球领先的UNIWEX?识别核心开发,针对各行各业及各类调查问卷的智能识别系统,在表单信息智能采集(UNIWEX?)和影像处理方面有着深厚的实力,在欧洲已经有超过200家政府机构及跨国企业得到成功应用。表单信息智能采集技术不同于目前的字符识别技术(OCR),它是文档自动分类技术、图像背景处理技术和OCR等技术的有机综合,是对现有OCR技术的超越,因此它轻而易举地解决了OCR
还难以有效准确实现的表单信息智能采集难关。
五、系统功能设计
优立慧科调查问卷处理系统主要实现调查问卷的扫描、调查问卷内容识别、调查问卷关键影像的分割处理以及调查问卷影像及影像相关信息的查询、导出、统计等功能。
5.1问卷扫描
问卷扫描是把调查问卷通过扫描仪扫描成影像文件的过程,这是问卷电子化的第一步。
5.2问卷识别
问卷识别利用表单识别核心技术,对扫描后的影像文件进行需求信息的识别,从而生成影像文件的索引信息并存入数据库,这个过程由计算机自动完成,不需要人工操作。问卷识别过程可以和扫描过程同步进行,即扫描一张识别一张;也可以在扫描完一批任务后,统一进行识别。识别结果正确无误时,则无需校对;如果有错误,则系统提示对有问题的影像进行人工校对和修改。
5.3问卷校对

上图中利用同字符快速校对工具对于手写体数字进行快速校对,大大提交了校对的速度。同时具有的自学习功能会让系统的使用的过程中精度越来越高。
5.4问卷检查

上图中通过计算机辅助工具,可以快速的查看识别有问题的区域,并且对于无法识别的内容通过局部放大截图的方式友好的辅助人工录入。
5.5 数据导出
系统提供了强大的数据导出整合功能,默认方式下可以以文本、EXCEL、ACCESS、SQL等方式导出。对于其他数据库的数据对接要求可以在很短时间内调试成功。
5.6数据库完善及影像相关信息查询
系统提供通过问卷指定规律信息对调查问卷的影像进行查询的功能。这不同于网上查询功能,而是系统本身的一个影像查询功能。查询功能除了能提供相应的调查问卷影像之外,还能够提供对应的影像是哪一天进行扫描的,以及装订在当天的哪一本资料的哪一页上的信息,便于工作人员能很方便的检索到物理保存的纸质调查问卷