随着计算机科学与因特网技术的高速发展,计算机已成为企业文档处理中不可缺少的一部分。例如,在政府机关、档案管理局、公安部门、医院等各大机构中,
常常会有大量的信息需要进行存储。然而,随着数据的海量增加,以及某些特定部门对信息检索速度上的需求,单纯的保存原始文档已经不能适应用户的要求。面对这个问题,我们只有通过对文档提取关键字构建索引,建立文档数据库,才能实现快速地对原始文档进行检索和查询,从而提高响应速度和服务的质量。
另外,保险公司、银行、税务以及许多企事业单位等也存在着大量的表格需要录入到计算机,以便于进行后期处理或参与计算。
但是,到目前为止,以上的大量工作基本上都是通过手工录入实现的。由于手工录入的低效率和人为的差错,使得各个行业数据电子化的发展受到严重的制约,当前的文档管理系统无法给与客户快速的反馈和优质的服务。因此,如何解决以上问题,多年以来一直是全球极力研究与关注的焦点。
纵观全球图象处理与模式识别技术领域的研发动态,法国一直是推动相关学术研究和工程应用的领先国家,其所开发出的产品每年为社会创造了巨大价值,同时也在这个领域培养了一批又一批的世界一流人才。为学习其先进技术,我国教育部在八十年代便选派首届留法博士研究生,其中一些人从事于图象处理和模式识别领域的研究,我们的表单信息智能采集系统技术引擎UNIWEX就是由此而发展起来的,并在经历10多年的国际应用和完善之后,目前已处于综合技术和多个单项技术国际领先水平。
需要强调的一点是,UNIWEX表单信息智能采集技术(UNIWEX)不同于目前的字符识别技术(OCR),它是文档自动分类技术、图像背景处理技术和OCR等技术的有机综合,是对现有OCR技术的超越,因此它轻而易举地解决了OCR
还难以有效实现的表单信息智能采集难关,并将为整个社会经济的发展提供了新的便利。