大量的图片、表格等非文字内容通常同时存在于一篇普通的文档图像中,形成版式差异,使得传统的版面分析方法在进行版面布局分析和表格处理时会明显受制。在应对不同场景下,文档图片被拍照、扫描成电子文档过程中时常出现漏字、错位等效果存在缺陷的情况。

针对于此,人工智能及大数据科技企业合合信息持续突破版面分析技术在版面分割、区域间的逻辑关系处理等方面的难题,通过智能文字识别、智能图像处理等核心技术,助力使用者从各类复杂的图片文档中精准获取信息。

据合合信息工作人员介绍,版面分析任务主要包括物理版面分析(或称为几何版面分析)和逻辑版面分析两类,前者主要解决区域分割问题,关注的是文档图像的物理布局,后者则关注区域之间的区域语义分类和逻辑关系。

因此,合合信息通过引入全卷积神经网络(FCN)和图神经网络(GNN)两种深度学习的算法,并结合文本区域的几何坐标、视觉特征、文本语义等多种模态信息对文本阅读顺序进行预测,显著提升了文档图像的分析结果。

合合信息智能文字识别服务平台对存在图片、表格的复杂文档进行识别

基于深度学习的方法,合合信息将文档图像切分为文本、图形、公式、表格、印章等不同类型的内容区域,并分析区域之间的逻辑关系,让机器更精准地确定文档中的文字位置、字体、大小和排版方式,可以更好地理解文档的结构和内容,并提取出有用的信息。

此外,合合信息表格结构解析方法在逻辑版面分析中也发挥了重要作用。在表格识别还原中,合合信息利用自上而下的方法以及端到端图像到标记的方法等,保证区域内容的完整性的同时,显著提升检测准确率。

版面分析是文档图像还原的核心,通过解决版面分析的痛点,合合信息助力各界用户将图像文档以数字化的手段更精准地转化为文档数据,应用于多种使用场景、提升工作效率。未来,合合信息将继续深耕复杂版面文档和拍照变形文档的分析识别工作,争取得到更多的应用突破。