合合信息瞄准版面分析技术,助力实现文档识别更加精确
大量的图片、表格等非文字内容通常同时存在于一篇普通的文档图像中,形成版式差异,使得传统的版面分析方法在进行版面布局分析和表格处理时会明显受制。在应对不同场景下,文档图片被拍照、扫描成电子文档过程中时常出现漏字、错位等效果存在缺陷的情况。
针对于此,人工智能及大数据科技企业合合信息持续突破版面分析技术在版面分割、区域间的逻辑关系处理等方面的难题,通过智能文字识别、智能图像处理等核心技术,助力使用者从各类复杂的图片文档中精准获取信息。
据合合信息工作人员介绍,版面分析任务主要包括物理版面分析(或称为几何版面分析)和逻辑版面分析两类,前者主要解决区域分割问题,关注的是文档图像的物理布局,后者则关注区域之间的区域语义分类和逻辑关系。
因此,合合信息通过引入全卷积神经网络(FCN)和图神经网络(GNN)两种深度学习的算法,并结合文本区域的几何坐标、视觉特征、文本语义等多种模态信息对文本阅读顺序进行预测,显著提升了文档图像的分析结果。
合合信息智能文字识别服务平台对存在图片、表格的复杂文档进行识别
基于深度学习的方法,合合信息将文档图像切分为文本、图形、公式、表格、印章等不同类型的内容区域,并分析区域之间的逻辑关系,让机器更精准地确定文档中的文字位置、字体、大小和排版方式,可以更好地理解文档的结构和内容,并提取出有用的信息。
此外,合合信息表格结构解析方法在逻辑版面分析中也发挥了重要作用。在表格识别还原中,合合信息利用自上而下的方法以及端到端图像到标记的方法等,保证区域内容的完整性的同时,显著提升检测准确率。
版面分析是文档图像还原的核心,通过解决版面分析的痛点,合合信息助力各界用户将图像文档以数字化的手段更精准地转化为文档数据,应用于多种使用场景、提升工作效率。未来,合合信息将继续深耕复杂版面文档和拍照变形文档的分析识别工作,争取得到更多的应用突破。
最近更新
-
掘金“新型消费”沙龙成功召开,天下网商携手长江商学院探寻品类王者的增长之道
理财 · 19:09
-
零距离兑换“零钱包”浦发北分积极提升适老化现金服务
理财 · 18:04
-
品誉集团2024《飞豹训练营》总监培训圆满举办!
理财 · 17:34
-
中产阶层新宠:抗衰青春剂热销,引网友热议
理财 · 17:12
- 每周一股|主力资金活跃+国企改革方向+低位,下周低吸!
- 一天22亿!胖东来又出手了
- 5.13号,这些板块有利好
- 智能通知存款“下架潮”来袭,存款利息越来越低该咋办?
- 周末都是利空,哎!!!!!
- 【20240513早评】持续背离后,短调压力增加
- 每周复盘
- 2000亿神秘首富,成功破产了
- 港股三大指数集体回升!恒生科技ETF龙头(513380)盘中翻红现涨1.35%,权重股阿里巴巴涨超3%
- 联华证券-股息与分红的区别与联系,我们应该怎么正确去理解
专栏推荐
-
研选
浓缩机构研究精华,提前捕捉市场风口
2034人已购
¥258.00/月
-
尾盘擒牛之如何选股?
学完这些方法,告别选股难!
117人已购
¥288.00/月
-
财报拆解
知识点解读+实战案例,帮你5小时学会看财报
73人已购
¥19.90/月
-
每周一股
每周日定期更新【每周一股】,为广大的投资者精选下周短线个股!
344人已购
¥588.00/月