IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> [论文阅读笔记61]ClusTi:Clustering Method for Table Structure Recognition -> 正文阅读

[人工智能][论文阅读笔记61]ClusTi:Clustering Method for Table Structure Recognition

Zucker, A., Belkada, Y., Vu, H. et al. ClusTi: Clustering Method for Table Structure Recognition in Scanned Images. Mobile Netw Appl 26, 1765–1776 (2021). https://doi.org/10.1007/s11036-021-01759-9

法国巴黎索邦大学

Keywords

  • Table structure recognition
  • Object recognition
  • Clustering method

一、摘要

? 首先,利用聚类算法去除表格图像中的重噪声(DBSCAN)。
? 其次,它使用最先进的文本识别技术提取所有的文本框(参考论文:CRAFT----Character region awareness for text detection)。
? 第三,CluSTi基于优化参数的水平(DBSCAN)和垂直聚类算法(DBSCAN),分别将文本框组分到相应正确的行和列。

二、具体内容

2.1 识别过程:

image-20211124160444007

2.2 方法过程:

image-20211124155918463

1.Noise Removal

**Noise Removal: **正常的字符一般都是高聚集在一起的,noise一般会离群;使用DBSCAN clustering technique去删除奇异点;

image-20211124161203706

2. Text Detection

Text Detection: 深度神经模型–CRAFT----Character region awareness for text detection;

image-20211124160844451

3. Row Detection

Row Detection: 水平聚类算法。DBSCAN clustering technique (参数都是优化好的)

image-20211124161144676

? 首先,计算每个检测到的文本框的质心坐标(即(x_c、y_c))。然后,根据x轴对它们进行归一化。最后,利用带有优化参数的DBSCAN对归一化的质心(即(x_n,y_n))进行了聚类。

? 输出行数与文体属于哪一行。

微调:Fine-tuning horizontal clustering

image-20211124161710308

对于多行文本在一个单元格的,采用Probing算法(【33】)

image-20211124161853178

参考:【33】Scholkmann F, Boss J, Wolf M (2012) An efficient algorithm for automatic peak detection in noisy periodic and quasi-periodic signals. Algorithms 5(4):588–603

4. Column Detection

**Column Detection: ** DBSCAN clustering technique(参数都是优化好的)

Vertical clustering算法

image-20211124162318956

5. Cell Reconstruction:

单元格可以通过确定其实际的宽度、高度和坐标来重建。

image-20211124162410586

三、评估

3.1 数据集:

397 table images,来自 table-detection-dataset. https://github.com/sgrpanchal31/tabledetection-dataset

ICDAR 2013;

ICDAR 2019;

3.2 实验结果:

image-20211124162713598

3.3 与DeepDeSRT,TableNet的对比结果

image-20211124172720628

【23】 Paliwal SS, Vishwanath D, Rahul R, Sharma M, Vig L (2019) Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In: 2019 International conference on document analysis and recognition (ICDAR). IEEE, pp 128–133

【34】Schreiber S, Agne S, Wolf I, Dengel A, Ahmed S (2017) Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR International conference on document analysis and recognition (ICDAR), vol 1.IEEE, pp 1162–1167

4. 总结

方法简单,思路清晰,不大谈理论。可是不知道代码开不开源。

5. 相关工作

复习DBSCAN密度聚类算法

DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法);

一种很典型的密度聚类算法,和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集。

密度聚类思想:

by hahppyprince 2021-11-24

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-25 08:07:06  更:2021-11-25 08:10:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 4:37:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码