计算文档图像中的白斑度量
Computing White Speckle Metric in a Document Image
论文“Metric-based No-reference Quality Assessment of Heterogeneous Document Images”讨论了如何测量文档图像中字符的质量。我很难理解第 7 页中的白色斑点指标。
Small white speckle measures how much fattened character strokes have shrunken
existing white connected components inside characters, or have created
new ones by connecting strokes of characters. A histogram of white
connected components in a document image is computed, and we have
already found the most frequent font size.Then the white speckle is computed by summing up the histogram bins
between 1 pixel and 1% of font size squared. The sum is then
normalized by dividing by the area under the histogram between 1 and
font size squared.
我的问题是:
- 如何计算文档图像中白色连通分量的直方图?
- 如何通过将 1 个像素和 1% 字体之间的直方图 bin 相加来计算白色斑点
大小平方?比方说,最常见的字体大小是 32,所以我必须将直方图 bin 1 的频率加到 32^2 (1024) 的百分之一?是吗?
- 老实说,我没有看到计算或总结 1 像素和 1% 字体大小平方之间的直方图 bins 到小
white speckle measure
的任何关系。你能帮我看看关系吗?
谢谢。
我没有阅读整篇论文,但它认为我理解他们在做什么。
该文档由白色背景上的黑色章程和二进制图像组成(我不知道他们如何准确地对图像进行阈值处理,但我认为这是输入)。在那些宪章里面有一些白色的小区域。
- 计算图像中的connected component。假设您在文档中有 N 个。每个连接的组件都有一个大小,即组件具有的像素数。使用组件的大小,我们可以创建一个直方图,计算大小为 1、2、.... 的组件的数量。
我们正在寻找包机内的斑点。该论文将小斑点定义为大小为 1 像素至最频繁图章区域的 1% 的连通分量。章程区域是字体大小的平方。因此,当您声明您将对 32^2
的 1% 到 1% 之间的所有 bin 求和时,您是正确的
他们将小斑点定义为尺寸较小的连通分量,特别是尺寸等于字体大小平方的 1%。为了测量文档中有多少斑点,您只需将所有属于该定义的连通分量相加即可。最后,您对其进行了归一化,这样您就有了一个可以在不同文档之间进行比较的测量值。
您可以不同意该假设,并认为也许小斑点的定义应该完全不同,但这就是定义。
希望我能帮到一点点
论文“Metric-based No-reference Quality Assessment of Heterogeneous Document Images”讨论了如何测量文档图像中字符的质量。我很难理解第 7 页中的白色斑点指标。
Small white speckle measures how much fattened character strokes have shrunken existing white connected components inside characters, or have created new ones by connecting strokes of characters. A histogram of white connected components in a document image is computed, and we have already found the most frequent font size.Then the white speckle is computed by summing up the histogram bins between 1 pixel and 1% of font size squared. The sum is then normalized by dividing by the area under the histogram between 1 and font size squared.
我的问题是:
- 如何计算文档图像中白色连通分量的直方图?
- 如何通过将 1 个像素和 1% 字体之间的直方图 bin 相加来计算白色斑点 大小平方?比方说,最常见的字体大小是 32,所以我必须将直方图 bin 1 的频率加到 32^2 (1024) 的百分之一?是吗?
- 老实说,我没有看到计算或总结 1 像素和 1% 字体大小平方之间的直方图 bins 到小
white speckle measure
的任何关系。你能帮我看看关系吗?
谢谢。
我没有阅读整篇论文,但它认为我理解他们在做什么。
该文档由白色背景上的黑色章程和二进制图像组成(我不知道他们如何准确地对图像进行阈值处理,但我认为这是输入)。在那些宪章里面有一些白色的小区域。
- 计算图像中的connected component。假设您在文档中有 N 个。每个连接的组件都有一个大小,即组件具有的像素数。使用组件的大小,我们可以创建一个直方图,计算大小为 1、2、.... 的组件的数量。
我们正在寻找包机内的斑点。该论文将小斑点定义为大小为 1 像素至最频繁图章区域的 1% 的连通分量。章程区域是字体大小的平方。因此,当您声明您将对 32^2
的 1% 到 1% 之间的所有 bin 求和时,您是正确的
他们将小斑点定义为尺寸较小的连通分量,特别是尺寸等于字体大小平方的 1%。为了测量文档中有多少斑点,您只需将所有属于该定义的连通分量相加即可。最后,您对其进行了归一化,这样您就有了一个可以在不同文档之间进行比较的测量值。
您可以不同意该假设,并认为也许小斑点的定义应该完全不同,但这就是定义。
希望我能帮到一点点