使用 ImageMagick 在每一行中找到第一个黑色像素
Find the first black pixel in every row with ImageMagick
对于图像中的每一行,我想找到该行中的第一个黑色(或第一个非白色)像素。例如,对于这样的图像:
我希望输出如下:
0
1
0
或者接近我可以解析的东西。我认为可能有一种方法可以通过子图像搜索来做到这一点,但我不太清楚该怎么做。有什么指点吗?
您不需要 subimage-search 来实现您的目标。问题可以简化为文本解析.
1。基础
考虑一下:您可以告诉 ImageMagick 将任何图像转换为文本表示形式,其中包含每个像素的准确颜色信息。 示例:
convert wizard: textwizard.txt
(wizard:
是可用于所有 ImageMagick 安装的内置图像,用于测试目的。)
是的,就是这么简单!此图像 "format" 只需添加 .txt
后缀即可请求。 结果:
# ImageMagick pixel enumeration: 480,640,255,srgb
0,0: (255,255,255) #FFFFFF white
1,0: (255,255,255) #FFFFFF white
2,0: (255,255,255) #FFFFFF white
[....]
47,638: (246,247,249) #F6F7F9 srgb(246,247,249)
48,638: (246,247,249) #F6F7F9 srgb(246,247,249)
47,639: (236,235,236) #ECEBEC srgb(236,235,236)
48,639: (230,228,218) #E6E4DA srgb(230,228,218)
[....]
476,639: (255,255,255) #FFFFFF white
477,639: (255,255,255) #FFFFFF white
478,639: (255,255,255) #FFFFFF white
479,639: (255,255,255) #FFFFFF white
如果您查看输出的第一行,您会注意到 ImageMagick 在此处使用它来详细说明有关图像的一些特殊信息:
# ImageMagick pixel enumeration: 480,640,255,srgb
意思是:
- 图像为 480 像素宽,
- 图像为 640 像素高,
- 图像使用 0-255 的范围作为每个通道的颜色信息(相当于 8 位颜色深度),
- 图像以 sRGB 颜色构建space
其他行由 4 列组成:
- 格式
(N,M)
中的第一列表示各个像素的确切位置为(row_number,column_number)
。 (行号和列号的索引从零开始——第 1 行表示为 0
,第 2 行表示为 1
。)
- 其他三列冗余地保存着完全相同的信息,每一个都以不同的符号表示:第 1 列中给出的像素的确切颜色值。(最后一列将使用人类-如果 ImageMagick 知道该颜色值的可读名称...)
As a side note: you can use such a textual representation of the original image (with or without some extra modifications) to re-create a real image:
convert textwizard.txt wizard.jpg
2。 Select 特定行
您应该知道,您可以使用以下语法 select 图像的特定区域:
image.png[WIDTHxHEIGHT+X_OFFSET+Y_OFFSET]
所以对于select一个特定的行,你可以设置HEIGHT
为1
。要完全获取任何行,请将 X-OFFSET
设置为 0
。要获取特定行,请相应地设置 Y-OFFSET
。
为了获取索引为 47 的行的值(对于上面使用的内置 wizard:
图像),我们可以这样做:
convert wizard:[640x1+0+47] row47.txt
cat row47.txt
# ImageMagick pixel enumeration: 480,1,255,srgb
0,0: (255,255,255) #FFFFFF white
1,0: (255,255,255) #FFFFFF white
2,0: (255,255,255) #FFFFFF white
[....]
428,0: (82,77,74) #524D4A srgb(82,77,74)
429,0: (169,167,168) #A9A7A8 srgb(169,167,168)
430,0: (232,231,228) #E8E7E4 srgb(232,231,228)
432,0: (246,247,249) #F6F7F9 srgb(246,247,249)
[....]
476,0: (255,255,255) #FFFFFF white
477,0: (255,255,255) #FFFFFF white
478,0: (255,255,255) #FFFFFF white
479,0: (255,255,255) #FFFFFF white
如果你不想在文件中输出文本,而是在标准输出通道上打印,你可以这样做:
convert wizard:[480x1+0+47] txt:-
3。将它们拼接在一起
根据以上信息片段,可以明确执行此任务的方法:
- 遍历图像的所有像素行。
- 将每个像素的颜色值输出为文本。
- 寻找第一个非白色像素并保留其位置信息。
4。可能的脚本 (OS X, Linux, Unix)
这是可以使用的 Bash 脚本的主要部分:
# Define some image specific variables (width, height, ...)
image=
number_of_columns=$(identify -format '%W' ${image})
width=${number_of_columns} # just an alias
number_of_rows=$(identify -format '%H' ${image})
height=${number_of_rows} # just an alias
max_of_indices=$(( ${height} -1 ))
# Loop through all rows and grep for first non-white pixel
for i in $(seq 0 ${max_of_indices}); do
echo -n "Row ${i} : " ;
convert ${image}[${width}x1+0+${i}] txt:- \
| grep -v enumeration \
| grep -v '#FFFFFF' -m 1 \
|| echo "All WHITE pixels in row!"
done
-v white
将删除 select 所有包含字符串 white
的行。
-m 1
参数将 return 最多 1 个匹配项(即第一个匹配项)。
它会很慢,但它会起作用。
我会使用内置的棋盘图案进行类似这样的操作:
convert -size 100x100 pattern:checkerboard -auto-level board.png
#!/bin/bash
convert wizard: txt: | awk -F'[,: ]' '
/^#/ || /#FFFFFF/ {next}
!( in fb) {fb[]=}
END {r=;for(i=0;i<=r;i++){if(i in fb)print i,fb[i]; else print i,"-1"}}'
-F[,: ]
告诉 awk
用逗号、冒号或空格分隔行中的单词 - 这有助于我找到每行开头的行和列。 /^#/
的行跳过 ImageMagick 文本输出的第一行中的注释以及包含 white
或 #FFFFFF
.
的所有行
然后,我有一个数组 fb[]
,按图像行索引,它保存每行第一个黑色像素的列。每次我发现一行中有一行不在我的数组 fb[]
中时,我将其保存在数组中。
最后,在 END{}
内,我 运行 到 fb[]
打印所有行和这些行中第一个黑色像素的索引。请注意,我输出 -1
代替任何未定义的元素(即那些没有非白色像素的元素)——感谢@KurtPfeifle 的提示。
对于图像中的每一行,我想找到该行中的第一个黑色(或第一个非白色)像素。例如,对于这样的图像:
我希望输出如下:
0
1
0
或者接近我可以解析的东西。我认为可能有一种方法可以通过子图像搜索来做到这一点,但我不太清楚该怎么做。有什么指点吗?
您不需要 subimage-search 来实现您的目标。问题可以简化为文本解析.
1。基础
考虑一下:您可以告诉 ImageMagick 将任何图像转换为文本表示形式,其中包含每个像素的准确颜色信息。 示例:
convert wizard: textwizard.txt
(wizard:
是可用于所有 ImageMagick 安装的内置图像,用于测试目的。)
是的,就是这么简单!此图像 "format" 只需添加 .txt
后缀即可请求。 结果:
# ImageMagick pixel enumeration: 480,640,255,srgb
0,0: (255,255,255) #FFFFFF white
1,0: (255,255,255) #FFFFFF white
2,0: (255,255,255) #FFFFFF white
[....]
47,638: (246,247,249) #F6F7F9 srgb(246,247,249)
48,638: (246,247,249) #F6F7F9 srgb(246,247,249)
47,639: (236,235,236) #ECEBEC srgb(236,235,236)
48,639: (230,228,218) #E6E4DA srgb(230,228,218)
[....]
476,639: (255,255,255) #FFFFFF white
477,639: (255,255,255) #FFFFFF white
478,639: (255,255,255) #FFFFFF white
479,639: (255,255,255) #FFFFFF white
如果您查看输出的第一行,您会注意到 ImageMagick 在此处使用它来详细说明有关图像的一些特殊信息:
# ImageMagick pixel enumeration: 480,640,255,srgb
意思是:
- 图像为 480 像素宽,
- 图像为 640 像素高,
- 图像使用 0-255 的范围作为每个通道的颜色信息(相当于 8 位颜色深度),
- 图像以 sRGB 颜色构建space
其他行由 4 列组成:
- 格式
(N,M)
中的第一列表示各个像素的确切位置为(row_number,column_number)
。 (行号和列号的索引从零开始——第 1 行表示为0
,第 2 行表示为1
。) - 其他三列冗余地保存着完全相同的信息,每一个都以不同的符号表示:第 1 列中给出的像素的确切颜色值。(最后一列将使用人类-如果 ImageMagick 知道该颜色值的可读名称...)
As a side note: you can use such a textual representation of the original image (with or without some extra modifications) to re-create a real image:
convert textwizard.txt wizard.jpg
2。 Select 特定行
您应该知道,您可以使用以下语法 select 图像的特定区域:
image.png[WIDTHxHEIGHT+X_OFFSET+Y_OFFSET]
所以对于select一个特定的行,你可以设置HEIGHT
为1
。要完全获取任何行,请将 X-OFFSET
设置为 0
。要获取特定行,请相应地设置 Y-OFFSET
。
为了获取索引为 47 的行的值(对于上面使用的内置 wizard:
图像),我们可以这样做:
convert wizard:[640x1+0+47] row47.txt
cat row47.txt
# ImageMagick pixel enumeration: 480,1,255,srgb
0,0: (255,255,255) #FFFFFF white
1,0: (255,255,255) #FFFFFF white
2,0: (255,255,255) #FFFFFF white
[....]
428,0: (82,77,74) #524D4A srgb(82,77,74)
429,0: (169,167,168) #A9A7A8 srgb(169,167,168)
430,0: (232,231,228) #E8E7E4 srgb(232,231,228)
432,0: (246,247,249) #F6F7F9 srgb(246,247,249)
[....]
476,0: (255,255,255) #FFFFFF white
477,0: (255,255,255) #FFFFFF white
478,0: (255,255,255) #FFFFFF white
479,0: (255,255,255) #FFFFFF white
如果你不想在文件中输出文本,而是在标准输出通道上打印,你可以这样做:
convert wizard:[480x1+0+47] txt:-
3。将它们拼接在一起
根据以上信息片段,可以明确执行此任务的方法:
- 遍历图像的所有像素行。
- 将每个像素的颜色值输出为文本。
- 寻找第一个非白色像素并保留其位置信息。
4。可能的脚本 (OS X, Linux, Unix)
这是可以使用的 Bash 脚本的主要部分:
# Define some image specific variables (width, height, ...)
image=
number_of_columns=$(identify -format '%W' ${image})
width=${number_of_columns} # just an alias
number_of_rows=$(identify -format '%H' ${image})
height=${number_of_rows} # just an alias
max_of_indices=$(( ${height} -1 ))
# Loop through all rows and grep for first non-white pixel
for i in $(seq 0 ${max_of_indices}); do
echo -n "Row ${i} : " ;
convert ${image}[${width}x1+0+${i}] txt:- \
| grep -v enumeration \
| grep -v '#FFFFFF' -m 1 \
|| echo "All WHITE pixels in row!"
done
-v white
将删除 select 所有包含字符串 white
的行。
-m 1
参数将 return 最多 1 个匹配项(即第一个匹配项)。
它会很慢,但它会起作用。
我会使用内置的棋盘图案进行类似这样的操作:
convert -size 100x100 pattern:checkerboard -auto-level board.png
#!/bin/bash
convert wizard: txt: | awk -F'[,: ]' '
/^#/ || /#FFFFFF/ {next}
!( in fb) {fb[]=}
END {r=;for(i=0;i<=r;i++){if(i in fb)print i,fb[i]; else print i,"-1"}}'
-F[,: ]
告诉 awk
用逗号、冒号或空格分隔行中的单词 - 这有助于我找到每行开头的行和列。 /^#/
的行跳过 ImageMagick 文本输出的第一行中的注释以及包含 white
或 #FFFFFF
.
然后,我有一个数组 fb[]
,按图像行索引,它保存每行第一个黑色像素的列。每次我发现一行中有一行不在我的数组 fb[]
中时,我将其保存在数组中。
最后,在 END{}
内,我 运行 到 fb[]
打印所有行和这些行中第一个黑色像素的索引。请注意,我输出 -1
代替任何未定义的元素(即那些没有非白色像素的元素)——感谢@KurtPfeifle 的提示。