pytesseract 吃 CPU 太高了
pytesseract eats CPU too high
在Ubuntu16.04 LTS中,pyteserract脚本吃得太高,导致系统间歇性重启
top命令输出为
top - 21:23:31 up 27 min, 4 users, load average: 3.27, 1.86, 1.28
Tasks: 290 total, 2 running, 216 sleeping, 0 stopped, 0 zombie
%Cpu(s): 87.5 us, 0.7 sy, 0.0 ni, 11.7 id, 0.0 wa, 0.0 hi, 0.1 si, 0.0 st
KiB Mem : 16295836 total, 10387872 free, 2990788 used, 2917176 buff/cache
KiB Swap: 16645116 total, 16645116 free, 0 used. 12155216 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
5391 myid 20 0 1393532 141324 39308 R 667.8 0.9 2:30.57 python
python 脚本是
text_eng = pytesseract.image_to_string(Image.open(dst), lang='eng', config='--oem 1 --psm 1 -c preserve_interword_spaces=1')
我的环境是
tesseract 4.1.0-rc1
leptonica-1.77.0
libjpeg 8d (libjpeg-turbo 1.4.2) : libpng 1.2.54 : libtiff 4.0.6 : zlib 1.2.8 : libopenjp2 2.1.2
Found AVX2
Found AVX
Found SSE
我所做的是
1) 删除了 oem 选项
2) 删除 psm 选项
但到目前为止运气不好。
有线索吗?
自己回答。
我把leptonica-1.77.0去掉重新编译,问题就没有了。
在Ubuntu16.04 LTS中,pyteserract脚本吃得太高,导致系统间歇性重启
top命令输出为
top - 21:23:31 up 27 min, 4 users, load average: 3.27, 1.86, 1.28
Tasks: 290 total, 2 running, 216 sleeping, 0 stopped, 0 zombie
%Cpu(s): 87.5 us, 0.7 sy, 0.0 ni, 11.7 id, 0.0 wa, 0.0 hi, 0.1 si, 0.0 st
KiB Mem : 16295836 total, 10387872 free, 2990788 used, 2917176 buff/cache
KiB Swap: 16645116 total, 16645116 free, 0 used. 12155216 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
5391 myid 20 0 1393532 141324 39308 R 667.8 0.9 2:30.57 python
python 脚本是
text_eng = pytesseract.image_to_string(Image.open(dst), lang='eng', config='--oem 1 --psm 1 -c preserve_interword_spaces=1')
我的环境是
tesseract 4.1.0-rc1
leptonica-1.77.0
libjpeg 8d (libjpeg-turbo 1.4.2) : libpng 1.2.54 : libtiff 4.0.6 : zlib 1.2.8 : libopenjp2 2.1.2
Found AVX2
Found AVX
Found SSE
我所做的是 1) 删除了 oem 选项 2) 删除 psm 选项 但到目前为止运气不好。
有线索吗?
自己回答。
我把leptonica-1.77.0去掉重新编译,问题就没有了。