这篇博客将介绍如何使用Python,进行视频流OCR;
Optical Character Recognition OCR光学字符识别
之前的博客介绍了如何使用快速傅立叶变换(FFT)检测图像和文档中的模糊。使用这种方法,能够检测出模糊、低质量的图像,然后提醒用户应该尝试捕获更高质量的版本,以便能够对其进行OCR。
这篇博客将介绍如何对视频流进行OCR。首先需要检测模糊、低质量的帧过滤掉,只对足够质量的帧进行OCR。原理是使用FFT。
由于光照条件、相机镜头自动聚焦和运动模糊的快速变化,视频自然会有低质量的帧。
需要检测这些低质量的帧并丢弃它们,而不是试图对这些低质量的帧进行OCR,这最终会导致低OCR精度(或更糟的,完全没有意义的结果)。
检测低质量帧的一种简单方法是使用模糊检测。因此使用FFT模糊检测器处理视频流。保证OCR管道能够在视频流上运行,同时仍保持高精度。
1. 效果图
OCR视频效果图如下:
正确识别某一帧非模糊,及ocr卡片内容效果图如下:
顶部