计算机视觉旨在从图像中提取有用的信息,这已经被证实是一个极具挑战性的任务。那么图像是什么?或者说我们把图像看作什么?
有人说图像就是一张图片,一个场景,一个矩形(rectangle),一个矩阵(matrix)。我们先看一个图像实例:
这是一张黑白图像,也就是常说的灰度图。更多的图像是彩色的RGB图像。灰度图处理起来更加简单方便,因此这里使用灰度图像,重在理解。
我们把这幅图像加上坐标刻度,如下图所示:
放到坐标系中后,我们能把一副图像看作是一个二维函数,定义成或者。任何一对空间坐标(x, y)处f的值看作该坐标点处的强度(intensity)或灰度。我们把每一坐标点处的强度在三维空间中看看。
下面是二维函数的可视化,与上述图像的二维函数相比,无非是坐标的取值范围不同,函数的表达式不一样。
把图像看作是一个二维函数,将对后续的图像处理理解和计算带来极大的便利,对图像的处理就是对函数的处理。需要强调的是把图像作为二维函数时,它是一个离散函数,且取值范围有所限定,比如x, y轴的坐标值,函数取值也限定在某个区间之内(不一定是[0-225])。另外,图像作为函数,不可能得到上面类似f(x, y)=x**2+y**2这样的表达式。
对于彩色图像,同样可以看作是一个向量函数。f(x, y) = [r(x, y), g(x, y), b(x, y)](此处彩色图像只是有三个通道而已,每个通道上都有(x,y)坐标对应一个灰度值)