Lec3 Image Processing

Image Processing Basics

卷积（convolution）：

在每个位置都做某种形式的加权平均，称为卷积。卷积 = 滤波，卷积核 = 滤波器。

$$(f*g)(x)=\int_{-\infty}^{\infty}f(y)g(x-y)dy$$

$f(y)$：filter
$g(x-y)$：input signal
$(f*g)(x)$：output signal

Padding:

在图像外面增加若干圈新的像素。

zero values: 用 $0$ 填充
edge values: 用边缘像素值填充，每圈都一样
symmetric values: 用对称像素值填充，例如图像最外圈对应填充第一圈，图像第二外圈对应填充第二圈，以此类推

高斯模糊（Gaussian blur）：

高斯模糊用于图像模糊处理。

与均值滤波不同，高斯滤波的卷积核中间大四周小，符合高斯分布。

$$\begin{bmatrix} 0.075&0.124&0.075\\ 0.124&0.204&0.124\\ 0.075&0.124&0.075 \end{bmatrix}$$

锐化（sharpening）：

锐化对应的卷积核：

$$\begin{bmatrix} 0&-1&0\\ -1&5&-1\\ 0&-1&0 \end{bmatrix}$$

锐化的本质是增加高频部分：

原图像：$I$
图像的高频部分：$I-\text{blur}(I)$
锐化后的图像：$I+(I-\text{blur}(I))$

边缘检测（edge detection）：

边缘检测对应的卷积核：

$$\begin{bmatrix} -1&0&1\\ -2&0&2\\ -1&0&1\\ \end{bmatrix}$$

$$\begin{bmatrix} -1&-2&-1\\ 0&0&0\\ 1&2&1\\ \end{bmatrix}$$

卷积核本身可视化后就类似于边缘的结构，这也暗示了卷积核本身就像特征检测器，图像中如果有对应特征则响应就大。

双边滤波（bilateral filter）：

双边滤波常用于图像去噪（磨皮），在局部模糊的情况下保留边缘。图像每个地方对应的卷积核内容都不同。

Image Sampling

image sampling 本质就是在调整图像的大小（分辨率）。减小图像称为 down-sampling，可能导致的问题有摩尔纹、飞轮效应等，这些统称为走样（aliasing），原因是信号变化太快，但采样太慢。

傅里叶变换（Fourier transform）：

对于任意信号，可以通过傅里叶变换分解成不同频率的周期信号（三角函数）的加权叠加。每个周期信号前面的系数称为傅里叶系数，表示需要多少该频率的周期信号。

频率 - 傅里叶系数图像称为频谱。

从时域到频域的傅里叶变换可以如下表示：

$$F(u)=\int_{-\infty}^{\infty}f(x)e^{-i2\pi ux}dx$$

其中，$f(x)$ 为原本的时域信号，$F(u)$ 为变换后的频域信号，即频率 $u$ 的傅里叶系数（占比）。

这个式子本质上就是在对 $f(x)$ 和频率为 $u$ 的周期信号做内积。

从频域到时域的傅里叶逆变换可以如下表示：

$$f(x)=\int_{-\infty}^{\infty}F(u)e^{i2\pi ux}du$$

这个式子本质上就是在对所有频率的周期信号做加权叠加，还原原本的时域信号 $f(x)$。

Example

alt text

Note

$\delta$ 表示冲激信号，该点的值为无穷大。

卷积定理（convolution theorem）：

时域上两个信号的卷积对应于频域上两个信号的乘积；频域上两个信号的卷积对应于时域上两个信号的乘积。

因此我们得到卷积的另一种形式：先将两个时域上的信号分别做傅里叶变换，得到频域信号；然后将两个频域信号相乘；最后对乘积做逆傅里叶变换，得到的结果与时域信号直接卷积是一样的。

回到图像上，二维空间的傅里叶变换与一维类似，时域现在是空间域，频谱现在是二维的。

alt text

频谱上的任意一点 $(x,y)$ 表示，横向上频率为 $x$、纵向上频率为 $y$ 的周期信号的占比。

alt text

卷积核就像窗口函数（见上面的 Example4），卷积的过程就是去掉高频成分、保留低频成分的过程，因此又叫滤波。

采样（sampling）：

Sampling a signal = Multiply the single by a Dirac comb function

采样的数学本质就是对原本的信号乘上一个周期性（$f=f_s$）的冲激函数（Dirac comb function）。

冲激列的傅里叶变换也是冲激列，频率变为原本的倒数，因此$f=\frac{1}{f_s}$，$T=f_s$，即频谱的间隔为 $f_s$。

时域上的乘法对应频域上的卷积，频域上的卷积本质上就是对频谱进行周期性复制。

alt text

假设采样频率 $f_s$ 过低，频谱上的峰会重叠，无法还原原本的信号，导致走样。

alt text

因此，根据 Nyquist-Shannon 采样定理，采样频率 $f_s$ 必须大于图像信号中最高频率 $f_0$ 的两倍，才能还原原本的信号。

综上：减少走样的方法有两个。一个是增加采样频率 $f_s$，另一个是减少图像信号中的高频成分 $f_0$，即在采样前对图像进行模糊处理（低通滤波）。

Image Magnification

图像放大要解决的问题是：原本没有值的像素应该怎么填。一般使用插值（interpolation） 的方法。

alt text

其中，最近邻插值（nearest-neighbor interpolation） 的问题是不连续、不光滑；线性插值（linear interpolation） 连续但不光滑；多项式插值（polynomial interpolation） 每一段用不同的多项式拟合，要保证光滑至少需要三次多项式。

双线性插值（bilinear interpolation）：

双线性插值是在二维空间中插值的方法。对于任意一个点的周围四个已知点，先两两进行线性插值，得到一组中间值，然后再对中间值进行线性插值，得到最终值。

alt text

Lec3 Image Processing

Image Processing Basics

Image Sampling

Image Magnification

评论