Lec2 Image Formation

Camera and Lens

对于三维空间的信息，我们如果只用一个平面来接收，则得到的是一片模糊。因为三维空间上的每个点都有无数条光线，到达平面上的每个位置，而不是一一映射。

alt text

要想拍清楚，就需要让每个点只有一条光线到达平面上，因此在平面前加一个小孔，称为光圈（aperture），整个模型称为针孔相机（pinhole camera）。

alt text

Note

孔不是越小越好：

通光量太小
衍射

凸透镜（lens）：

和小孔成像类似，但能获得更多光。其中有高斯成像公式

$$\frac{1}{i}+\frac{1}{o}=\frac{1}{f}$$

alt text

Note

当 $o\rightarrow\infty$ 时，$f=i$。由于现实中 $o$ 远大于 $i$，因此我们默认 $f=i$ 成立。

放大率（magnification）：

$$m=\frac{h_i}{h_o}=\frac{i}{o}=\frac{f}{o}$$

alt text

这就解释了为什么长焦镜头拍到的东西更大。因为焦距越大，放大率越大。

视野（field of view, FOV）：

视野就是观察范围，通常用一个角度来表示（angle of view）。

alt text

与视野有关的是焦距和传感器大小。焦距越小，传感器越大，视野就越广。

Note

传感器还对接收光强有影响。底片大说明接受光线能力强，同样光线下（尤其是弱光），拍出的图片更清晰。

Note

我们一般讲等效焦距，即原本焦距根据传感器大小进行归一化。

光圈（aperture）：

光圈控制了多少光经过凸透镜汇聚到像平面上。光圈越大，进光量越大。光圈的直径记为 $D$。

F-number:

$$N=\frac{f}{D}$$

使用 F-number 是因为光圈大小也要拿焦距参考。

失焦（lens defocus）：

像平面相对于镜头位置固定的时候，只有物距为 $o$ 的特定平面上的东西才能拍清楚，否则会形成模糊光斑（失焦）。设光斑直径为 $b$，则有

$$\frac{b}{D}=\frac{|i'-i|}{i'}$$

alt text

景深（depth of field, DOF）：

理论上每次只能拍清楚一个平面，但实际上在特定范围内的东西都能拍清楚，这个前后范围就叫景深。之所以存在特定范围，是因为图像本身由像素构成，所以有一个容忍度，只要光斑比像素小就行。

alt text

设 $C$ 为 pixel size，则有

$$C=\frac{f^2(o-o_1)}{No_1(o-f)}$$

$$C=\frac{f^2(o_2-o)}{No_2(o-f)}$$

可以得到景深：

$$o_2-o_1=\frac{2of^2cN(o-f)}{f^4-c^2N^2(o-f)^2}$$

Note

如何模糊背景：

更大的光圈
更长的焦距
更近的前景
更远的后景

Geometric Image Formation

如何将三维空间的点映射成二维空间的点？

透视投影（perspective projection）：

alt text

设相机中心位于原点，对于三维空间的一个点 $P=(x,y,z)$，投影到二维空间的一个点 $P'=(u,v)$。

已知焦距为 $f$，像距近似为 $f$，物距为 $z$，则有

$$u=\frac{fx}{z}$$

$$v=\frac{fy}{z}$$

我们无法直接用矩阵进行线性变换，因此需要转换成齐次坐标，然后有

$$\begin{bmatrix} f & 0 & 0 & 0 \\ 0 & f & 0 & 0 \\ 0 & 0 & 1 & 0 \end{bmatrix}\begin{bmatrix} x\\ y\\ z\\ 1 \end{bmatrix}=\begin{bmatrix} fx\\ fy\\ z \end{bmatrix}\cong\begin{bmatrix} \frac{fx}{z}\\ \frac{fy}{z}\\ 1 \end{bmatrix}$$

Vanishing Point:

alt text

vanishing point 由透视投影引起。

如果三维空间中的线垂直于投影平面，则 vanishing point 位于平面中心
三维空间中一组平行线的 vanishing point 相同
vanishing point 的位置可以告诉我们直线在三维空间中的朝向，相机与 vanishing point 之间的连线与直线平行
vanishing point 可能在图像内，也可能在图像外，也可能在无穷远处（线与投影平面平行）。

Vanishing Line:

alt text

vanishing line 将 vanishing point 连接起来，表示三维空间的一个平面，这个平面是由多组不同的线构成的。

vanishing line 可以告诉我们图像中某个平面在三维空间中的朝向。

透视畸变（perspective distortion）：

原因：像平面和物体平面不平行。

解决方法：轴移相机（可以调整光轴位置的相机）

alt text

径向畸变（radial distortion）：

alt text

原因：镜头问题

直线变弯，不满足透视投影，产生枕形畸变或桶形畸变。广角一般会有桶形畸变，长焦一般会有枕形畸变。

畸变的程度和到图像中心的距离有关，距离越远畸变越严重。

$$r^2=x_n'^2+y_n'^2$$

$$x_d'=x_n'(1+\kappa_1r^2+\kappa_2r^4)$$

$$y_d'=y_n'(1+\kappa_1r^2+\kappa_2r^4)$$

其中，$x_n'$ 和 $y_n'$ 是没有径向畸变的投影后的坐标。

解决方法：使用标定板进行标定，求出畸变系数后再校正恢复。

正交投影（orthographic projection）：

正交投影是透视投影的一个特例，图像中心与相机中心距离无穷远。每个点作一条到像平面的垂线，相当于去掉 $z$ 坐标。

alt text

$$\begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 1
\end{bmatrix}\begin{bmatrix} x\\ y\\ z\\ 1 \end{bmatrix}=\begin{bmatrix} x\\ y\\ 1 \end{bmatrix}$$

Photometric Image Formation

快门（shutter）：

快门用于控制曝光时间：

快门速度太快：曝光时间太短，图像暗，欠曝
快门速度太慢：曝光时间太长，图像亮，过曝+模糊（物体或相机会移动）

快门的应用：

拍摄闪电，快门速度慢，曝光时间长，这样才有几率拍到闪电；同时光圈要小，避免过曝
拍摄水流动的效果，同样使用慢快门速度

Rolling Shutter Effect:

例如拍摄风扇高速转动的视频，分析每一帧，风扇叶片并不能保持正常的形状。

产生原因：rolling shutter 和 global shutter 的区别。前者逐行扫描，后者同时曝光，而拍视频一般使用前者。拍摄同一幅图时，每个位置不是同时曝光的，如果物体在快速移动，就会出现问题。

RGB:

我们可以使用 RGB 值来表示颜色。任意一种颜色都可以由红绿蓝三种颜色以不同比例混合而成。

alt text

HSV:

H (Hue): 色相
S (Saturation): 饱和度
V (Value): 亮度

HSV 和 RGB 之间有固定的转换公式。相比于 RGB，HSV 比较方便调色。

alt text

拜耳滤波器（Bayer filter）：

alt text

相机里一般使用拜耳滤波器，分别感知三种颜色。

每个像素实际上只能记录一种颜色的光，相当于四个像素才能表示一个完整像素。

绿色更多是因为人眼更敏感（处于感知范围中间）。

最后的图像尺寸要比图像传感器小，得到原本尺寸需要使用插值。

Lec2 Image Formation

Camera and Lens

Geometric Image Formation

Photometric Image Formation

评论