Photography 笔记(四)

摄影历史:为世界纪实

这部分主要 cover 了摄影记录的一些历史,继续欣赏美图吧。

好的构图

嗯,这种地方很难写的非常“分析化”,引用 Ansel Adams 的话来说

There are no rules for good photographs, there are only good photographs.

slides 上 cover 了一些典型的例子,如线条和形式,当做主体也好还是当做一些装饰线,另外可以用来引导视线。所谓形式就是指线条本身带来的 interpretation,通过线条的组合就带来了形状,这是可以被人感知到的一些明确的形式。另外一种常用的形式是重复,高级版本的重复是节奏(rhythm),这意味着重复中有所不同。有一种常见的重复是来自纹理。

用光也是影响照片的一个重要因素,由于光运用得当能产生足够好的 tone,这意味着色调的渐变自然而不生硬,histgram 上看连续而没有孤峰。光在黑白照片里面体现为影调,在彩色照片里面还体现为颜色,如冷暖调的协调,某种颜色造成的着重感,某种特殊的色彩可以为场景提高格调,成为 rhythm 里面的起。

pictorial design 方面还对一些别的因素有要求,如对称与平衡。对称我想大家都很容易注意到,而平衡却不是太讲究,有的时候某些部位的留白是需要元素进行点缀以达到平衡的。而某些元素比例的不同也可以造成需要的不平衡感。另一点所谓的 framing,及如何利用照片的边界让画面看起来更合理,水平的方式比较稳重,但是有时候却需要人为加入不稳重的因素,产生危险感和活泼因素。这个网站给出来不少例子,后面没事可以看看。

对于初学者一些简单实用的手法:简化背景、简化画面(大光圈,长焦距,浅景深);去掉没有意义的物体(ps);尽可能靠近,让主体撑满画面;不要将不对称的物体放在画面中心;保持水平线;避免无意义的透视上的对齐(脑袋上长树)。

采样与像素

嗯,技术文。这部分的数学基础就是那传说中的 Fourier 变换,这分为分析里面常用的对连续函数使用的版本和工程里面常用的离散 Fourier 变换(DFT)。简单的说 FT 将 spatial signal 变换称为 frequency space 的表达,可以认为 Fourier 变换提供了另外一种基,我们看到 FT 的结果就是换了一个视角看同一个物体。这个频域空间的特点就是能够方便的定位信号里面具有显著周期性的东西,另外一个好处是不少信号的处理在这个空间表示起来尤为容易。FT 包含一个正向的变换和反向的逆变换,前者将实数域的函数/数组变换到复数域,后者将其从复数域变换回实数域,两个变换基本一致,只是某些表达形式上相差一个常数。对应的复数的模表示了该分量下信号的强度,而辐角表示相位。

对图片常见的两种操作 blur/sharpen 可以从 FT 的结果上来进行分析,blur 去掉了细节,等价于去除了频域中的高频分量,因此是一个 low-pass filtering(低通滤波);sharpen 增加了细节,强调了边缘,等价于强调了频域中的高频分量,因此是 high-pass filtering(高通滤波)。从实际操作来看,两种操作均可以通过合适的卷积核(convolution kernel)与原始图像经过卷积获得。Fourier 分析的一个重要的结论是卷积的 FT 等于 FT 的乘积。这告诉我们这两种操作其实可以在频域里面非常直观的理解。

如果我们对图像变换的时候 x 方向 blur 而 y 方向 sharpen,我们也会观测到类似 astigmatism 的现象。

为了测量一个镜头对不同频率信号传递的大小,常用所谓的 modulation transfer function(MTF)来进行衡量,这个函数值是给定频率下光学系统能够重现的信号的量,MTF 的图像一般横轴是频率,使用线对(line pair/mm)来刻画,纵轴是传输的比例(因此 ideally 是 1,实际都是小于 1 的比例)。一般说来测试应该使用 sin 函数通过黑白渐变色表示的 pattern 通过光学系统后所展示的差异来衡量,这一般被认为可以刻画 sharpness,而实际操作中有时候使用黑白两色的线对(或者说宽度不同的实线)进行测量,wiki 上认为这其实是比较的反差(测量的是 CTF)。

从图上我们可以看出来锐度和反差其实是摄影师关心的两个方面,前者影响的是镜头的解析力(多小的东西能够被解析到画面里),后者影响的是解析出来是否足够显眼(与周围的环境能够区分出来)。

很多评测网站使用的 MTF 并不一样,我常去的一个 lenstip.com/photozone.de 使用的 MTF 其实没有画出来数值,估计是固定一个 threshold 节选的 MTF 不小于某个值的最高频率作为纵轴,看看镜头在不同光圈下(横轴)/不同焦段下/像的不同位置上传输值的大小。比如我们比较 Samyang 14mm/2.8 这个廉价的超广角与 Nikkor 14-24mm/2.8 这个号称最牛广角变焦,前者全开光圈在 APS-C 画幅上从中心到边角有 45-35lp/mm 的解析力,后者只有 40-33lp/mm,可见这个廉价的定焦的确物有所值。注意 Samyang 似乎还有一款 14mm/2.8 成像素质明显不行。镜头厂商一般贴的不是这样的 MTF,它们横轴一般是到中心的距离,纵轴是某个频率下的 MTF 值,比如这个

衡量一些显示设备的分辨率常用 DPI 指标,即每 inch 显示点的个数,我们可以将此数据和观看距离 d 一起换算成为每度多少个周期 2d \tan \pi/180 / (1\mathrm{in} / \mathrm{DPI}),根据实验,人大概是每度 50 个周期(根据采样定律大概满足人的观测实际需要达到两倍精细程度)。那么根据此公式可以计算如 iPhone4S 号称的 rentina display 是 68 个周期,基本上达到了 cutoff 的需要。这个第二个应用是计算 confusion circle 的大小,假如我们知道像素密度 \rho(每个像素占据的长度),我们可以这样计算:因为我们每度要求有 50 个周期,这样一个周期对应也就是 0.02 度,通过对相片的观测距离 d 我们知道这个周期在相片上的长度,由于总像素知道根据像纸大小可以推断出每个像素占据的长度,我们就可以看看这一个周期占用了几个像素,根据这个数值乘以 \rho 就是 confusion circle 的大小了。

另一个重要的问题就是高频信号在采样中产生的“走样(alias)”,根据信号理论的 Nyquist-Shannon 理论,采样频率要两倍于信号本身的频率才能分辨。根据这个因素,我们在进行某个频率采样的时候最好进行 prefiltering,将大于采样频率一半的高频信息减弱或者抛弃,否则进行点采样时这些信息反而成为干扰。这也就是现在数码相机 sensor 前增加 anti-aliansing filter 的原因。做 prefiltering  或者在频域进行,这需要转换,或者直接在空域做(通过透镜)。这里 postfiltering 不会有任何的帮助。在 DIP 软件里面,完成 downsampling 可行的策略有 reconstruction 或者 resampling,前者是将离散图片通过插值变成连续的;而后者是在此基础上进行 prefiltering 然后继续 sampling。后面这个步骤是可以简化到一次离散卷积的。

数码相机还有一个问题是对颜色的 quantization,分多少个 bit 来刻画一个数值。在 bit 数降低之后会导致颜色变少,渐变色变得不连续起来,为了减缓视觉上的不连续,DIP 软件一般会提供所谓的 dithering 效果,将各种颜色混在一起交替出现,比如黑白混合比例不同表示不同程度的灰色。对于打印机来说这个技术一般称为 half-toning。

—————–
But his wife looked back from behind him, and she became a pillar of salt.

Advertisements
Photography 笔记(四)

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s