摄像机为什么要使用log曲线来压缩大动态范围,而不是直接开发能承载更大动态范围的视频格式?

我的观点:

  1. 根据韦伯-费希纳定律(Weber-Fechner Law),人眼对光的相对变化敏感,并且精度有限(1%对比度)。log曲线(下文称为“对数编码”)虽然bit数比raw更低(例如12bit raw->10bit log),但是几乎没有“压缩动态范围”,而是在“低位深容器里编入接近传感器上限的动态范围”(对比静态raw损失约1/3ev高光),通过优化码值分配,丢掉无用的高光级别,保留暗部精度,可在人眼几乎无法察觉到损失的情况下,减小文件大小。

  2. 普通摄像机,包括微单,不支持高bit(14/16)读出,例如多数微单拍摄视频raw都仅支持12bit读出,传感器动态范围没有想象的那么高,12bit下最高12.29档@SNR=1=0dB,没有随便一测就14 15档那么多。但是拍摄xyla板目测也确实能看到15格。

    这里多说一点,图像领域的动态范围测定,不看能够记录的上下限,而是看高于某个信噪比阈值的范围。信噪比的测定也不是看图像细节,而是拍摄平坦灰阶目标,通过测量每个像素的DN值,计算均值和标准差来获得信噪比。机内降噪和h265的压缩共同作用,可以明显提高测到的信噪比,导致给定的snr阈值下的动态范围提升(可用范围提升),虽然记录的总光比并没有增加,细节还变少了。

  3. 视频拍摄会产生恐怖的数据量,需要大幅压缩最终文件大小。减小位深可以减小文件大小。虽然不太多:例如在不考虑压缩时,从16bit降至10bit,节省的存储空间为1-10/16 = 37.5%。

  4. 只降位深还不够。民用级设备需要严格控制输出文件的大小,否则用户需要购买大量高价存储设备,得不偿失。所以需要进行压缩。在 H.265 高效压缩 + 10bit 限制下,依然能记录接近传感器极限的动态范围。但是画质和暗部精度进一步受损。

  5. 对于超高动态范围的摄影机(例如alexa35 18bit 原始数据),实际上厂家已经“直接开发能承载更大动态范围的视频格式”:以高容量的对数编码系统(logc4),输出12bit的arriraw。

  6. 根据arri的说法,每ev保留约500个亮度级别(精度0.002ev,logc4 12bit下每ev实际保留的最高级别数是266,精度约0.004ev)就足够满足电影工业级别的后期需求。以12bit存储的logc4数据,还原到线性域之后,可以获得接近18bit linear raw的后期空间。所以,以10bit对数编码,就能够完全满足12bit甚至14bit的原始数据的记录精度。

  7. 根据网络资料和ai的说法,H.265在语法上完全支持最高16位的视频流。目前的民用专业级机器,即使以线性数据记录,也不需要再开发新的格式。毕竟高画质全幅相机也只有14bit,16bit不知道什么时候才能给配上。

编辑于 2026-02-02 · 著作权归作者所有