聊一聊视频中的字幕


[TOC]


0.引子

随着互联网流媒体的发展,字幕也顺带成为了我们生活中不可或缺的一部分。现在的字幕对于中国人是如此的重要,现在的字幕早已不是观外语视频、电影时的起到翻译解释作用的字幕,越来越多的UP主也在为自己的中文视频添加字幕。无论是出于让观众理解得更快的原因,还是为了避免同音词引起的理解错误的目的(这里推荐一个视频:《为什么只有国人有看字幕的习惯?》),字幕的重要已是不争的事实。但是,你真的有了解过字幕吗?什么是字幕压制?什么是外挂字幕?什么又是CC字幕?

恰好最近我又在倒腾家庭流媒体系统,稍稍研究了一下各种字幕的标准,于是就随手记录一下研究的成果。本人非影视专业的相关学生,只是一名爱好者,如有错误,还恳请各位大佬指正!

1.直接压制进视频的字幕

在前几年,若是提起字幕一词,大家想到的肯定是这种字幕。大多数字幕组会在完成字幕的制作后,将字幕压制进视频(所谓字幕压制,就是在原视频的基础上叠加一层字幕的图层,并进行渲染,使字幕和原视频成为一个完整的带有字幕的视频)。在大多数字幕组的作品中,我们常常能看到压制这一职位,也衍生出了像小碗工具箱这样的专门用于压制字幕的软件。

但压制其实是一件非常耗费时间的活,视频的二次渲染不仅会占用大量硬件资源,消耗不少时间,还会使画质折损,那为什么字幕组还要干这么一件看似“吃力不讨好”的事情呢?

原因我总结了一下,大概有以下几点:

  • 防止其他字幕组盗用成果
  • 防止不同设备和软件播放时的显示差异问题所导致的不稳定的因素
  • 有些视频封装格式不支持直接封装CC字幕(如MP4、AVI等)
  • 优化视频体积和画质
  • 防止视频平台不支持CC字幕

以上几点,除了优化视频体积和画质以外,都和另一种字幕形式——CC字幕的特点有关,将在下一节进行详细的介绍。

优化视频体积和画质也不难理解,就拿我们常见的电影举例,一部电影的蓝光原盘的视频体积是非常巨大的,一般能到达40G左右,这对于国内之前“小水管”的网络带宽状况是不可接受的。但我们平时下的电影资源,一部1080P分辨率的相同的电影的大小也只在5G左右,在这个过程中,压制起到了决定性的作用。压制,简而言之,就是在保证视频画质最佳的前提下将视频体积压缩至一般人或视频平台能够接受的范围内,这是一个技术活,并非简单地压缩或转码,需要大量的视频编码方面的知识储备和经验。因此,千万别小看字幕组中的压制这一角色,他是使这些视频能在互联网中快速传播的关键。

2.CC字幕

CC字幕 (Closed Caption, 隐藏式字幕),又称软字幕。虽然CC字幕这个概念在近几年才为国人所知,但其实CC字幕早在上世纪90年代就已出现,1993年以后美国出售的大于13英寸的电视机都有CC字幕的解码器。CC字幕,在国外主要是为了方便有听力障碍的残障人士,一般国外并没有看视频时观看字幕的习惯,对于他们而言,字幕也许不仅不能帮助观看者理解,还可能阻挡画面,因此这种字幕的开关是可以选择的。

CC字幕分为两种:一种是直接封装在视频中的,另一种是以独立文件存在的。

2.1.封装在视频中的字幕(内嵌字幕)

视频格式(MP4、AVI、FLV、MKV、MOV等)通常是指视频的封装格式。封装格式可以看作一个盒子,盒子里装有视频画面、音频、字幕等信息。封装在视频中的字幕就是指将字幕文件直接和视频封装成一个视频文件(通常是MKV文件)。在播放时,支持CC字幕的播放器就能在视频文件中找到字幕文件,并在您打开CC字幕后显示出来。

2.2.独立成文件的字幕(外挂字幕)

外挂字幕是指没有被封装进视频本体中,而是独立于视频以文件形式存在的字幕(通常是ASS、SRT、LRC等文件)。和内嵌字幕一样,只要遵循相关命名规范,在播放时,支持CC字幕的播放器就能在视频文件的同文件夹下中找到字幕文件,并在您打开CC字幕后显示出来。即使命名不规范,播放器没有自动识别,也可以手动进行加载。和内嵌字幕不同的是,这种独立出来的字幕可以进行自由的编辑处理(因为他们本质上就是遵循了相关字幕格式规范的文本文件而已,里面描述了字幕的时间、内容、格式等信息),所以字幕组会先制作这种格式的字幕,再进行压制或封装字幕的工作。

2.3 字幕标准简介

上面提到了CC字幕的多种不同格式,最常见的如 .SRT、.ASS、.LRC 等,这些不同格式的字幕有着怎样的区别,我在制作字幕时又该如何选择呢?

· SRT

SRT字幕 ( SubRip Text ) 是使用较为广泛的一种字幕格式。它的格式简单,在不同播放器上的表现相对一致。

它的格式是这样的:

1
00:00:00,498 --> 00:00:02,827
- Here's what I love most
about food and diet.

2
00:00:02,827 --> 00:00:06,383
We all eat several times a day,
and we're totally in charge

3
00:00:06,383 --> 00:00:09,427
of what goes on our plate
and what stays off.

SRT字幕由四部分组成:

  1. 字幕编号(以 1 开头的连续编号)
  2. 两个时间码(开始和结束时间)
  3. 字幕文本(允许多行)
  4. 两条字幕间的空行

时间码具有以下格式:

<hours>:<minutes>:<seconds>,<milliseconds>

聊一聊视频字幕

作者

WhitePaper 白芷

发布日期

2022 - 01 - 29