玩转HTML5 Video视频WebVTT字幕使用样式与制作

这篇文章发布于 2018年03月22日，星期四，01:30，归类于 Web综合。阅读 57846 次, 今日 45 次 12 条评论

by zhangxinxu from http://www.zhangxinxu.com/wordpress/?p=7421
本文可全文转载，但需得到原作者书面许可，同时保留原作者和出处，摘要引流则随意。

一、HTML5 Video视频与WebVTT字幕

HTML5 Video视频支持支持外挂字幕，文件后缀名是.vtt，称为WebVTT格式，专门的web字幕格式。使用很简单，用一个<track>元素即可，例如：

<video id="video">
    <source src="example.mp4" type="video/mp4">
    <track src="example.vtt" default>
</video>

只要src属性地址OK，同时有default属性，字幕就会生效。

您可以狠狠地点击这里：HTML5 video视频track加载WebVtt字幕demo

Chrome浏览器下就会显示类似下图的字幕：

字幕效果截图

其中，加载的.vtt文件内容如下：

WEBVTT

00:00:00.001 --> 00:00:01.000
请把你的锅

00:00:01.001 --> 00:00:03.500
带回你的虾

00:00:03.501 --> 00:00:07.000
请把你的微笑留下……

00:00:07.501 --> 00:00:10.000
请把你的锅

00:00:10.001 --> 00:00:12.000
带回你的虾

00:00:12.001 --> 00:00:15.000
请把你的微笑留下

就是个文本文件，且格式很简单，一开始声明下WebVTT，然后下面就是视频时间范围，下一行就是字幕内容，时间可以精确到毫秒，但通常0.5秒足矣。

实际上WebVTT规范可以有更多规则，具体可以参见官网文档。

.vtt文件的MIME type是text/vtt。在Chrome和Firefox浏览器下，.vtt字幕是可以无障碍加载显示的，但是对于IE10+浏览器，虽然也支持.vtt字幕，但是，却需要定义MIME type，否则会无视WebVTT格式。比较简单方式就是在字幕所在文件夹下面添加个.htaccess文件，里面写上AddType text/vtt .vtt。

通常我们保存在电脑中的外挂字幕都不是vtt而是，常见的如srt格式，需要需要用在web中，可以使用工具转一下就好了，自己Node.js写一个，或者使用这个在线小工具：Simple SubRip to WebVTT converter

二、HTML5 Video视频与track元素

对于<track>元素完整的写法应该是：

<track src="example.vtt" kind="subtitles" label="中文字幕" srclang="zh" default>

这里出现了几个属性，分别是kind, label, srclang以及default。

根据MDN文档上的解释，其含义分别如下：

kind

用来表明文字轨迹是干嘛用的。默认值是subtitles，也就是说如果没有添加kind属性，kind会被认为是subtitles；但是，如果有kind属性值，但是不是合法的，则会被认为是metadata。其中，合法的属性值包括下面这些：

subtitles
就是我们平常看电影看动漫时候下面出现的字幕，一般是翻译，或者采访时候口音不清的字幕显示。有时候还会标注一些说明，例如，显示人物姓名身份，当前场景地或者标注之前语言的梗在哪里等。
captions
这里captions专指隐藏式字幕（Closed Captions），简称CC。释义如下图：

文字版说明如下：

「隐藏字幕（Closed Captioning，简称CC)是电视节目或影碟中为有特殊情况或者需要的观众而准备的宇幕，例如观众在听力上有障碍，或者需要无音条件下观赏节目。此时字幕中可使用一些解释性的语言来描述节目内容。J

上面的解释出自这篇我觉得解释非常好的文章：你所不知道的 CC：隐藏式字幕备份文字版

根据我的测试，从效果上而言，subtitles和captions几乎看不到任何区别，有区别的应该是在语义上，或者字幕性质上。subtitles主要就是对人说话进行翻译或确认；而captions不仅需要人对话的内容提示，紧张的背景音乐，或者汽车吱吱作响的刹车声都需要在字幕中描述出来。这样，即使用户静音也能知道视频里到底在玩些什么。我想，如果是经常看国外影视作品的小伙伴肯定会有类似的字幕体验，有的就对话字幕，有的事无巨细，就是subtitles和captions的区别。

如果我们对<video>元素设置controls属性，则就看看到CC标示按钮，如下图：

点击之，我们不仅可以切换字幕（同时多个<track>），还可以关闭字幕。
descriptions
对视频内容的文本描述，可以让盲人用户知道这个视频描述内容，虽然看不见。如果设置kind为descriptions，VTT文件内容不会在屏幕上出现。当视频地址不可见的场合也有类似作用。然而，我自己琢磨了一会儿，完全不知道怎么玩，难道要借助辅助阅读设备？
chapters
用户流量媒体资源时候出现的章节标题。
metadata
元信息。用户不可见，给脚本用的。例如自定义字幕效果，但又不希望视频自己把字幕效果呈现出来。

label

点击CC按钮选择字幕时候出现的文字。可参见上面那张字幕关闭截图。其中的“中文字幕”，“中文字幕修正”就是使用label属性设置的。

label使用代码截图

srclang

VTT文本信息使用的语言。例如，中文zh，英文en。MDN上说，如果kind属性被设为 subtitles，那么srclang必须定义。但是，根据我的测试srclang不定义也没有任何异常，大家可以注意下。

还有一点，我还以为srclang和HTML页面的lang设置有关联，会自动选中对应语言的字幕之类，测试发现我想多了。

default

default我开始以为是默认优先显示的字幕，后来发现不是，default指的是默认会显示的字幕。例如两个<track>元素，如果都没有default属性，那都不显示，需要用户手动调出。另外，default只能出现在一个<track>元素上。

一个<video>视频标签中可以有多个<track>元素，不同<track>元素的kind等属性值也都可以不一样。

例如，demo中的双字幕HTML代码：

<track src="example.vtt" kind="subtitles" label="中文字幕" srclang="zh" default>
<track src="example2.vtt" kind="subtitles" label="中文字幕（修正）" srclang="zh">

三、HTML5 Video视频字幕的样式控制

CSS中有专门的伪元素::cue可以控制字幕的样式。

可以控制的CSS属性包括：

color
opacity
visibility
text-decoration及相关属性
text-shadow
background及相关属性
outline及相关属性
font及相关属性，包括line-height
white-space
text-combine-upright
ruby-position

例如：

::cue {
    background: none;
    color: #fff;
    text-shadow: 0 1px #000, 1px 0 #000, -1px 0 #000, 0 -1px #000;
    font-size: medium;
}

则字幕直接就是白字黑边效果：

字幕黑边效果

除此之外，WebVTT还支持一些HTML标签进行样式控制，常见的有声音<v>标签，颜色<c>，加粗<b>标签，倾斜<i>标签，下划线<u>标签，还有<ruby>和<lang>标签等。

其中<v>比较常见，表示声音，我们可以通过设置属性区别谁说的话，例如：

00:00:07.501 --> 00:00:10.000
<v hanmeimei>韩梅梅说

00:00:07.501 --> 00:00:10.000
<v lilei>李雷说

则可以如下CSS进行红绿颜色区分：

::cue(v[voice=hanmeimei]) {
   color: red;
}
::cue(v[voice=lilei]) {
   color: green;
}

此时字幕效果就是，韩梅梅是红色，而李雷则是绿色草原。

我们还可以直接标签控制样式（注意，仅支持上面提到的这几个标签），例如：

video::cue(i) {
    color: blue;
}

或者类名：

00:00:10.001 --> 00:00:12.000
<c.red>带回你的虾

video::cue(.red) {
    color: red;
}

等等，规则还是挺多的，篇幅原因，就不一一展开了。基本上，上面这几种情况已经很够用了。

眼见为实，您可以狠狠地点击这里：HTML5 video视频WebVtt字幕与样式控制demo

i标签效果截图

更全面的样式控制

原生的字幕样式控制，有CSS属性和字幕HTML标签双重限制，不是很灵活，例如，我希望字幕有比较复杂的排版，这又当如何处理？

可以使用开源的HTML5视频项目，我推荐这个：accessible-html5-video-player，paypal的开源项目，可以对原生的video进行UI重定值，JS很小，未压缩版本就几十K，根据我的测试，其会把VTT文件中HTML片段直接完整输出到页面中，于是乎，所有的CSS属性我们都可以使用了，例如我们可以把字幕在视频上方直接一个绝对定位上去就好了。

四、HTML5 Video WebVTT格式字幕的制作

制作方法一种是视频软件导出字幕再使用工具转，另外一种就是自己手工写，毕竟字幕规则一点都不复杂。然而，纯手工，那么多时间信息，看容易看花弄错，效率比较低下。于是，我就花了2晚上时间弄了个可以提高制作字幕效率的工具。

若有兴趣，可以狠狠地点击这里：WebVTT视频字幕在线生成工具

操作步骤如下：

粘贴视频并回车
输入文字并解析
拖移时间进行微调（工具会自动把视频定位到拖动时间点上）
下载字幕文件

操作步骤图示意

本文一开始的demo中字幕就是用这个工具生成的。

五、结束语

视频是个好东西，等搞定了流量的问题，我倒是有计划可以试试一些好玩的东西。

天色已晚，就不瞎扯了。

感谢阅读，欢迎交流！

参考文章：Adding captions and subtitles to HTML5 video

本文为原创文章，会经常更新知识点以及修正一些错误，因此转载请保留原出处，方便溯源，避免陈旧错误知识的误导，同时有更好的阅读体验。
本文地址：http://www.zhangxinxu.com/wordpress/?p=7421

（本篇完）

使用canvas实现和HTML5 video交互的弹幕效果 (0.380)
CSS蛋疼应用之：数据上报和HTML验证 (0.346)
从天猫某活动视频不必要的3次请求说起 (0.308)
英文单词朗读基于音素预估时长的JS算法 (0.231)
让所有浏览器支持HTML5 video视频标签 (0.078)
揭秘视频网站video视频倍速播放的实现 (0.078)
HTML5 video视频播放Picture-in-Picture画中画技术 (0.078)
HandBrake乃MP4免费压缩webm转换工具不二之选 (0.078)
如何让MP4 video视频背景色变成透明？ (0.078)
ogv.js让iPhone支持webM视频解析播放 (0.078)
node环境中使用fluent-ffmpeg每隔一秒视频截图 (RANDOM - 0.078)

潘旭朔说道：

2024年08月9日 22:46

Hi,HI!
大神你好，我想问一个愚蠢的应用问题。
使用yt-dlp下载土鳖的视频，以及字幕。
其中vtt字幕转换成srt，总是会显示较短的两行，上面那行总是重复之前的半句，这种式样的字幕，也许叫它新闻即时或者歌词，并没有看美剧时那种传统的字幕舒服。
有木有什么方法，让它正常转换成不重复的srt字幕？