From ac4010ffd8833fa5189dd39cc1c8adbbb8e53b83 Mon Sep 17 00:00:00 2001
From: Yiren Wang <yrw@chromium.org>
Date: Wed, 25 Mar 2026 14:52:27 -0700
Subject: [PATCH 1/2] Add MediaTranscripts to MediaMetadata (#370)

---
 index.bs | 279 ++++++++++++++++++++++++++++++++++++++++++++++++++++++-
 1 file changed, 277 insertions(+), 2 deletions(-)
diff --git a/index.bs b/index.bs
index 0aa28bc..97b5e6a 100644
--- a/index.bs
+++ b/index.bs
@@ -1090,6 +1090,7 @@ interface MediaMetadata {
   attribute DOMString album;
   attribute FrozenArray&lt;object> artwork;
   [SameObject] readonly attribute FrozenArray&lt;ChapterInformation> chapterInfo;
+  [SameObject] readonly attribute FrozenArray&lt;MediaTranscripts> transcripts;
 };
 
 dictionary MediaMetadataInit {
@@ -1098,6 +1099,7 @@ dictionary MediaMetadataInit {
   DOMString album = "";
   sequence&lt;MediaImage> artwork = [];
   sequence&lt;ChapterInformationInit> chapterInfo = [];
+  sequence&lt;MediaTranscriptsInit> transcripts = [];
 };
 </pre>
 
@@ -1131,6 +1133,11 @@ dictionary MediaMetadataInit {
   chapter information</dfn>.
 </p>
 
+<p>
+  A {{MediaMetadata}} has an associated list of <dfn for="MediaMetadata">
+  transcripts</dfn>.
+</p>
+
 <p>
   A {{MediaMetadata}} is said to be an <dfn>empty metadata</dfn> if it is equal
   to `null` or all the following conditions are true:
@@ -1143,6 +1150,7 @@ dictionary MediaMetadataInit {
   is <code>0</code>.</li>
   <li>Its <a for=MediaMetadata>chapter information</a> length is
   <code>0</code>.</li>
+  <li>Its <a for=MediaMetadata>transcripts</a> length is <code>0</code>.</li>
 </ul>
 
 <p>
@@ -1185,6 +1193,19 @@ dictionary MediaMetadataInit {
     to the result of [=Create a frozen array|creating a frozen array=] from
     <var>chapters</var>.
   </li>
+  <li>
+    Let <var>transcripts</var> be an empty list of type {{MediaTranscripts}}.
+  </li>
+  <li>
+    For each <var>entry</var> in <var>init</var>'s
+    {{MediaMetadataInit/transcripts}}, [=create a MediaTranscripts=] from
+    <var>entry</var> and append it to <var>transcripts</var>.
+  </li>
+  <li>
+    Set <var>metadata</var>'s <a for="MediaMetadata">transcripts</a>
+    to the result of [=Create a frozen array|creating a frozen array=] from
+    <var>transcripts</var>.
+  </li>
   <li>
     Return <var>metadata</var>.
   </li>
@@ -1319,10 +1340,29 @@ user agent MUST run the following steps:
   </li>
 </ol>
 
+<p>
+  The <dfn attribute for="MediaMetadata">chapterInfo</dfn> attribute reflects
+  the {{MediaMetadata}}'s <a for=MediaMetadata>chapter information</a>.
+  On getting, it MUST return the {{MediaMetadata}}'s
+  <a for=MediaMetadata>chapter information</a>. On setting, it MUST set the
+  {{MediaMetadata}}'s <a for=MediaMetadata>chapter information</a> to the given
+  value.
+</p>
+
+<p>
+  The <dfn attribute for="MediaMetadata">transcripts</dfn> attribute reflects
+  the {{MediaMetadata}}'s <a for=MediaMetadata>transcripts</a>. On getting,
+  it MUST return the {{MediaMetadata}}'s <a for=MediaMetadata>transcripts</a>.
+  On setting, it MUST set the {{MediaMetadata}}'s
+  <a for=MediaMetadata>transcripts</a> to the given value.
+</p>
+
 <p>
   When {{MediaMetadata}}'s <a for=MediaMetadata>title</a>, <a
-  for=MediaMetadata>artist</a>, <a for=MediaMetadata>album</a> or <a
-  for=MediaMetadata>artwork images</a> are modified, the user agent MUST run the
+  for=MediaMetadata>artist</a>, <a for=MediaMetadata>album</a>,
+  <a for=MediaMetadata>artwork images</a>,
+  <a for=MediaMetadata>chapter information</a> or
+  <a for=MediaMetadata>transcripts</a> are modified, the user agent MUST run the
   following steps:
 </p>
 <ol>
@@ -1482,6 +1522,241 @@ used to specify the {{MediaImage}} object's <a>MIME type</a>. It is a hint as to
 the media type of the image. The purpose of this attribute is to allow a user
 agent to ignore images of media types it does not support.
 
+<h2 id="the-media-transcripts-interface">The {{MediaTranscripts}} interface</h2>
+
+<pre class="idl">
+[Exposed=Window]
+interface MediaTranscripts {
+  readonly attribute DOMString language;
+  [SameObject] readonly attribute FrozenArray&lt;MediaTranscript> transcripts;
+};
+
+dictionary MediaTranscriptsInit {
+  DOMString language = "en-US";
+  sequence&lt;MediaTranscript> transcripts = [];
+};
+</pre>
+
+<p>
+  A {{MediaTranscripts}} object is a representation of transcripts for a
+  language, which can be used by user agents to provide transcription for the
+  media content.
+</p>
+
+<p>
+  A {{MediaTranscripts}} has an associated
+  <dfn for="MediaTranscripts">language</dfn> which is DOMString of a BCP 47
+  language tag.
+</p>
+
+<p>
+  A {{MediaTranscripts}} has an associated list of
+  <dfn for="MediaTranscripts">transcripts</dfn> for the language.
+</p>
+
+<p>
+  To <dfn>create a {{MediaTranscripts}}</dfn> with <var>init</var>, run the
+  following steps:
+</p>
+<ol>
+  <li>
+    Let <var>transcripts</var> be a new {{MediaTranscripts}} object.
+  </li>
+  <li>
+    If <var>init</var>'s {{MediaTranscripts/language}} is not a valid BCP 47
+    language tag, throw a <a exception>TypeError</a> and abort these steps.
+  </li>
+  <li>
+    Set <var>transcripts</var>'s {{MediaTranscripts/language}} to
+    <var>init</var>'s {{MediaTranscripts/language}}.
+  </li>
+  <li>
+    Let <var>transcriptList</var> be an empty list of type {{MediaTranscript}}.
+  </li>
+  <li>
+    For each <var>entry</var> in <var>init</var>'s
+    {{MediaTranscriptsInit/transcripts}}, [=create a MediaTranscript=] from
+    <var>entry</var> and append it to <var>transcriptList</var>.
+  </li>
+  <li>
+    Set <var>transcripts</var>'s <a for="MediaTranscripts">transcripts</a> to
+    the result of [=Create a frozen array|creating a frozen array=] from
+    <var>transcriptList</var>.
+  </li>
+  <li>
+    Return <var>transcripts</var>.
+  </li>
+</ol>
+
+<p>
+  The <dfn attribute for="MediaTranscripts">language</dfn> attribute reflects
+  the {{MediaTranscripts}}'s <a for=MediaTranscripts>language</a>. On getting,
+  it MUST return the {{MediaTranscripts}}'s
+  <a for=MediaTranscripts>language</a>.
+</p>
+
+<p>
+  The <dfn attribute for="MediaTranscripts">transcripts</dfn> attribute
+  reflects the {{MediaTranscripts}}'s <a for="MediaTranscripts">transcripts</a>.
+  On getting, it MUST return the {{MediaTranscripts}}'s
+  <a for=MediaTranscripts>transcripts</a>.
+</p>
+
+<h2 id="the-media-transcript-interface">The {{MediaTranscript}} interface</h2>
+
+<pre class="idl">
+enum MediaTranscriptType {
+    "subtitles",
+    "captions",
+    "descriptions",
+    "metadata",
+};
+
+[Exposed=Window]
+interface MediaTranscript {
+    readonly attribute MediaTranscriptType type;
+    readonly attribute DOMString speaker;
+    readonly attribute double startTime;
+    readonly attribute double endTime;
+    readonly attribute DOMString text;
+};
+
+dictionary MediaTranscriptInit {
+  MediaTranscriptType type = "subtitles";
+  DOMString speaker = "";
+  double startTime = 0;
+  double endTime = 0;
+  DOMString text = "";
+};
+</pre>
+
+<p>
+  A {{MediaTranscript}} object is a representation of a single piece of
+  transcript information.
+</p>
+
+<p>
+  A {{MediaTranscript}} has an associated <dfn for="MediaTranscript">type</dfn>
+  which is an enum of {{MediaTranscriptType}} to indicate the purpose of the
+  transcript. {{MediaTranscriptType}} can have one of the following values:
+</p>
+<ul>
+  <li>
+    <dfn enum-value for=MediaTranscriptType>subtitles</dfn>: transcription or
+    translation of the dialogue, suitable for when the sound is available but
+    not understood by the users.
+  </li>
+  <li>
+    <dfn enum-value for=MediaTranscriptType>captions</dfn>: transcription or
+    translation of the dialogue, sound effects, musical cues, and other
+    relevant audio information, suitable for when the soundtrack is unavailable.
+  </li>
+  <li>
+    <dfn enum-value for=MediaTranscriptType>descriptions</dfn>: textual
+    descriptions of the video component of the media, intended for audio
+    synthesis when the visual component is unavailable.
+  </li>
+  <li>
+    <dfn enum-value for=MediaTranscriptType>metadata</dfn>: information intended
+    for use from scripts and usually not visible to the users.
+  </li>
+</ul>
+
+<p>
+  A {{MediaTranscript}} has an associated
+  <dfn for="MediaTranscript">speaker</dfn> which is a DOMString of the name or
+  character identifier for the speaker.
+</p>
+
+<p>
+  A {{MediaTranscript}} has an associated
+  <dfn for="MediaTranscript">startTime</dfn> which is double.
+</p>
+
+<p>
+  A {{MediaTranscript}} has an associated
+  <dfn for="MediaTranscript">endTime</dfn> which is double.
+</p>
+
+<p>
+  A {{MediaTranscript}} has an associated <dfn for="MediaTranscript">text</dfn>
+  which is a DOMString of content for the transcript.
+</p>
+
+<p>
+  To <dfn>create a {{MediaTranscript}}</dfn> with <var>init</var>, run the
+  following steps:
+</p>
+<ol>
+  <li>
+    Let <var>transcript</var> be a new {{MediaTranscript}} object.
+  </li>
+  <li>
+    Set <var>transcript</var>'s {{MediaTranscript/type}} to <var>init</var>'s
+    {{MediaTranscript/type}}.
+  </li>
+  <li>
+    Set <var>transcript</var>'s {{MediaTranscript/speaker}} to <var>init</var>'s
+    {{MediaTranscript/speaker}}.
+  </li>
+  <li>
+    If <var>init</var>'s {{MediaTranscript/startTime}} is negative, throw a
+    <a exception>TypeError</a> and abort these steps.
+  </li>
+  <li>
+    Set <var>transcript</var>'s {{MediaTranscript/startTime}} to
+    <var>init</var>'s {{MediaTranscript/startTime}}.
+  </li>
+  <li>
+    If <var>init</var>'s {{MediaTranscript/endTime}} is negative or smaller than
+    <var>init</var>'s {{MediaTranscript/startTime}}, throw a
+    <a exception>TypeError</a> and abort these steps.
+  </li>
+  <li>
+    Set <var>transcript</var>'s {{MediaTranscript/endTime}} to <var>init</var>'s
+    {{MediaTranscript/endTime}}.
+  </li>
+  <li>
+    Set <var>transcript</var>'s {{MediaTranscript/text}} to <var>init</var>'s
+    {{MediaTranscript/text}}.
+  </li>
+  <li>
+    Return <var>transcript</var>.
+  </li>
+</ol>
+
+<p>
+  The <dfn attribute for="MediaTranscript">type</dfn> attribute reflects
+  the {{MediaTranscript}}'s <a for=MediaTranscript>type</a>. On getting,
+  it MUST return the {{MediaTranscript}}'s <a for=MediaTranscript>type</a>.
+</p>
+
+<p>
+  The <dfn attribute for="MediaTranscript">speaker</dfn> attribute reflects
+  the {{MediaTranscript}}'s <a for=MediaTranscript>speaker</a>. On getting,
+  it MUST return the {{MediaTranscript}}'s <a for=MediaTranscript>speaker</a>.
+</p>
+
+<p>
+  The <dfn attribute for="MediaTranscript">startTime</dfn> attribute reflects
+  the {{MediaTranscript}}'s <a for=MediaTranscript>startTime</a> in seconds.
+  On getting, it MUST return the {{MediaTranscript}}'s
+  <a for=MediaTranscript>startTime</a>.
+</p>
+
+<p>
+  The <dfn attribute for="MediaTranscript">endTime</dfn> attribute reflects
+  the {{MediaTranscript}}'s <a for=MediaTranscript>endTime</a> in seconds.
+  On getting, it MUST return the {{MediaTranscript}}'s
+  <a for=MediaTranscript>endTime</a>.
+</p>
+
+<p>
+  The <dfn attribute for="MediaTranscript">text</dfn> attribute reflects
+  the {{MediaTranscript}}'s <a for=MediaTranscript>text</a>. On getting,
+  it MUST return the {{MediaTranscript}}'s <a for=MediaTranscript>text</a>.
+</p>
+
 <h2 id="the-mediapositionstate-dictionary">The {{MediaPositionState}}
 dictionary</h2>
 

From f72e2e97276bbbe185249ab4a0fba2fb36d5c75d Mon Sep 17 00:00:00 2001
From: Yiren Wang <yrw@chromium.org>
Date: Wed, 1 Apr 2026 17:32:51 -0700
Subject: [PATCH 2/2] Update MediaTranscript to be a dictionary

---
 index.bs | 194 ++++++++++++++++---------------------------------------
 1 file changed, 57 insertions(+), 137 deletions(-)

diff --git a/index.bs b/index.bs
index 97b5e6a..26c4218 100644
--- a/index.bs
+++ b/index.bs
@@ -1130,12 +1130,12 @@ dictionary MediaMetadataInit {
 
 <p>
   A {{MediaMetadata}} has an associated list of <dfn for="MediaMetadata">
-  chapter information</dfn>.
+  chapter information</dfn>, which is a sequence of type {{ChapterInformation}}.
 </p>
 
 <p>
   A {{MediaMetadata}} has an associated list of <dfn for="MediaMetadata">
-  transcripts</dfn>.
+  transcripts</dfn>, which is a sequence of type {{MediaTranscripts}}.
 </p>
 
 <p>
@@ -1185,13 +1185,11 @@ dictionary MediaMetadataInit {
   <li>
     For each <var>entry</var> in <var>init</var>'s
     {{MediaMetadataInit/chapterInfo}}, [=create a ChapterInformation=] from
-    <var>entry</var> and append it to
-    <var>chapters</var>.
+    <var>entry</var> and append it to <var>chapters</var>.
   </li>
   <li>
     Set <var>metadata</var>'s <a for="MediaMetadata">chapter information</a>
-    to the result of [=Create a frozen array|creating a frozen array=] from
-    <var>chapters</var>.
+    to the result of [=creating a frozen array=] from <var>chapters</var>.
   </li>
   <li>
     Let <var>transcripts</var> be an empty list of type {{MediaTranscripts}}.
@@ -1203,8 +1201,7 @@ dictionary MediaMetadataInit {
   </li>
   <li>
     Set <var>metadata</var>'s <a for="MediaMetadata">transcripts</a>
-    to the result of [=Create a frozen array|creating a frozen array=] from
-    <var>transcripts</var>.
+    to the result of [=creating a frozen array=] from <var>transcripts</var>.
   </li>
   <li>
     Return <var>metadata</var>.
@@ -1343,8 +1340,8 @@ user agent MUST run the following steps:
 <p>
   The <dfn attribute for="MediaMetadata">chapterInfo</dfn> attribute reflects
   the {{MediaMetadata}}'s <a for=MediaMetadata>chapter information</a>.
-  On getting, it MUST return the {{MediaMetadata}}'s
-  <a for=MediaMetadata>chapter information</a>. On setting, it MUST set the
+  On getting, it must return the {{MediaMetadata}}'s
+  <a for=MediaMetadata>chapter information</a>. On setting, it must set the
   {{MediaMetadata}}'s <a for=MediaMetadata>chapter information</a> to the given
   value.
 </p>
@@ -1352,8 +1349,8 @@ user agent MUST run the following steps:
 <p>
   The <dfn attribute for="MediaMetadata">transcripts</dfn> attribute reflects
   the {{MediaMetadata}}'s <a for=MediaMetadata>transcripts</a>. On getting,
-  it MUST return the {{MediaMetadata}}'s <a for=MediaMetadata>transcripts</a>.
-  On setting, it MUST set the {{MediaMetadata}}'s
+  it must return the {{MediaMetadata}}'s <a for=MediaMetadata>transcripts</a>.
+  On setting, it must set the {{MediaMetadata}}'s
   <a for=MediaMetadata>transcripts</a> to the given value.
 </p>
 
@@ -1362,7 +1359,7 @@ user agent MUST run the following steps:
   for=MediaMetadata>artist</a>, <a for=MediaMetadata>album</a>,
   <a for=MediaMetadata>artwork images</a>,
   <a for=MediaMetadata>chapter information</a> or
-  <a for=MediaMetadata>transcripts</a> are modified, the user agent MUST run the
+  <a for=MediaMetadata>transcripts</a> are modified, the user agent must run the
   following steps:
 </p>
 <ol>
@@ -1539,14 +1536,14 @@ dictionary MediaTranscriptsInit {
 
 <p>
   A {{MediaTranscripts}} object is a representation of transcripts for a
-  language, which can be used by user agents to provide transcription for the
+  language, which are used by user agents to provide transcription for the
   media content.
 </p>
 
 <p>
   A {{MediaTranscripts}} has an associated
-  <dfn for="MediaTranscripts">language</dfn> which is DOMString of a BCP 47
-  language tag.
+  <dfn for="MediaTranscripts">language</dfn> which is {{DOMString}} of a
+  [[BCP47]] language tag.
 </p>
 
 <p>
@@ -1555,33 +1552,26 @@ dictionary MediaTranscriptsInit {
 </p>
 
 <p>
-  To <dfn>create a {{MediaTranscripts}}</dfn> with <var>init</var>, run the
-  following steps:
+  To <dfn>create a {{MediaTranscripts}}</dfn> given a {{MediaTranscriptsInit}}
+  <var>init</var>, run the following steps:
 </p>
 <ol>
   <li>
-    Let <var>transcripts</var> be a new {{MediaTranscripts}} object.
+    Let <var>transcripts</var> be a [=new=] {{MediaTranscripts}} object.
   </li>
   <li>
-    If <var>init</var>'s {{MediaTranscripts/language}} is not a valid BCP 47
-    language tag, throw a <a exception>TypeError</a> and abort these steps.
+    If <var>init</var>'s {{MediaTranscriptsInit/language}} is not a valid
+    [[BCP47]] language tag defined in [[LANG-SUBTAG-REGISTRY]], throw a
+    <a exception>TypeError</a> and abort these steps.
   </li>
   <li>
     Set <var>transcripts</var>'s {{MediaTranscripts/language}} to
-    <var>init</var>'s {{MediaTranscripts/language}}.
-  </li>
-  <li>
-    Let <var>transcriptList</var> be an empty list of type {{MediaTranscript}}.
-  </li>
-  <li>
-    For each <var>entry</var> in <var>init</var>'s
-    {{MediaTranscriptsInit/transcripts}}, [=create a MediaTranscript=] from
-    <var>entry</var> and append it to <var>transcriptList</var>.
+    <var>init</var>'s {{MediaTranscriptsInit/language}}.
   </li>
   <li>
-    Set <var>transcripts</var>'s <a for="MediaTranscripts">transcripts</a> to
-    the result of [=Create a frozen array|creating a frozen array=] from
-    <var>transcriptList</var>.
+    Set <var>transcripts</var>'s {{MediaTranscripts/transcripts}} to
+    the result of [=creating a frozen array=] from <var>init</var>'s
+    {{MediaTranscriptsInit/transcripts}}.
   </li>
   <li>
     Return <var>transcripts</var>.
@@ -1591,37 +1581,28 @@ dictionary MediaTranscriptsInit {
 <p>
   The <dfn attribute for="MediaTranscripts">language</dfn> attribute reflects
   the {{MediaTranscripts}}'s <a for=MediaTranscripts>language</a>. On getting,
-  it MUST return the {{MediaTranscripts}}'s
+  it must return the {{MediaTranscripts}}'s
   <a for=MediaTranscripts>language</a>.
 </p>
 
 <p>
   The <dfn attribute for="MediaTranscripts">transcripts</dfn> attribute
   reflects the {{MediaTranscripts}}'s <a for="MediaTranscripts">transcripts</a>.
-  On getting, it MUST return the {{MediaTranscripts}}'s
+  On getting, it must return the {{MediaTranscripts}}'s
   <a for=MediaTranscripts>transcripts</a>.
 </p>
 
-<h2 id="the-media-transcript-interface">The {{MediaTranscript}} interface</h2>
+<h2 id="the-media-transcript-dictionary">The {{MediaTranscript}} dictionary</h2>
 
 <pre class="idl">
 enum MediaTranscriptType {
-    "subtitles",
-    "captions",
-    "descriptions",
-    "metadata",
+  "subtitles",
+  "captions",
+  "descriptions",
+  "metadata",
 };
 
-[Exposed=Window]
-interface MediaTranscript {
-    readonly attribute MediaTranscriptType type;
-    readonly attribute DOMString speaker;
-    readonly attribute double startTime;
-    readonly attribute double endTime;
-    readonly attribute DOMString text;
-};
-
-dictionary MediaTranscriptInit {
+dictionary MediaTranscript {
   MediaTranscriptType type = "subtitles";
   DOMString speaker = "";
   double startTime = 0;
@@ -1631,14 +1612,14 @@ dictionary MediaTranscriptInit {
 </pre>
 
 <p>
-  A {{MediaTranscript}} object is a representation of a single piece of
+  The {{MediaTranscript}} dictionary is a representation of a single piece of
   transcript information.
 </p>
 
 <p>
-  A {{MediaTranscript}} has an associated <dfn for="MediaTranscript">type</dfn>
-  which is an enum of {{MediaTranscriptType}} to indicate the purpose of the
-  transcript. {{MediaTranscriptType}} can have one of the following values:
+The <dfn dict-member for="MediaTranscript">type</dfn> <a>dictionary member</a>
+is used to specify the purpose of the transcript. It is an enum of
+{{MediaTranscriptType}} which has one of the following values:
 </p>
 <ul>
   <li>
@@ -1663,98 +1644,26 @@ dictionary MediaTranscriptInit {
 </ul>
 
 <p>
-  A {{MediaTranscript}} has an associated
-  <dfn for="MediaTranscript">speaker</dfn> which is a DOMString of the name or
-  character identifier for the speaker.
-</p>
-
-<p>
-  A {{MediaTranscript}} has an associated
-  <dfn for="MediaTranscript">startTime</dfn> which is double.
-</p>
-
-<p>
-  A {{MediaTranscript}} has an associated
-  <dfn for="MediaTranscript">endTime</dfn> which is double.
-</p>
-
-<p>
-  A {{MediaTranscript}} has an associated <dfn for="MediaTranscript">text</dfn>
-  which is a DOMString of content for the transcript.
-</p>
-
-<p>
-  To <dfn>create a {{MediaTranscript}}</dfn> with <var>init</var>, run the
-  following steps:
-</p>
-<ol>
-  <li>
-    Let <var>transcript</var> be a new {{MediaTranscript}} object.
-  </li>
-  <li>
-    Set <var>transcript</var>'s {{MediaTranscript/type}} to <var>init</var>'s
-    {{MediaTranscript/type}}.
-  </li>
-  <li>
-    Set <var>transcript</var>'s {{MediaTranscript/speaker}} to <var>init</var>'s
-    {{MediaTranscript/speaker}}.
-  </li>
-  <li>
-    If <var>init</var>'s {{MediaTranscript/startTime}} is negative, throw a
-    <a exception>TypeError</a> and abort these steps.
-  </li>
-  <li>
-    Set <var>transcript</var>'s {{MediaTranscript/startTime}} to
-    <var>init</var>'s {{MediaTranscript/startTime}}.
-  </li>
-  <li>
-    If <var>init</var>'s {{MediaTranscript/endTime}} is negative or smaller than
-    <var>init</var>'s {{MediaTranscript/startTime}}, throw a
-    <a exception>TypeError</a> and abort these steps.
-  </li>
-  <li>
-    Set <var>transcript</var>'s {{MediaTranscript/endTime}} to <var>init</var>'s
-    {{MediaTranscript/endTime}}.
-  </li>
-  <li>
-    Set <var>transcript</var>'s {{MediaTranscript/text}} to <var>init</var>'s
-    {{MediaTranscript/text}}.
-  </li>
-  <li>
-    Return <var>transcript</var>.
-  </li>
-</ol>
-
-<p>
-  The <dfn attribute for="MediaTranscript">type</dfn> attribute reflects
-  the {{MediaTranscript}}'s <a for=MediaTranscript>type</a>. On getting,
-  it MUST return the {{MediaTranscript}}'s <a for=MediaTranscript>type</a>.
+  The <dfn dict-member for="MediaTranscript">speaker</dfn>
+  <a>dictionary member</a> is used to specify the speaker of the transcript.
+  It is a {{DOMString}} of the name or character identifier of the speaker.
 </p>
 
 <p>
-  The <dfn attribute for="MediaTranscript">speaker</dfn> attribute reflects
-  the {{MediaTranscript}}'s <a for=MediaTranscript>speaker</a>. On getting,
-  it MUST return the {{MediaTranscript}}'s <a for=MediaTranscript>speaker</a>.
+  The <dfn dict-member for="MediaTranscript">startTime</dfn>
+  <a>dictionary member</a> is used to specify the start time of the transcript
+  in seconds. It should be zero or positive.
 </p>
 
 <p>
-  The <dfn attribute for="MediaTranscript">startTime</dfn> attribute reflects
-  the {{MediaTranscript}}'s <a for=MediaTranscript>startTime</a> in seconds.
-  On getting, it MUST return the {{MediaTranscript}}'s
-  <a for=MediaTranscript>startTime</a>.
+  The <dfn dict-member for="MediaTranscript">endTime</dfn>
+  <a>dictionary member</a> is used to specify the end time of the transcript in
+  seconds. It should be larger than {{MediaTranscript/startTime}}.
 </p>
 
 <p>
-  The <dfn attribute for="MediaTranscript">endTime</dfn> attribute reflects
-  the {{MediaTranscript}}'s <a for=MediaTranscript>endTime</a> in seconds.
-  On getting, it MUST return the {{MediaTranscript}}'s
-  <a for=MediaTranscript>endTime</a>.
-</p>
-
-<p>
-  The <dfn attribute for="MediaTranscript">text</dfn> attribute reflects
-  the {{MediaTranscript}}'s <a for=MediaTranscript>text</a>. On getting,
-  it MUST return the {{MediaTranscript}}'s <a for=MediaTranscript>text</a>.
+  The <dfn dict-member for="MediaTranscript">text</dfn> <a>dictionary member</a>
+  is used to specify the content of the transcript. It is a {{DOMString}}.
 </p>
 
 <h2 id="the-mediapositionstate-dictionary">The {{MediaPositionState}}
@@ -1892,6 +1801,17 @@ media session</a>.
       chapterInfo: [
         {title: "Chapter 1", startTime: 0, artwork: [{src: "chapter1.jpg"}]},
         {title: "Chapter 2", startTime: 120, artwork: [{src: "chapter2.jpg"}]}
+      ],
+      transcripts: [
+        {language: "en-US", transcripts: [
+          {type: "subtitles", speaker: "Podcast Host", startTime: 0,
+           endTime: 1, text: "Subtitles 1"},
+          {type: "subtitles", speaker: "Podcast Guest", startTime: 1,
+           endTime: 2, text: "Subtitles 2"}
+         ]},
+        {language: "en-GB", transcripts: [
+          {type: "captions", startTime: 0, text: "Captions 1"}
+         ]}
       ]
     });
   </pre>