英語の字幕起こしでカンマの使い方が分からない

レッスン動画で学んでみた

DeepSpeechはかなり正確に音声認識をしてくれているのだけど、句読点がないのが泣き所。(;_;)

hello i'm oli welcome to oxford online english

ずらずらと並んだ英単語を見ると「英語の文字起こしなんて無理かも…」と怯んでしまいます。

気を取り直してレッスン動画でカンマの使い方を学びます。まず既に誰かが作成した字幕がついている動画を選び、その字幕を「正解テキスト」にします。

そして自作ツールで原文の字幕を作り、DeepLで翻訳します。この動画のオーリー先生はゆっくり話しているので聴きやすいです。

How To Use Commas - English Writing Lesson



原文・翻訳2本立ての字幕スクリプトのソースです:

<iframe id="ytvideo" width="560" height="315" src="https://www.youtube.com/embed/tNKBut921qM" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
<script src="/js/youtube.external.subtitle.min.js"></script>
<style>
  .youtube-external-subtitle { margin-top: 92px; }
</style>
<script src="/js/subtitles.parser.min.js"></script>
<script>
  var loadSRT = function(url, callback) {
    var httpRequest = new XMLHttpRequest();

    httpRequest.onreadystatechange = function() {
      if (httpRequest.readyState === XMLHttpRequest.DONE) {
        var subtitles = parser.fromSrt(httpRequest.responseText, true);

        for (var i in subtitles) {
          subtitles[i] = {
            start : subtitles[i].startTime / 1000,
            end   : subtitles[i].endTime / 1000,
            text  : subtitles[i].text
          };
        }

        callback(subtitles);
      }
    };

    httpRequest.open('GET', url, true);
    httpRequest.send(null);
  };

  loadSRT('/asset/2020/09-15/Input.srt', function(subtitlesEn) {
    loadSRT('/asset/2020/09-15/Input2.srt', function(subtitlesJp) {
      var subtitles = {
        en: subtitlesEn,
        jp: subtitlesJp
      };

      var youtubeExternalSubtitle = new YoutubeExternalSubtitle.Subtitle(document.getElementById('ytvideo'), subtitles.en);

      document.getElementById('languages').addEventListener('change', function(e) {
        var language = this.value;

        youtubeExternalSubtitle.load(subtitles[language]);
      });
    });
  });
</script>
<div style="text-align: right; margin-bottom: -20px;">
<select id="languages" style="font-size: 14px;">
  <option value="en">English</option>
  <option value="jp">日本語</option>
</select>
</div>

Speech 

関連記事