文字起こし - Harano Times 2020/11/23

パウエル弁護士が正式声明、戦場が明白になった、トランプ弁護士団はなぜ負けまくっている?ソロスがすでに逮捕されたニュースはフェイク?GSAが引き継ぎ開始したことの理由

YouTubeのHarano Timesは、大統領選に関するいろんな情報に対して冷静な考えを述べてくれているので、とてもありがたいチャンネルです。

最新の動画でHaranoさんが文字起こしによる掲載を許可して下さっているので、字幕とテキストを載せます。

continue…▶
字幕 

画像と音声からビデオ

読み上げ音声に字幕をつけるために

音読をICレコーダで録音し、読み間違いやつっかえを修正した音声に字幕をつけたかったのですが、Web ビデオテキストトラックフォーマット (WebVTT)はビデオファイルがないと使えないんですね。

しょうがないので原本のJPEG画像と録音をいっしょにしてMP4ファイルを作りました。

continue…▶

『偉人と英雄:教訓童話』

3 (高山彦九郎・ネルソン・和気清麿・伊藤博文)

昔の本を音読してテキスト化する作業、和気清麿を取り上げて音声付きスライドショービデオを作ります。まずは全編の画像を読みやすいサイズに変えて表示するところから。

原本はこちら:『偉人と英雄 : 教訓童話. 3 (高山彦九郎・ネルソン・和気清麿・伊藤博文)

continue…▶

『食ひ改めよ 無病健康法』

読み上げ起こし用画像

国立デジタル本の画像を得た後は、それを音読して録音するステップに入ります。『偉人の言葉』はその準備ができているのだけど、録音は家族が寝静まった後でないと出来ないので、別の読み上げ本の画像を取る作業をやっておきます。『食ひ改めよ 無病健康法』という、食と健康に関する本です。

continue…▶

PDFファイルから画像を抜き出す

PDFビューワでは読みにくい時に

国立国会図書館デジタルコレクションに収録されている昭和の本を音読して、その録音の文字起こしからテキストデータを作成する試み。最初に困るのがダウンロードしたPDFが読みにくいことです。

読みにくいと言ってもこの場合は、難しい漢字や言い回しということではなくて、「画像が暗い」「字が小さい」など視覚的につらくて読みにくいということです。

それで、PDFからオリジナルのJPEGを抜き出す方法を調べてみました。

continue…▶