JPEG画像の書籍を読み上げてその音声データからテキスト化する試み。最初の本は『共産党を吾等が排撃する五つの理由』です。
文字起こしが終わったので見出しと段落をつける作業に取り掛かりました。先ずは序文を要約スクリプトにかけ、どの箇所がキーポイントになるか調べてみます。
continue…▶「漫画漫文」は、大正から昭和初期にかけて漫画界の流行スタイルになった独特の形式で、紙の上半分が漫画、下半分が文章になっています。私は、この形式で自分の思いや意見を書き留められる「漫画漫文ノート」を作りたいと思いました。
そのために漫画ヘルパーアプリを開発し「漫画漫文ツール(mmTool)」と名付けて公開することにしました。デジタル疲れを癒やすためのツールになることを願って、漫画漫文ノートを広めたいと思っています。
“Manga-Manbun” is a unique format that became a popular style in the manga world from the Taisho era to the early Showa era, where the top half of the paper is manga and the bottom half is text. I wanted to create a “Manga-Manbun Notes” where I could jot down my thoughts and opinions in this format.
To achieve this, I developed a manga helper app and decided to release it under the name “Manga-Manbun Tool (mmTool)". I hope it becomes a tool to heal digital fatigue and wish to spread the use of Manga-Manbun Notes.
JPEG画像の書籍を読み上げてその音声データからテキスト化する試み。最初の本は『共産党を吾等が排撃する五つの理由』です。
文字起こしが終わったので見出しと段落をつける作業に取り掛かりました。先ずは序文を要約スクリプトにかけ、どの箇所がキーポイントになるか調べてみます。
continue…▶国立国会図書館デジタルコレクションで昭和の本を読もうと思います。JPEGで保存されている本を声に出して読んで、その録音を文字起こしでテキスト化すれば、後でいろいろ役に立ちそうなので面白いかなという気がしていますが…。
continue…▶文字起こし作業でテキストデータを作成し、それを要約スクリプトにかけてみます。
continue…▶そもそも、なぜ英語の字幕起こしをやりたくなったかというと、プログラミングやマイクロコンピュータについてしっかり習いたいという欲求があり、それを満たしてくれそうな英語の動画がたくさんあったからです。
ニュースや政治経済の動画はまだまだ正解がないと歯が立たないけど、長年過ごしてきた分野のものなら自力でなんとかなるかもと、ゆっくり話してくれている短い動画で字幕起こしをやってみました。
continue…▶自分では字幕の文にも句読点がある方が読みやすいけど、どうなんだろう?
continue…▶自作文字起こしツールについてはそのうち詳細を書こうと思いますが、そのツールを使って英語の字幕起こしに取り組んでいます。
今は悲しいほどにリスニングが弱いので、正解テキストを原音声の息継ぎ部分で小分けした部分に当てはめてるだけです。それでも、出来上がった字幕がきちんと動作するのを見ると楽しくなります。
continue…▶戸井田さんの国会答弁が入っている動画の前にリリースされた動画で、水間さんがNHKの日本軍の毒ガス問題に関した報道をばっさり斬っていたので、これも字幕起こし。
continue…▶国士と言われる国会議員の姿に感動して、字幕をつけました。
continue…▶DeepSpeechはかなり正確に音声認識をしてくれているのだけど、句読点がないのが泣き所。(;_;)
hello i'm oli welcome to oxford online english
ずらずらと並んだ英単語を見ると「英語の文字起こしなんて無理かも…」と怯んでしまいます。
continue…▶民視英語新聞のニュースを素材に、まず英語の字幕ファイルを作り、次に日本語翻訳ファイルを追加します。
※字幕・翻訳ともなるべく正確に仕上げるように努めていますが、間違いの箇所があるかも知れません。予めご了承の上ご覧ください。
continue…▶