テスト用ミニスクリプト

作って使う文字起こしツール

筆者にとってやりやすい文字起こしの過程は以下の3段階に分けられます:

  1. 発話時間がなるべく10秒以内になるように、対象の音声を小分けする
  2. 小分け音声を音声認識エンジンにかけ、1クリップ1行の形式で出力をテキストファイルに保存する
  3. 小分けされた音声または動画を繰り返し再生しつつ、該当箇所のテキストの修正をする

Pythonスクリプト、Audacity、Julius または DeepSpeechで1と2はだいたい望み通りに動いています。

今、3の部分を Python GTK+ を使ってプログラムを書いているところです。今回はテスト用ミニスクリプトで骨組みを作ります。

continue…▶
Python 

GTK+でメディアプレーヤーを作る②

作って使う文字起こしツール

前回、入れ物を作って動画を再生するところまでの mojiokosher.py を書きましたが、VLCライブラリの辺りは説明抜きの丸ごとコピペでした。そのためコマンドウィンドウで出ているエラーの意味もよくわかりません。

今回はVLCをもうちょっときちんと勉強しましょう。

continue…▶
Python 

GTK+でメディアプレーヤーを作る①

作って使う文字起こしツール

動画から文字起こしをするためのプログラムを Python GTK+ で作りたいです。そのプログラムに必須の機能は以下の2つです。

  • ビデオクリップを再生できること
  • テキスト・エディタを兼ね備えていること

まず、動画が再生できるプログラムを作る(というか、世の中の達人のコードを拝借する)ところから始めましょう。

continue…▶
Python