Gtkビデオ再生

私の文字起こしツール:原型

動画の文字起こしをするための自分用ツール、mojiokosher.py。

当初はGtkウィンドウの中に動画再生とテキストエディタのウィジェットを持たせるつもりでしたが、テキスト編集は既成のエディタでよさそうなので、ビデオを再生することにフォーカスします。

continue…▶
Python 

テスト用ミニスクリプト

作って使う文字起こしツール

筆者にとってやりやすい文字起こしの過程は以下の3段階に分けられます:

  1. 発話時間がなるべく10秒以内になるように、対象の音声を小分けする
  2. 小分け音声を音声認識エンジンにかけ、1クリップ1行の形式で出力をテキストファイルに保存する
  3. 小分けされた音声または動画を繰り返し再生しつつ、該当箇所のテキストの修正をする

Pythonスクリプト、Audacity、Julius または DeepSpeechで1と2はだいたい望み通りに動いています。

今、3の部分を Python GTK+ を使ってプログラムを書いているところです。今回はテスト用ミニスクリプトで骨組みを作ります。

continue…▶
Python 

GTK+でメディアプレーヤーを作る②

作って使う文字起こしツール

前回、入れ物を作って動画を再生するところまでの mojiokosher.py を書きましたが、VLCライブラリの辺りは説明抜きの丸ごとコピペでした。そのためコマンドウィンドウで出ているエラーの意味もよくわかりません。

今回はVLCをもうちょっときちんと勉強しましょう。

continue…▶
Python 

GTK+でメディアプレーヤーを作る①

作って使う文字起こしツール

動画から文字起こしをするためのプログラムを Python GTK+ で作りたいです。そのプログラムに必須の機能は以下の2つです。

  • ビデオクリップを再生できること
  • テキスト・エディタを兼ね備えていること

まず、動画が再生できるプログラムを作る(というか、世の中の達人のコードを拝借する)ところから始めましょう。

continue…▶
Python