odysee Augmented Startups 2021年06月10日より。
ハイライト:
- OpenCVとMediaPipeで、画像から手の部分を検出してみます。
動画の文字起こしをするための自分用ツール、mojiokosher.py。
当初はGtkウィンドウの中に動画再生とテキストエディタのウィジェットを持たせるつもりでしたが、テキスト編集は既成のエディタでよさそうなので、ビデオを再生することにフォーカスします。
continue…▶実際は DrawingArea で小分け動画を再生する機能を持たせたいのですが、ミニスクリプトでは動作確認のために画像を表示することにします。
continue…▶筆者にとってやりやすい文字起こしの過程は以下の3段階に分けられます:
Pythonスクリプト、Audacity、Julius または DeepSpeechで1と2はだいたい望み通りに動いています。
今、3の部分を Python GTK+ を使ってプログラムを書いているところです。今回はテスト用ミニスクリプトで骨組みを作ります。
continue…▶前回、入れ物を作って動画を再生するところまでの mojiokosher.py を書きましたが、VLCライブラリの辺りは説明抜きの丸ごとコピペでした。そのためコマンドウィンドウで出ているエラーの意味もよくわかりません。
今回はVLCをもうちょっときちんと勉強しましょう。
continue…▶動画から文字起こしをするためのプログラムを Python GTK+ で作りたいです。そのプログラムに必須の機能は以下の2つです。
まず、動画が再生できるプログラムを作る(というか、世の中の達人のコードを拝借する)ところから始めましょう。
continue…▶