できれば完璧だが今のところいい方法がない。
縁故したファイルの音声部分をwavにして無音を抽出してみたが、判断に難しい部分が出てくる。
# 5.93 6.45 diff 6.45 CM # 772.39 772.98 diff 766.53 # 832.01 832.98 diff 60.00 CM # 846.83 847.97 diff 14.99 CM # 861.98 863.14 diff 15.17 CM # 876.99 877.96 diff 14.82 CM # 891.97 892.99 diff 15.03 CM # 906.92 907.54 diff 14.55 CM # 1142.61 1143.02 diff 235.48 # 1157.31 1158.12 diff 15.10 CM # 1167.12 1167.88 diff 9.76 # 1172.32 1173.11 diff 5.23 # 1187.14 1188.07 diff 14.96 CM
9.76+5.23でちょうど15秒なのでCMっぽい。
提供(10秒前後)とか局のPRみたいなやつ(5秒)とかもあるし。
もう少し検出ロジックを磨けば使えるかも。
検出後はスクリプトで録画ファイルを分割・結合・音声の再エンコードまでは自動でできそうな感じ。