cmカット

できれば完璧だが今のところいい方法がない。
縁故したファイルの音声部分をwavにして無音を抽出してみたが、判断に難しい部分が出てくる。

# 5.93 6.45 diff 6.45 CM
# 772.39 772.98 diff 766.53
# 832.01 832.98 diff 60.00 CM
# 846.83 847.97 diff 14.99 CM
# 861.98 863.14 diff 15.17 CM
# 876.99 877.96 diff 14.82 CM
# 891.97 892.99 diff 15.03 CM
# 906.92 907.54 diff 14.55 CM
# 1142.61 1143.02 diff 235.48
# 1157.31 1158.12 diff 15.10 CM
# 1167.12 1167.88 diff 9.76
# 1172.32 1173.11 diff 5.23
# 1187.14 1188.07 diff 14.96 CM

9.76+5.23でちょうど15秒なのでCMっぽい。
提供(10秒前後)とか局のPRみたいなやつ(5秒)とかもあるし。
もう少し検出ロジックを磨けば使えるかも。
検出後はスクリプトで録画ファイルを分割・結合・音声の再エンコードまでは自動でできそうな感じ。