りーこチャンネル 動画制作pipeline
台本→音声→映像→BGMまで全自動。1本30分で量産
- Year
- 2026
- Role
- 企画・pipeline実装・運用
- Duration
- pipeline構築 約3日
- Status
- Ep01公開・量産フェーズ
Background
背景・課題
薬剤師パートナーのりーこさんを「妊婦・授乳婦向け薬剤師タレント」として展開する事業の一環。
YouTubeは1本あたりの制作工数が重い(撮影・編集・サムネ)ため、量産が事業の律速。「人間が脚本だけ書けば、あとは機械で動画になる」pipelineを自作することで、工数を1/10以下にし量産フェーズに進めた。
Process
制作プロセス
- 01
Step 1: 脚本作成
Markdown形式で台本を書く(人間側)。話者・セリフ・感情・タイミングを記述。
- 02
Step 2: 音声合成
edge-tts(Microsoft Azure音声・無料・商用利用可)で台本→音声WAV変換。話者ごとに `ja-JP-NanamiNeural` 等を割り当て。
- 03
Step 3: 映像生成
PIL/Pillow で立ち絵・テキスト・吹き出しを描画。1セリフ1コマで連番画像出力。
- 04
Step 4: 合成
moviepyで連番画像 + 音声 + BGM を結合。タイミング自動調整。
- 05
Step 5: エンコード・正規化
ffmpeg で出力。音量正規化(loudnorm)・解像度1080p・h264。YouTubeアップロード仕様準拠。
Tech Highlights
技術的なポイント
edge-tts による無料音声合成
VOICEVOXやAzure有料サービス不要。Microsoft EdgeのTTSエンジンに非公式アクセスする `edge-tts` パッケージで日本語音声を無料・商用OKで利用可能。
PIL での立ち絵生成
Live2D・After Effects等の高価ツール不要。PILで透過PNGを重ねるだけで「動く立ち絵」を実現。表情切替も画像差分で対応。
1コマンド化
shellスクリプトで全工程を `make_video_<channel>.py` 1ファイルに集約。引数に脚本パスを渡すだけで動画完成。
派生展開の容易さ
薬局Ep01のpipelineを流用してゴルフ・りーこ・グルメ・使う力の4チャンネルに展開済み。新ジャンル立ち上げは2-3時間で可能。
Stack
- Python 3
- edge-tts
- moviepy
- PIL / Pillow
- ffmpeg
- shellスクリプト
Metrics
成果・指標
- 1本あたりの工数
- 人間側30分(脚本・チェック)+ 機械側10分(自動生成)
- 従来の工数比較
- 通常YouTube動画制作: 1本3〜10時間 → 1/6〜1/20に削減
- 派生pipeline
- ゴルフYouTube・グルメ・使う力等、複数ジャンルへ展開
- コスト
- 完全無料(edge-tts・moviepy・PILすべてOSS)
Lessons
学んだこと
- 「人間が脚本だけ書く」境界線を引くと、量産フェーズに突入できる。動画制作は「全部人間がやる」から脱出した瞬間に勝てる。
- edge-ttsは商用利用可能で無料・品質も実用十分。VOICEVOXやAzure課金は当面不要。
- PILの立ち絵は荒く見えるかもしれないが、視聴者は「内容」を見ているので技術的完成度より「テンポ」「情報密度」が大事。