配信者向けライブ字幕は、会議の字幕とは別の問題です。3つの音源(ゲーム・マイク・システム)、3つの字幕出力先(配信内オーバーレイ・プラットフォーム CC・VOD)、そして最悪の失敗パターン:遅延でタイミングを崩す字幕、があります。間違ったワークフローを選ぶと、肝心な瞬間にレイアウトが崩れます。
3つの音源、3つの字幕出力先
字幕の質は、読み取る音源の質を超えません。まずそこから:
- マイクのみの字幕: 自分の声をクリアに読み、ゲーム音は無視。トーキングヘッド配信(雑談、IRL、ポッドキャスト)に最適。最低レイテンシ。
- システム音声の字幕: ゲーム音とマイクの両方を読みます。ナラティブゲームや視聴会で、画面で起きるすべてを字幕化したいときに最適。
- トラック別の字幕: OBS の音声トラックを字幕ツールに個別ルート。コラボ配信で個別の話者を識別できる状態を保ちたいときに最適。
2026年の配信者字幕比較
| ツール | 字幕の表示先 | 強み | 制約 |
|---|---|---|---|
| Twitch ネイティブ クローズドキャプション | Twitch プレイヤーのみ | Twitch 内蔵、CC をオンにした視聴者が見られる、モバイルプレイヤー対応 | CEA-608/708 字幕ストリームが必要、すべてのエンコーダで対応しない、対応言語が限定的 |
| YouTube Live 自動字幕 | YouTube プレイヤーのみ | 無料、多言語で自動有効、VOD でも持続 | 5〜15 秒の遅延、早口でドロップ |
| OBS オーバーレイ + AI 字幕ソース | 配信出力に焼き込み | プラットフォームに依存しない、全視聴者が同じ字幕を見る、スタイリングを完全制御 | 録画では永続、視聴者がオフにできない |
| Live Subtitles(デスクトップ オーバーレイ) | 画面上、OBS でキャプチャ可能 | システム音声字幕 + 翻訳、ゲーム + 音声を捕捉、プラットフォーム横断 | OBS で明示的にウィンドウをキャプチャする必要がある |
配信タイプ別の選び方
雑談/IRL 配信者
OBS オーバーレイでマイクのみ字幕を使います。レイテンシ 1.5 秒未満と、自分の声に対する精度(数セッションのプロファイル準備後)が決定要因です。Twitch ネイティブ CC は問題ないフォールバックですが、スタイリング制御を失います。
多ジャンル ゲーム配信者
システム音声で字幕を実行し、ゲームのセリフも字幕化。字幕ボックスをウェブカム枠と重ならない角に固定。配信前に少なくとも 3 ジャンルでテスト — ゲーム音声ミックスはタイトルによって大きく異なります。
多言語/国際視聴者向け配信者
ソース言語と翻訳の両方をサポートするデスクトップ字幕レイヤを使用。二言語字幕を OBS に焼き込み、CC をオンにせずどの地域の視聴者にも見えるようにします。
配信前セットアップ チェックリスト(10 分)
- マイク音源とゲーム音源が別の OBS トラックにあることを確認。
- 字幕ツールをマイクまたはシステム音声どちらかに設定(配信タイプ次第)。
- 字幕オーバーレイを固定の角に配置 — 配信中は絶対に動かさない。
- 通常のリズムで 30 秒テスト発話、レイテンシ、精度、HUD との重なりを確認。
配信者の字幕でよくある落とし穴
- HUD との字幕重なり: 肝心な瞬間に字幕がキルフィードを隠す。ゲーム HUD の恒久ゾーン外に字幕を置きましょう。
- 長時間配信でのレイテンシ ドリフト: 3 時間以上経つと、一部の AI 字幕ツールが音声に遅れます。マラソン配信中は 2 時間ごとに字幕ツールを再起動。
- マイクのみセットアップでゲーム音まで拾う: オーディオ インターフェースのミックスバックで起きます。OBS の音声設定でマイク ソースが排他的か確認。
よくある質問
Twitch 視聴者は字幕を自動で見られますか?
エンコーダが CEA-608/708 字幕を送り、視聴者がプレイヤーで CC をオンにした場合のみ。多くの配信者は字幕を常時表示できる OBS オーバーレイを好みます。
字幕は配信パフォーマンスに影響しますか?
字幕処理は CPU か GPU を使います。最新システムでは 5% 未満。エンコーダ予算がタイトな場合は、より小さい ASR モデルか別マシンへオフロード。
配信を 2 言語で同時に字幕化できますか?
はい、ソース + ターゲット対応のデスクトップ字幕レイヤがあれば。OBS に二言語字幕を焼き込んでグローバル視聴者に届けます。