ARIB STD-B36とは
ARIB STD-B36は、一般社団法人 電波産業会(ARIB)が策定している、地上デジタルテレビジョン放送における字幕番組・文字スーパー番組の制作および送出に関する運用規定です。放送局や制作会社が字幕データを作成し、実際の放送波に乗せて送出するまでの一連の運用ルールを定めています。
字幕データの符号化方式そのものはARIB STD-B24(データ放送の番組伝送方式)を土台としており、STD-B36はその仕様を踏まえたうえで、字幕・文字スーパー番組を制作・送出する際の実務的な運用ルールをまとめた規定という位置づけになります。放送局向けに納品される字幕ファイルが「.1HD」「.1SD」といった拡張子を持つのは、このSTD-B36に基づく送出用フォーマットに由来します。
エンジニアが実装でつまずきやすいポイント
ARIB STD-B36に準拠した字幕データを扱うシステムを開発する場合、汎用的な動画・字幕関連のライブラリやツールがこのフォーマットをサポートしていないことが最初の壁になります。WebVTTやSRTのようなテキストベースの字幕フォーマットとは異なり、ARIB字幕はバイナリ形式であり、色指定・表示位置・DRCSユーザー外字(標準の文字コードにない外字)・ルビといった情報を、規格が定める構造に従って読み書きする必要があります。
そのため、放送業界向けにARIB字幕を扱うシステムを開発する場合、多くのケースで次のような選択を迫られます。
- 既存の字幕制作ソフト(エル・エス・アイ ジャパン社のSemdec、フォレストダインシステムズ社のNeONなど)と連携し、ARIB形式でのインポート・エクスポートに対応する
- ARIB STD-B36/B37の仕様に基づき、デコーダ・エンコーダを自社で実装する
後者は開発コストが高くなる一方、放送送出フォーマットを直接扱えるため、文字起こしから字幕生成、送出用データの書き出しまでを一貫したシステムで完結させられるという利点があります。
MXF(SMPTE 436M VANC)との関係
放送素材そのものは、MXF(Material eXchange Format)というコンテナフォーマットで納品されることが一般的です。MXFの中には、SMPTE 436M VANCという規格に基づき、映像・音声とは別のトラックとして字幕・メタデータを格納できる仕組みがあります。ARIB字幕を扱うシステムを放送の送出フローに組み込む場合、このMXF/VANCの読み書きにも対応している必要があり、ARIB STD-B36単体の知識だけでなく、コンテナフォーマット側の理解もあわせて求められます。
NAXAの取り組み
NAXAのSubtitle Generatorは、ARIB STD-B36/B37の仕様に基づきデコーダ・エンコーダを自社で実装しており、MXF(SMPTE 436M VANC)をそのまま素材として取り込んだうえで、位置・色・DRCSユーザー外字・ルビ・タイミングを保持した状態で字幕データを読み込み・書き出しできる仕組みを構築しています。生成した字幕は、放送送出向けのARIB STD-B36/NABに加えて、配信向けのWebVTT/SRT、編集向けのXMEMLとしても書き出せるため、放送からWeb展開まで一つの字幕データで対応できます。
まとめ
ARIB STD-B36は、地上デジタル放送における字幕・文字スーパー番組の制作と送出を支える運用規定であり、その実装には汎用的な字幕フォーマットとは異なる専門知識が必要です。放送業界向けにAI字幕生成システムを検討する際は、ARIB規格への準拠だけでなく、MXFなどのコンテナフォーマットへの対応状況もあわせて確認することが重要です。