DeepL で英語字幕ファイルを日本語に翻訳する方法

Google 翻訳よりも自然で高精度な翻訳ができる無料 AI 翻訳サービスのDeepL ですが、英語の字幕ファイルの翻訳には文字数制限があるので使いづらい印象でした。

しかし、ファイルを翻訳するやり方では文字数の制限がなく簡単に字幕ファイルを翻訳できます。

Google 翻訳でも字数制限なしに簡単に字幕ファイルを翻訳できるのですが、翻訳後にタイムコードの一部にエラーが発生するので翻訳後に修正する必要があり、これがとても面倒でした。

 

一方、DeepL の「ファイル翻訳」ではこのようなエラーが発生しないというメリットがあります。なお、全くないとは言い切れません。

 

Attention

DeepL 無料版のファイル翻訳には制限があります。(2022年8月中旬時点)

  • 1か月に3ファイルまで翻訳(編集不可)
     → 1ファイルにつき10万文字まで

詳しくは「3. 無料で使うなら?」に追記したのでご確認ください。

 

 

 

AI 翻訳機の「カメラ翻訳」がスゴかった!

ポケトークS vs. DeepL!英語の翻訳精度はどちらが上?比較検証
AI 通訳機「ポケトークS」と無料 AI 翻訳アプリ「 DeepL 」で洋画のセリフとニュース記事の英語を翻訳して、どちらが優れているかレビューします。 さらに「 iPhone で十分」という評判の検証や「カメラ翻訳の性能」、実際に使...

1. 翻訳の前に

DeepL で字幕ファイル( srt )をドキュメント翻訳する前に以下の3つをしておきます。

 

Memo

翻訳の前にしておく4つのこと

  1. 字幕ファイル ( .srt ) の入手
  2. 改行コードを半角スペースに置換
    (斜体コードがあれば削除しておくといい)
  3. .srt ファイルを .docx ファイル化
  4. キャピタライズ (語頭を大文字化)

 

① 字幕ファイル ( .srt ) の入手

字幕ファイルは字幕サイトから無料でダウンロードして入手できますが、このとき srt 形式の字幕ファイルを選んでください。

ass ファイルしか入手できない場合は字幕作成ソフトで srt ファイルに変換してください。

 

② 改行コードを半角スペースに置換

字幕ファイルの翻訳前に「改行コードを半角スペースに置き換える」と翻訳の精度が向上するので一手間加えておきましょう。

理由は、DeepL に限らず翻訳ソフトは改行までを1つの文として認識するので翻訳がおかしなことになるからです。

「改行コードの半角スペースへの置換」は字幕作成ソフトを使用すると一括で行えます。

無料で使える Aegisub では次の手順で置換します。

 

Aegisub でテキストを置換する方法

  1. メニューバーから[編集 → Fine and Replace… ]
  2. [検索する文字列]に \N を入力
  3. [置換後の文字列]に半角スペースを入力
  4. [ Replace all ]をクリック

 

[ \ ]が出てこない場合は「バックスラッシュ」とタイプして変換すると出るはずです。

改行コードがなくなるので字幕が動画に表示されると横に長くなりますが、文字数が多い場合はプレイヤー側で自動的に改行されるはずです。

気になる場合は翻訳後に字幕作成ソフトで字幕の横幅を指定してください。字幕の横幅を指定すると、字幕が指定した横幅に1行で収まらない場合は自動的に改行されて表示されます。

Aegisub ではスタイルで[ Margins ](余白)を編集します。

 

なお、字幕幅を指定すると .srt ではなく .ass で書き出されます。

 

斜体コードも削除

洋画「プラダを着た悪魔」では次の字幕があります。

0:04:10
She’s the editor in chief of {\i1}Runway,{\i}\Nnot to mention a legend.

{\i1} と {\i} は斜体コードですが、このように配置されていると翻訳に影響するため削除するとよいでしょう。削除しなくても訳せてしまうのが DeepL のすごいところですが。

なお、斜体コードはテキストエディタでも削除できます。

 

③ .srt ファイルを .docx ファイル化

DeepL でドキュメント翻訳できるファイル形式は docx か pptx です。そのため srt ファイルをどちらかのファイル形式にする必要があります。この記事では docx ファイルを翻訳しています。

srt を docx 化するやり方はいくつかありますが、次の手順がシンプルです。

 

.srt を .docx 化する方法

  1. .srt をテキストエディタで開く
  2. テキストを全てコピー
  3. Google ドキュメントにペースト
  4. .docx として書き出す

または

  1. 拡張子 srt を txt に変更
  2. Google ドキュメントで開く
  3. docx ファイルとして書き出す

 srt → txt はファイル名を変更するやり方で変更できます。
 例:example.srt → example.txt

 

テキストエディタの例

  • Mac:テキストエディット
  • Windows:メモ帳

 

Google ドキュメントで書き出す方法(ダウンロード)

Google ドキュメントで docx ファイルとして書き出すには[ファイル → ダウンロード → Microsoft Word (.docx) ]と選択します。(下の画像参照)

 

なお、ファイルはダウンロードされるのでダウンロードフォルダを確認してください。

 

④ キャピタライズ (語頭を大文字化)

文頭の単語が小文字で始まる字幕は翻訳がおかしなことになりがちですが、キャピタライズしてから翻訳すると改善されます。

キャピタライズすると全ての単語の語頭が大文字になりますが、翻訳の表現に変化はあるもののニュアンスは同じという感じです。

キャピタライズするには、Mac のテキストエディットでは[編集 → 変換 → 語頭を大文字にする]と選択します。

 

キャピタライズすると翻訳されない場合がある

キャピタライズしてから翻訳すると、数%程度の字幕行が翻訳されず原文のままという現象が起きます。(2022年8月27日時点)

 

2. やり方

DeepL で docx ファイルを翻訳する方法を勝手に「ドキュメント翻訳」と呼んでいますが、ファイル翻訳の方が適切でしょうか。

DeepL はインストール版を使用していますが、ウェブ版でも同様にできます。

 

DeepL で字幕ファイルを翻訳する手順

  1. DeepL で .docx ファイルをドキュメント翻訳する
  2. docx を txt 化する
  3. txt を srt 化する

 

① DeepL ドキュメント翻訳

2021年8月下旬、テキストタブでテキスト入力欄に docx(または pptx )をドラッグ&ドロップすると翻訳できるようにアップデートされていることに気づきました。インストール版とウェブ版のどちらもです。

しかし、とりあえず記事修正が手間なためドキュメントタブで翻訳する方法を紹介しています。

 

DeepL で .docx ファイルをドキュメント翻訳

  1. 画面上部のタブで[ Documents ]を選択
  2. [ Browse ]から .docx ファイルを選択(ドラッグ&ドロップでも OK )
  3. 翻訳する言語[ Japanese ]を選択 → 翻訳が完了するまで待つ
  4. [ Open ]をクリック → .docx ファイルが開く

 

手順1〜4は下の画像参照。

 

下の画像は翻訳後の docx ファイルを Pages で開いたものです。

 

画像は洋画「 The Intern 」の英語字幕を翻訳したものです。

ロバート・デニーロの語りの部分ですが「娼婦ごっこ」はやらかしちゃいましたね。

DeepL の広告が入っていますが削除できます。

 

② docx を txt 化

DeepL でドキュメント翻訳が完了したら翻訳後の docx ファイルを txt ファイルに変換します。

 

docx を txt 化する方法

  • .docx を標準テキスト (.txt) として書き出す

 

.docx を標準テキスト (.txt) として書き出す方法

docx → txt の書き出しは docx ファイルが開けるテキストエディタであれば[ファイル → 書き出し → 標準テキスト]と選択していくとできるはずです。

Google ドキュメントでは[ファイル → ダウンロード → 書式なしテキスト (.txt) ]と選択していくとできます。

あるいは、docx ファイルのテキストを全てコピーして、新規作成した標準テキストにペーストして保存します。

 

③ txt を srt 化

txt ファイルができたら srt ファイルに置き換えます。これで字幕ファイルの完成です。

 

txt を srt 化する方法

  • 拡張子 .txt を .srt に変更する (ファイル名を変更するやり方で)

 

拡張子 .txt を .srt に変更する方法(ファイル名を変更するやり方で)

txt → srt はファイル名を変更するやり方で変更できます。

例:example.txt → example.srt

 

やり方は以上です。

無料でこれだけのことができるのはすごいし有り難いです。

 

DeepL で字幕ファイルを翻訳する手順まとめ

① DeepL ドキュメント翻訳

  1. 画面上部のタブで[ Documents ]を選択
  2. [ Browse ]から .docx ファイルを選択(ドラッグ&ドロップでも OK )
  3. 翻訳する言語[ Japanese ]を選択 → 翻訳が完了するまで待つ
  4. [ Open ]をクリック → .docx ファイルが開く

 

② docx を txt 化してさらに srt 化する

  1. .docx を標準テキスト (.txt) として書き出す
  2. 拡張子 .txt を .srt に変更する(ファイル名を変更するやり方で)

 

実は、DeepL ではドキュメント翻訳するよりも1文ずつ翻訳する方がより高精度です。

翻訳精度を高める方法はこちらを参考にしてください。

 

なお、ドキュメント翻訳の方が自然な場合もあります。

 

3. 無料で使うなら?

DeepL 無料版のファイル翻訳には下記の制限があります。(2022年8月中旬時点)

 

Memo

DeepL 無料版のファイル翻訳の制限

  • 1か月に3ファイルまで翻訳(編集不可)
     → 1ファイルにつき10万文字まで

 

10万文字を超える洋画の場合は、字幕ファイルをテキストエディタで分割して1ファイル10万文字以下にすれば翻訳できます。その後「合体」するとよいでしょう。

また、30分ドラマの場合は何話分か合体させてから翻訳すると経済的です。

「編集不可」は、おそらく DeepL 上で編集できないという意味で、ダウンロードしたファイルはテキストエディタで編集できます。

なお、30日間無料体験できる Pro 版の Advanced なら20ファイル翻訳できるのでまとめて翻訳すると経済的です。

 

4. 日英同時字幕を作る方法

元の英語の字幕ファイルと翻訳後の字幕ファイルを合体させると、英語と日本語が同時に表示される字幕を作ることができます。

こうすると翻訳を修正する場合にも対訳化されるので便利です。

紹介した方法では英語と日本語の字幕のタイミングが同じなので srt ファイルのまま作れます。

やり方はこちらを参考にしてください。

 

また、英語と日本語の字幕に表示位置を指定しても実現できますが、こちらは英語と日本語の字幕のタイミングが異なる場合にも有効です。

英語学習で地味にモヤっとする原因とは?

英語学習をしていると疑問が頻出するものですが、地味にモヤっとするのが「直訳すると日本語が不自然」な点です。特に英会話の場面、口語表現に顕著で「普段そんな言い方しねーし」と思ったことがある方も多いと思います。

例えばこんな表現です。

That's what I was told.
それは私が言われたことです

直訳していますが、この日本語は会話では不自然です。もう少し普段の会話っぽくすると「そう聞いています」です。とはいえ、実際には「〜のようです」「〜なんだって」というような言い方をしている人がほとんどだと思います。

(「〜のようです」「〜なんだって」は I heard that. や They (he, she) said that. と表現することもできます。)

つまり、モヤる原因は次の2つです。

 

地味にモヤっとする原因
  • 英語を直訳すると「普段頭の中にない日本語の言い回しになる」
  • 普段頭の中にある日本語を直訳すると「不自然な英語になるか行き詰まる」

 

「〜なんだって」と英語で言いたい場合は[なんだって → そう聞いています → それは私が聞いたことです]と変換して That's what I was told. を導き出すことになります。(最悪の場合)

こんなことをしているとテンポが悪くなって会話どころではなくなるし、頭が疲れて会話そのものを放棄したくなります。

しかし、[なんだって → That's what I was told. ]と直接変換できれば楽ですし会話をスムーズにこなせます。

 

日本アニメなら普段使いの日本語から英語を学べる

そこで、より自然で普段使いな日本語から英語を学ぶための素材としておすすめなのが「日本アニメ」です。

その理由と日本アニメで英語を学習するのに便利なサービスはこちらの記事で紹介しています。

EEラーニングの日本アニメで英語学習すると?効果検証!
実際に EE Learning(EEラーニング)を利用して学習効果を検証しました。結論は「楽しく日本アニメ英語版を見ていたら英語力が上がった」となりたい方におすすめの英語学習サービスです。 この記事では、EE Learning の検証...

特に英会話学習のモヤが晴れると思うのでぜひ参考にしてほしいと思います。

「すでにモヤが晴れた」という方はこちらのサイトで日本アニメ英語版の無料お試し動画を視聴できるのでぜひお試しください。

 

無料お試し動画 (英語版) を EE Learning で視聴する 

こちらもおすすめ!

スーパーエルマーで本物の英語力を習得!その効果と学習法
聞くだけ見るだけでも「スーパーエルマー」なら本物の英語力を鍛えるための工夫が満載な英語学習教材なので効果抜群です。英検、TOEIC、大学入試の対策やビジネス英語の習得に、未来の自分に投資したいという方にもおすすめです。 スーパーエルマ...
戦略的独学|英語の習得を最速化する2つの能力と鍛え方
「この2つで英語学習が最速化、自動化、無料化する」という能力があると私は考えているので、その能力と効果的な鍛え方を紹介します。 初心者はコスパ最高で英語を習得できるはずですし、「勉強してるけど伸びない」と感じている中級者は一気に成長す...
単語集は1冊3ヶ月で!英単語の効率的な暗記術
英語の単語集は1冊3ヶ月で効率良くやり切るのがおすすめなので、そのために英単語を戦略的に暗記する方法を紹介します。 大学入試、英検、TOEIC などの試験対策や社会人のやり直しとしてお役立てください。 Summary 1...

Comment

  1. 佐藤杉雄 より:

    貴殿ホームページを参考にさせて頂いております。
    ありがとうございます。
    字幕をDEEPL変換の記事を拝見して、英語日本語字幕
    変換で悪戦苦闘しております。
    大変申し訳ありませんが、以下についてご教授お願い
    致します。

    質問事項
    ①DEEPL変換で文頭に”を””と”とか接続詞が表示されます。
    (下記例)GOOGLでは表示されません。これを防ぐ方法を
    ご存じでしょうか。(英文のandは極力削除して変換してます)
    ②DEEPL変換で無理であれば、文頭の”を””と”だけを
    「Aegisub 3.2.2.」で取り除くことは可能でしょうか。
    [を◆ ]で変換すると文中の”を”も削除され意味不明の
    文章になってしまいます。

    以上、宜しくお願いします。

    文脈の例です。
    凡例
    ●DEEPL変換
    〇GOOGL変換

    00:10:51,547 –> 00:10:53,031
    leaving many countries to…
    ●を残して、多くの国が
    〇多くの国に…

    00:55:42,298 –> 00:55:45,217
    and when I tried, nothing happened because it was the wrong song,
    ●と試したところ、曲違いなので何も起こりませんでした。
    〇そして、私が試したとき、それは間違った歌だったので何も起こりませんでした、

    01:12:05,363 –> 01:12:06,406
    and pull it down.
    ●をクリックし、下に引きます。
    〇そしてそれを引き下げます。

    01:21:12,660 –> 01:21:15,830
    There is taking
    ●をとっています。
    〇取っています

    時々GOOGL変換を使っていますが、まだ、1400レコード位から”1400年”の年表記が
    出て面倒になり、殆どDEEPLに頼っています。

    • manma manma より:

      記事が参考になったようで何よりです。
      ご質問いただいた現象は気づかなかったので勉強になります。
      実は、私はめったに字幕の翻訳をしないので。。

      対応策はいくつか思いつきましたが、最も簡単なのは「キャピタライズ (語頭を全て大文字に変換) 後に DeepL 翻訳する」方法かと思います。
      こうすると多少表現は変わりますが、ニュアンスは変わらない印象です。
      文頭 and だけでなく leaving many countries to… も「を」で始まらない翻訳になりました。
      なお、キャピタライズはテキストエディタで行います。

      他には3つ対応策を思いつきました。

      対応策1:文頭 and を And に置換してから DeepL 翻訳する
      Aegisub やテキストエディタで[and ]を[And ]に置換します。
      and の後ろに半角スペースを入れると文頭の and のみを置換できるはずです。

      対応策2:文頭 and を削除してから DeepL 翻訳する
      やり方は対応策1と同様です。

      対応策3:文頭 and の字幕行を1つ前の字幕行と連結してから DeepL 翻訳する
      字幕行の連結は、Aegisub では該当する字幕行の選択後に右クリックメニューから行えます。
      なお、翻訳文が長くなる場合は、文頭 and の字幕行の前後どちらかの字幕行を複製しておいてから連結作業を行い (複製した一方を残して)、翻訳後に割り振るとスムーズに作業できると思います。

      There is taking の翻訳が「を」で始まる現象についての対応策と、文頭「を」のみを削除する方法は分からないです。

      字幕の翻訳はなかなか面倒な作業ではありますが、ご健闘をお祈りします。
      もし不明な点や他にもお困りのことがございましたらコメントくださいませ。

  2. 佐藤杉雄 より:

    早速、ご回答頂きましてありがとうございます。
    お陰様で少し明かりが見えてきました。
    対応策1~3で試してみます。
    また、質問させて頂くかもしれませんが
    その節は、よろしくお願いします。

    • manma manma より:

      ご連絡ありがとうございます。

      対応策3に誤りがあったので訂正です。
      誤:文頭 and の字幕行の前後どちらかの字幕行を複製しておいてから… (複製した一方を残して)
      正:文頭 and の字幕行とその1つ前の字幕行を複製しておいてから… (複製した二行を残して)

      混乱させてしまっていたらすみません。
      それでは、よろしくお願いします。

  3. 佐藤杉雄 より:

    ご連絡ありがとうございます。

    「キャピタライズ (語頭を全て大文字に変換) 後に DeepL 翻訳する」方法を早速試してみました。

    DEEPLでは不思議なことに[and ]から[And ]の文頭大文字でのDeepL変換は良好でしたが、他の文章の翻訳率(文全体のうち翻訳される英語)が、文頭大文字で低下するのが確認されました。
    サンプル数は少ないのですが大体、翻訳率はGOOGL99%,DEPPL小文字98%,DEPPL文頭大文字97%位です。
    結局、字幕を文頭大文字にした場合、1600行で40~50行未変換となるようです。(これを直すのも結構手間です)
    DEPPL日本では、文頭大文字の文節変換用データが逆に少ないように感じております。

    以上、現在の状況ですが、また色々試してみます。お忙しい中ありがとうござしました。

    • manma manma より:

      ご報告ありがとうございます。

      改めてキャピタライズ後の英語字幕を DeepL 翻訳したところ翻訳されない現象を確認しました。
      なぜか、おとといは翻訳されていた部分が原文のままでした。
      おとといの時点では字幕行で10行程度でしたので、文字数が原因かもしれないと5,000文字も試しましたが特に関係はないようですね。
      他の字幕ファイルを試すとそちらは5,000文字で未翻訳は1行だったので相性のようなものがある気がします。

      またお気づきのことがございましたらご報告いただれば幸いです。
      よろしくお願いします。

タイトルとURLをコピーしました