英語の文字起こしを音声入力で自動化する方法・コツ( Google ドキュメント)

パソコンやスマホで利用する音声入力は口頭で文字を入力する機能ですが、録音された音声の文字起こしにもとても便利です。

英語学習では以下のようなときに便利です。

  • YouTube 動画に英語字幕がない
  • 録音した英会話の授業を復習したい
  • 自分の発音をチェックしたい
  • オーディオブックをスクリプト化したい
  • 日本アニメの英語吹替スクリプトがほしい

 

なお、オンライン英会話などの授業を録音するときは許可を取ってくださいね。

 

 

関連記事

 › 洋書の英語負担を軽くするオーディオブック学習・活用法

 › 英語学習におすすめ IC レコーダーと常軌を逸した活用方法

 › PC 不要で洋画・海外ドラマの音声を録音からスマホで聞くまで

 

 

英語に限らず文字起こしをするのは大変ですが、Google ドキュメントの音声入力は高い精度で文字起こしをしてくれるので負担を軽減できます。

 

Google ドキュメントとは↓(画像は Google 検索結果より)

 ›› https://www.google.com/intl/ja_jp/docs/about/

 

この記事では英語音声を自動で文字起こしする方法を、日本アニメの英語音声を Google ドキュメントの音声入力を使って文字起こしする方法としてご説明しますが、もちろん他の音声でも同様にできるので参考にしてみてください。

北米版などの DVD/Blu-ray には英語吹替音声付きのものがあるので英語学習に活用できますが、その英語字幕は日本語の訳でありセリフの内容と異なるためリスニング学習がしづらいという難点があるのが理由です。

 

さらに、パソコンとスマホそれぞれの文字起こしの精度を上げるコツも見つけましたので、合わせてご紹介します。

 

精度を上げるコツは下記リンク先の記事にてより詳しく紹介しています。Google ドキュメントよりも高精度で文字起こしできる方法でもあります。

 › Android アプリ「音声文字変換&音検知通知」の精度を上げる方法

 

 

↓短時間でできる方法

 › 英語音声のみ OK!YouTube で自動文字起こし / 字幕生成&ダウンロード+語学活用

 

↓起こせなかったときの対策

 › 英語学習と文字起こしに便利な Google ドキュメントの機能

 › 英語の文字起こしで聞き取れないときの対策14

 

 

■文字になるボイスレコーダー& AI ボイス筆談機

録音した音声ファイルを自動でテキスト化できるボイスレコーダー「AutoMemo(オートメモ)」は、録音、再生だけでなく会議メモや議事録、取材記事などを作成する際に役立ちそうです。また、会話をテキスト化できる AI ボイス筆談機「ポケトークmimi」は語学にも便利そうです。どちらも「ソースネクスト」サイトにて紹介されているのでチェックしてみてください。

 

 

 

 

「鬼滅の刃」でちょっと英語学習していきませんか?

 › 鬼滅の刃|英語吹替 YouTube 動画を対訳化&セリフ解説

鬼滅の刃の英語版 YouTube 動画から英語スクリプトを対訳にして英語表現や発音がどう聞こえるかなど詳しい解説をつけました。セリフから英語学習のポイントとなるものや分かりにくいものを取り上げ、なぜその意味になるのか言葉のニュアンスやイメージから解説して...( more )

 

 

1.用意するもの(パソコン、スマホ共通) 

 

文字起こしができる有料ソフトにはより便利な機能があるので「4. 感想」にて簡単にご紹介しています。

 

< DVD か Blu-ray かで悩んだら…>

機動性の DVD、高画質・高音質の Blu-ray、という選び方があります。なお、HD 以前の作品だと画質と音質のどちらもあまり差がないかもしれません。私は英語学習には機動性で DVD を選びます。

 

関連記事

 ›「けいおん!」は日常英会話フレーズの宝庫!英語学習おすすめアニメ

 

では、まずはパソコンでの Google ドキュメントで文字起こしする方法とコツを紹介します。

 

 

2.パソコンで英アニスク起こし

 

この項目の目次

  • 用意するもの
  • 手順
  • 文字起こしの精度を上げるコツ
  • 手順おさらい
  • パソコンでより高い精度で文字起こしするコツまとめ

 

 

用意するもの

 

  • オスオスのステレオミニプラグコード
    (両端がスマホなどに使えるイヤホンプラグのもの)
  • 動画プレイヤー
    VLC プレイヤーなど)
  • USB サウンドカード
    (パソコンにマイク入力端子がない場合)

 

▽オスオスのステレオミニプラグコード

▽ USB サウンドカード

 

手順

 

1. パソコンのヘッドホン出力端子とマイク入力端子をケーブルでつなぐ
  (パソコン本体にマイク入力端子がない場合は上記の変換ケーブルを使う)

※ iMac に接続した外部スピーカーからの音声は内蔵マイクや手持ちの USB ヘッドセットのマイクでは認識しにくかったのでこの方法を提案しています。肉声でないと認識しづらいようです。

注意
パソコンによってはトラブルが発生するかもしれません。私は責任を負えないことを予めご了承くださいますようお願い申し上げます。不安な場合はテレビなどのヘッドホン端子との接続をおすすめします。

 

 

 

 

 

 

 

 

 

↑iMac(21.5-inch, Mid 2010)にケーブルを接続したところ。
イケナイことをしている感じと気持ち悪い感じがしたが大丈夫でした。iMac さんは自分が出した音が入力されていることには気づいてないはず。吸気口と排気口に換気扇用フィルター貼ってますがお気になさらず。

あえて写り込ませたスピーカーは私がいつも使っている TIMEDOMAIN light。
 › 英語学習におすすめ!音源忠実再生スピーカーでリスニング力・発音改善

 

 

 2. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する
  (変換ケーブルを使う場合はそのデバイスに設定)

※音声出力(音量)レベル、マイク入力レベルは共に0にしておくと無難だと思います。

 

< Mac の場合>

画面左上のリンゴ → システム環境設定 → サウンド → 出力・入力タブからデバイスを選択

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

< Windows10 の場合 >

スタートメニュー(画面左下にある[Windows]のアイコン)→ Windows システムツール → コントロールパネル → ハードウェアとサウンド → サウンド → 再生・録音タブからデバイスを選択

参考(エレコム):http://qa.elecom.co.jp/faq_detail.html?id=6507

 

 

 3. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節
  → 入力レベルがセリフのところで真ん中くらいになるようにする

 

 4. Google ドキュメントを Google Chrome で開く
  ( Safari では音声入力がグレーアウトして使えませんでした)

 

 5. 新しいドキュメントを作成 → 空白 → ツール
  → 音声入力 → マイクのアイコン出現

 

 

 

 6. アイコン上部のプルダウンメニューから English( United States )を選択

 

 7. 動画プレイヤーで DVD を再生

 

 8. マイクのアイコンをクリック → 文字起こしが始まる
  (文字起こししたい部分だけでも1話丸ごとでも OK )

 

 9. セリフがないところで改行、してもいいし終わるまで放置でもいい
  (しておくとあとで整理しやすい)
  (パソコンから音は出ないので放置がいいかも)

 

 10. 文字起こしが終わったらマイクのアイコンを押して終了

 

 

文字起こしの精度を上げるコツ

 

▽再生速度を0.75倍に

実際にアニメの英語音声で試したところ、再生速度を0.75倍くらいにすると通常速度よりも文字起こしの精度が上がりました。偶然かもしれませんが。なお、さらに遅くすれば精度が上がるというわけではなさそうです。

ミスがある部分は通常速度と低速の両方を繰り返すと正解に近づく場合があります。

 

倍速再生は VLC でもできます。やり方は下記リンクの記事にしています。

 ›【 VLC 】語学に便利な機能とショートカットまとめ

 

動画配信サービスでは U-NEXT に倍速再生機能がありますよ。

 

 

▽入力と出力レベルを最大値(100%)に

音量(出力レベル)を最大にしようとするとスピーカーやイヤホン、耳が壊れそうな音量が出ますが、実は音声信号のレベルは最大値で100%です。

人間の耳には丁度いい音量であっても機械にとっては小さい音量である可能性があります。そのため入力と出力レベルを最大にすると文字起こしの精度が上がる可能性があります。

 

ここで気をつけなければならないのは、再生機によっては100%以上の音量が出せるものがあるので、出力レベルを100%が超えないように設定する必要がある点です。

出力レベルが100%を超えると過大入力となり、文字起こしの精度が下がる可能性があります。

VLC プレイヤーでは200%まで出力(音量)レベルを調節できますが、100%に設定します。

 

最も注意しなければいけないのは、言わずもがなですが文字起こしが終わったら必ず音量を下げることです。うっかりそのままスピーカーやイヤホンで再生すると、どえらいことになります。

 

 

▽ 32 bit、96 kHz に設定

未確認ではありますが、パソコン音声の入出力を32 bit、96 kHz に設定すると精度が向上するかもしれません。

macOS ではアプリケーション → ユーティリティ → Audio MIDI Setup にて設定できます。ただしこの設定はステレオミニプラグをヘッドホン出力端子から抜き差しするとデフォルトに戻ります。

 

 

▽ CPU とメモリに負荷をかけない

文字起こし中の CPU とメモリの使用率をアクティビティモニタで観察してみました。

Chrome の CPU は Google ドキュメント開いた状態で0.4%前後、文字起こし中は8%前後になりましたが再生中の VLC で20%前後なので負荷はあまりないと思われます。

メモリは1分程度の使用では変化はありませんでした。

パソコンのスペックは文字起こしの精度にあまり関係なさそうですが、他のアプリケーションはなるべく閉じておいた方が無難だと思います。

ちなみに使用した iMac(21.5-inch, Mid 2010)は 3.6 GHz Intel Core i5、メモリ12GB、起動ディスクは SSD(光学ドライブを置換)です。

 

 

手順おさらい

 

<ケーブルをつないでデバイスの選択と入力レベル調節>

 1. パソコンのヘッドホン出力端子とマイク入力端子をケーブルでつなぐ
  (パソコン本体にマイク入力端子がない場合は上記の変換ケーブルを使う)

 2. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する
  (変換ケーブルを使う場合はそのデバイスに設定)

 3. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節
  → 入力レベルがセリフのところで真ん中くらいになるようにする

 

<ここから Google ドキュメント>

 4. Google ドキュメントを Google Chrome で開く
  ( Safari では音声入力がグレーアウトして使えませんでした)

 5. 新しいドキュメントを作成 → 空白 → ツール
  → 音声入力 → マイクのアイコン出現

 6. アイコン上部のプルダウンから English ( United States ) を選択

 7. マイクのアイコンをクリック

 

<いよいよ文字起こし>

 8. 動画プレイヤーで DVD を再生 → 文字起こしが始まる
  (文字起こししたい部分だけでも1話丸ごとでも OK )

 9. セリフがないところで改行、してもいいし終わるまで放置でもいい
  (しておくとあとで整理しやすい)
  (パソコンから音は出ないので放置がいいかも)

 10. 文字起こしが終わったらマイクのアイコンを押して終了

 

 

パソコンでより高い精度で文字起こしするコツまとめ

 

  • ライン入力する
  • 再生速度を0.75倍くらいにする
  • 音量を最大値 (100%) にする → 文字起こし後は必ず音量を下げる
  • 他のアプリケーションをなるべく閉じておく

 

 

3.スマホで英アニスク起こし

 

この項目の目次

  • 用意するもの
  • 手順
  • スマホでライン入力する方法

 

 

用意するもの

 

  • テレビ
    (ポータブル DVD プレイヤーを使う場合は不要)
  • リージョンフリーの DVD/Blu-ray プレイヤー
  • オーディオ変換ケーブル (3極メス×2-4極オス) 3.5mm
    (ライン入力する場合)

 

リージョンフリーの DVD プレイヤーは記事公開時では Amazon にて3,000円くらいからあります。

 

英語学習用なら十分かもしれませんが、機能や性能で選ぶなら Blu-ray も再生できる SONY のものがあります。ただし、価格を考えるとパソコンを買った方がよさそうです。

倍速再生機能があればパソコンの場合と同様に0.75倍で再生すると精度が高まるかもしれません。

動画配信サービスでは U-NEXT に倍速再生機能がありますよ。

 

 

手順(ライン入力する場合は後述)

 

 1. Google ドキュメントアプリを起動

 2. 右下の赤丸をタップ → 新しいドキュメント → 作成
  (テンプレートを選ぶときは「空白」をタップ)

 3. キーボードのマイクのアイコンをタップ

 4. DVD を再生してスマホのマイクをテレビのスピーカーに近づける
  (音の良い外部スピーカーを利用すると精度が高まるかもしれません)

 

 

英語として認識されない場合は言語設定を英語にしてみてください。

 

▽言語設定:iOS の場合
(画像は Google 検索結果より)

 ›› https://support.apple.com/ja-jp/HT204031

 

 

▽言語設定:Android の場合

設定 → 言語と入力 → 言語

英語が候補にない場合は「+言語を追加」から English を追加

English の右にある4本線をタップしたまま一番上へ移動させる

 

なお、Android のバージョンによって設定方法は異なるかもしれません。

 

 

スマホでライン入力する方法

 

パソコンでの文字起こしの精度を高めるコツとしてライン入力をご紹介しましたが、スマホでもライン入力すれば精度が上がる可能性があります。

下記の2つのケーブルを繋ぐとスマホやタブレットでもライン入力ができるようになります。

 

3極-4極変換アダプタケーブル

 

オス-オスのステレオミニプラグケーブル ( AUX ケーブル)

スマホで再生中の音声を自動で文字起こしすることもできます。

詳しいやり方は下記リンク先の記事を参考にしてください。

 › 洋画の音声をスマホ1台とケーブルのみで録音する方法

 

肉声も含めてスマホでさらに精度を上げたい場合は下記リンク先の記事も参考にしてください。

 › Android アプリ「音声文字変換&音検知通知」の精度を上げる方法

 

▽ちなみに(古い機種でも使える)

iPhone 4s(おつかれ)の内蔵マイク入力で試したところ iMac ほどではありませんが高い精度で文字起こししてくれました(ライン入力は試していません)。数十秒で停止してしまいますが古い機種でも使えました。

 

 

4. 音声にノイズがある場合

 

音声にノイズや音楽があると文字起こしができない場合があります。他の文字起こしアプリを試す方法もありますがノイズが原因であれば難しいと思います。

 › 英語の文字起こしで聞き取れないときの対策14

 

ノイズの除去は無料の音楽作成ソフト Audacity にその機能があります。

 ›› Audacity(公式サイト)

 

使い方は「 Audacity ノイズ除去」と検索してください。難しくはないと思います。

 

音楽の場合はボーカルや楽器ごとに分離する spleeter というオープンソースがあります。こちらも使い方は検索してください。

 

 

有料ソフトでは Steinberg SpectraLayers Pro(リンク先はソースネクストサイト)があります。リンク先にある動画ではリポーターの中継に重なったサイレンを消す作業を確認できますが、音が色分けして可視化されるので使いやすそうです。

記事執筆時(2021年2月下旬)ソースネクストでは「SOUND FORGE Pro 14 Suite」に同梱されて販売されていますが、なぜか公式サイトで買うよりも大幅に安いです。

公式サイトでは Steinberg SpectraLayers Pro 7 の体験版をダウンロードできます。

 ›› https://new.steinberg.net/ja/spectralayers/

 

さらに、音声分離ソフトは複数人が同時に喋っている場合にそれぞれの音声を分離することもできるので、文字起こしがしやすくなります。なお、できるとはいえ、男性同士など声の質が似ている場合は難しいかもしれません。

 

ソースネクストではときどき大幅値引きされていますが、私はそれでも文字起こしのためには高いかなと思ってしまいます。

文字起こしをする機会が多い人や「プロに依頼するのは…」という場合は検討してみてください。

 

 

5.感想(人の頭の中っぽい)

 

▽文字起こしは Google ドキュメントが最適かも

Google ドキュメントの音声入力を使うと高精度で文字起こしできるのにまずは驚きと、なんだか嬉しくなりました(自分が開発したわけでもないのに、なんでしょうね、感動ですね)。

無料で使える文字起こしツールは Google ドキュメントの音声入力以外にも色々とあるようで、macOS と Windows にも標準で使える音声入力があります。

macOS( High Sierra )のものはライン入力で試しましたが、数十秒で停止してしまうことと精度で Google ドキュメントの方が優れていると感じました。

 

無料のアプリでは、Android 限定ですが「音声文字変換&音検知通知」があります。Google ドキュメントよりも高精度ですが、一長一短な部分もあります。

使用感は下記リンク先の記事に書いたので、参考にしてみてください。

 › 英語学習と文字起こしに便利な Google ドキュメントの機能

 

有料ソフトの「ドラゴンスピーチ11」ではオフラインで使えるのはもちろん辞書機能や音声ファイルを短時間で文字起こしできる(メーカーサイトの例では録音時間の6分の1)など音声入力に特化したより便利な機能が搭載されています。

「 Google ドキュメントより精度が低かったら…」と心配になりますが、どちらも使ったことがある方の比較記事ではまだまだ有料ソフトの方が優れているようです(日本語入力での比較でした)。

 

ドラゴンスピーチでは英語の音声入力は発音がネイティブレベルでないとできないとのことなので、発音トレーニングに良さそうです。でも、それって、音声サンプルが少ないのではないかと疑ってしまいます。曖昧な発音でも認識してくれる方が優秀ですし。

今回、有料ソフトを調べていると AmiVoice SP2 の販売が終了したところでした。理由は分かりませんが、今後、有料ソフトはより便利な機能を搭載して価格を下げないと誰も使わなくなりそうですね。

 

 

▽人の頭の中っぽい

文字起こし中の画面を見ていると、一度起こした部分を直しながら行っています。おそらく、音声を解析するだけでなく文法に当てはめて修正しているようです。

そう見えるだけかもしれませんが、もしそうだとすると、人の頭の中も同じことをして音声を認識していると思うので、なんだか画面を見ながら応援してしまいます。これも AI なのでしょうか。

人間はさらに文脈から内容を推測して理解しますが、画面を見ているとこれもしているんじゃないかと思えてきます。

ちなみに、私は英語で会話するときには、特にこの修正や推測に集中して、音声はほとんど聞かないくらいにしています。こう書くと冷たい感じになりますが、つまり、相手の言いたいことに注目している、ということです。

今後精度はさらに上がると思うのでとても楽しみです。しかも無料。

 

 

<ついでに英単語>

文字起こし:transcription
音声入力:dictation

 

↓より短時間でできる方法

 › 英語音声のみ OK!YouTube で自動文字起こし / 字幕生成&ダウンロード+語学活用

動画を公開することなくできますよ。

 

 

▽洋画や海外ドラマを使ったおすすめ学習方法

 › プラダを着た悪魔|英語学習を天使化するおすすめ方法

 

 

 おすすめ学習書籍(オーディオブック)

洋画や海外ドラマで英語学習をするようになり数年、「こんなにシンプルで短く言えるんだ」というセリフに出会うものの、恥ずかしながらその法則が分からずにいました。英語の発想で文を組み立てる意識はしていたものの、どうしても反射的に[日本語 → 英語]の翻訳をしていました。

そんなとき、中山裕木子著「会話もメールも 英語は3語で伝わります」という本を読むと(正確にはオーディオブックのサンプルを聞くと)、目から鱗が落ちて SVO が鍵だと納得しました。

 

一番良いのは「 SVO で英文を作る」と決めておくと迷わなくなり余計な脳力を使わなくなるところです。さらに、言いたいことを組み立てるときの道が増えた感じがします。この方法に慣れると、同じ内容でも SVO で作る場合と be 動詞や受動態などで作る場合のニュアンスの違いを理解し、最適な文法を選択してより幅広く自由な英語表現ができるようになるはずです。

おまけ的に、SVO を意識する癖をつけると英語を聞く場面では内容を予測しやすくなるのでリスニング力向上にもなります。おまけとしては大きな効果です。

 

会話もメールも 英語は3語で伝わります [ 中山 裕木子 ]
by カエレバ

 

オーディオブックは audiobook.jp にて無料で一部をサンプルとして聞けるので、ぜひ聞いてみてください。英語学習にお金を使わないスタイルの私ですが、月額プランのボーナスで購入したのでカウントしていません。。

 

↓サンプル視聴先

 › 会話もメールも 英語は3語で伝わります

 

オーディオブックは通勤や通学のスキマ時間や、家事などをしながら聞くのがおすすめです。時間がなくても「1日1トラックを繰り返し聞く」と頭に入りやすいです。倍速版もあり、慣れるとこちらの方が集中して聞けるし、復習に便利で時短にもなるのでおすすめです。

 › 洋書の英語負担を軽くするオーディオブック学習・活用法

 

 

 


0

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください