英語の文字起こしを音声入力で自動化する方法・コツ( Google ドキュメント)

 広告

パソコンやスマホで利用する音声入力は口頭で文字を入力する機能ですが、録音された音声の文字起こしにも有効なのでとても便利です。

英語に限らず文字起こしをするのは大変ですが、高精度で文字起こしできる Google ドキュメントの音声入力を利用すれば手間を減らして時短できます。

英語学習では以下のようなときに使うと便利です。

 

Memo

Google ドキュメントでの文字起こしが便利なとき

  • 録音した英会話の授業を復習したい
  • 自分の発音をチェックしたい
  • オーディオブックをスクリプト化したい
  • YouTube 動画に英語字幕がないとき
  • 日本アニメの英語吹替音声のスクリプトがほしい

 

なお、オンライン英会話などの授業を録音するときは許可を取りましょう。

 

より短時間でできる方法

 

起こせなかったときの対策

BGM があっても高精度な文字起こしできます!

スピークチューター活用術!AI 英会話アプリの強力な機能を紹介
AI 英会話アプリ「スピーク」には強力な学習サポート機能「スピークチューター」があります。AI が英語に関する質問になんでも答えてくれるだけでなく、自動で作成されたフレーズでの練習や、ロールプレイでの会話練習などができます。 そんな便利なス...

 

 

1. 用意するもの(パソコン、スマホ共通)

この記事では Google ドキュメントを使った文字起こしのやり方を、日本アニメの英語音声を例に紹介します。

日本アニメ英語版の DVD/Blu-ray には英語吹替音声付きのものがあるので英語学習に活用できますが、その英語字幕は日本語音声用であるためセリフの内容と異なるという学習しづらい点があるので例にしました。

 

用意するもの

パソコン、スマホ共通

  • Google ドキュメント
  • 英語音声付き海外版 DVD / Blu-ray
    → ご自身が字起こししたい音声に置き換えてください

 

Google ドキュメントとは

Google 検索結果より引用。

 ›› https://www.google.com/intl/ja_jp/docs/about/

有料の文字起こしソフトにはより便利な機能があるので「6. 感想」にて紹介しています。

 

DVD か Blu-ray かで迷ったら

機動性を重視して DVD、より高画質で高音質な Blu-ray、という選び方があります。私の環境では機動性に大きな違いはないので Blu-ray を選んでいます。

文字起こしとしては高音質な方が精度が高くなるので Blu-ray がよいでしょう。

¥10,890 (2022/03/09 00:01時点 | Amazon調べ)

「オートメモ」も便利!

録音から自動文字起こしまで1台で完結する AI ボイスレコーダー「 AutoMemo(オートメモ) 」も便利なのでおすすめです。

実際に私も使ってみましたが、従来の IC レコーダーにはない以下のような便利な機能があるので語学が革命的に便利になると感じています。

 

Memo

  • オートメモの便利機能
  1. 録音と自動文字起こしが1台でできる(英語など計72言語)
  2. 発話部分の単語ハイライト(カラオケ字幕風)
  3. 自動スクロール
  4. タップした単語から音声を再生できる
  5. 本体で読める、テキスト検索できる
     → 聞きたいところを目で探せる
  6. 文字起こしした内容(テキスト)をメールで送信できる
     → クラウドにも保存できる
  7. 音声ファイルをダウンロードできる
  8. スマホアプリでも使える

✔︎ 2〜5は本体ではオートメモS のみ。オートメモでもスマホアプリで利用可能。

 

特に「発話部分の単語ハイライト+自動スクロール」を革命的に便利だと感じています。

なお、Google ドキュメントはリアルタイムに文字起こしを行うものですが、オートメモは録音後に少し待てば文字起こしが完了するというものです。ただし、[ ( IC レコーダーなどで) 録音 → 文字起こし]という作業の場合は大幅に時短できます。

文字起こしの精度や革命的に便利な理由はこちらの記事で紹介しているので参考にしてみてください。

オートメモS はカラオケ字幕!英語の文字起こし精度を洋画などで検証
AI ボイスレコーダー AutoMemo S(オートメモS )は自動文字起こしするとカラオケ字幕風に表示するし高精度だったので「英語学習にとって革命!」というのが使ってみた率直な感想です。 「発話部分のカラオケ字幕化」については動画で紹介し...

Amazon や楽天がお買い得な印象ですが、公式サイトもキャンペーンなどでお得な場合がありますよ。

サイトもチェックしてみてください。

「オートメモ」を公式サイトでチェックする  

 

2. パソコンで文字起こし

この章ではパソコンで Google ドキュメントを使って文字起こしをする方法を紹介します。

 

この項の目次

  1. 用意するもの
  2. 手順
  3. 手順おさらい

 

2-1. 用意するもの

 

Memo

用意するもの(パソコンの場合)

  • オスオスのステレオミニプラグケーブル
    (両端がスマホなどに使えるイヤホンプラグのもの)
  • USB サウンドカード
    (パソコンにマイク入力端子がない場合)
  • 動画プレイヤー
    VLC プレイヤーなど)

 

オスオスのステレオミニプラグケーブル ( AUX ケーブル)

低品質なケーブルは解像度が低いので文字起こしの精度に影響しそうです。

おすすめはこちら。今や珍しい日本製で、私もケーブル類は JVC のものを使っています。

 

USB サウンドカード

パソコンにマイク入力端子がない場合に使用します。

 

動画プレイヤー

動画を再生するソフトは無料で使える VLC が使いやすいです。

 

2-2. 手順

 

Memo

文字起こしの手順

  1. パソコンのヘッドホン出力端子とマイク入力端子を AUX ケーブルでつなぐ
  2. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する
  3. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節
  4. Google ドキュメントを Google Chrome で開く
  5. 新しいドキュメントを作成
  6. アイコン上部のプルダウンメニューから English( United States )を選択
  7. 動画プレイヤーで DVD を再生
  8. マイクのアイコンをクリック → 文字起こしが始まる
  9. セリフがないところで改行、してもいいし終わるまで放置でもいい
  10. 文字起こしが終わったらマイクのアイコンを押して終了

 

細かくしたので分かりづらいかもしれませんが、やることはシンプルです。

順に説明します。

 

1. パソコンのヘッドホン出力端子とマイク入力端子を AUX ケーブルでつなぐ

パソコン本体にマイク入力端子がない場合は USB サウンドカードを使います。

※ iMac に接続した外部スピーカーからの音声は内蔵マイクや手持ちの USB ヘッドセットのマイクでは認識しにくかったのでこの方法を提案しています。肉声でないと認識しづらいようです。

 

 

 

 

 

 

 

 

↑iMac(21.5-inch, Mid 2010)にケーブルを接続したところ。

イケナイことをしている感じと気持ち悪い感じがしたが大丈夫でした。iMac さんは自分が出した音が入力されていることには気づいてないはず。吸気口と排気口に換気扇用フィルター貼ってますがお気になさらず。

あえて写り込ませたスピーカーは私がいつも使っている TIMEDOMAIN light。

 › 英語学習におすすめ!音源忠実再生スピーカーでリスニング力・発音改善

 

Attention

パソコンによってはトラブルが発生するかもしれません。私は責任を負えないことを予めご了承くださいますようお願い申し上げます。不安な場合はテレビなどのヘッドホン出力端子との接続をおすすめします。

 

2. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する

USB サウンドカードを使う場合はそのデバイスに設定します。

※音声出力(音量)レベル、マイク入力レベルは共に0にしておくと無難だと思います。

 

Mac の場合

画面左上のリンゴ → システム環境設定 → サウンド → 出力・入力タブから当該デバイスを選択

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Windows10 の場合

スタートメニュー(画面左下にある[Windows]のアイコン)→ Windows システムツール → コントロールパネル → ハードウェアとサウンド → サウンド → 再生・録音タブから当該デバイスを選択

参考(エレコム):http://qa.elecom.co.jp/faq_detail.html?id=6507

 

3. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節

入力レベルがセリフ(音声)のところで真ん中になるくらいにすると丁度いいはずです。

 

4. Google ドキュメントを Google Chrome で開く

Safari では音声入力がグレーアウトして使えませんでした。

 

5. 新しいドキュメントを作成

Google ドキュメントを Google Chrome で開いたら、

[新しいドキュメントを作成 → 空白 → ツール → 音声入力 → マイクのアイコン出現]

 

6. アイコン上部のプルダウンメニューから English( United States )を選択

 

7. 動画プレイヤーで DVD を再生

 

8. マイクのアイコンをクリック → 文字起こしが始まる

文字起こししたい部分だけでも1話丸ごとでも OK。

 

9. セリフがないところで改行、してもいいし終わるまで放置でもいい

パソコンから音は出ないので放置がいいかも。

ちなみに、こちらを使うとモニターしながら文字起こしできます。

10. 文字起こしが終わったらマイクのアイコンを押して終了

 

2-3. 手順おさらい(パソコン)

ケーブルをつないでデバイスの選択と入力レベルを調節

 1. パソコンのヘッドホン出力端子とマイク入力端子をケーブルでつなぐ
  (パソコン本体にマイク入力端子がない場合は USB サウンドカードを使う)

 2. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する
  ( USB サウンドカード使う場合はそのデバイスに設定)

 3. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節
  → 入力レベルがセリフのところで真ん中くらいになるようにする

 

ここから Google ドキュメント

 4. Google ドキュメントを Google Chrome で開く
  ( Safari では音声入力がグレーアウトして使えませんでした)

 5. 新しいドキュメントを作成 → 空白 → ツール
  → 音声入力 → マイクのアイコン出現

 6. アイコン上部のプルダウンから English ( United States ) を選択

 7. マイクのアイコンをクリック

 

いよいよ文字起こし

 8. 動画プレイヤーで DVD を再生 → 文字起こしが始まる
  (文字起こししたい部分だけでも1話丸ごとでも OK )

 9. セリフがないところで改行、してもいいし終わるまで放置でもいい
  (しておくとあとで整理しやすい)
  (パソコンから音は出ないので放置がいいかも)

 10. 文字起こしが終わったらマイクのアイコンを押して終了

 

3. スマホで英アニスク起こし

この章ではスマホで Google ドキュメントを使って文字起こしをする方法を紹介します。

 

この項の目次

  1. 用意するもの
  2. 手順
  3. スマホでライン入力する方法

 

3-1. 用意するもの

 

Memo

用意するもの(スマホの場合)

  • テレビなど
    → スマホ1台のみでやる方法もあります。
  • リージョンフリーの DVD/Blu-ray プレイヤー
  • オーディオ変換ケーブル (3極メス×2-4極オス) 3.5mm
    (ライン入力する場合)

 

テレビなど

スマホで文字起こしをする場合は、テレビなどで DVD/Blu-ray を再生して、スピーカーの音をスマホに聞かせる方法を思いつくかもしれません。

しかし、この方法でも文字起こしはできるのですが、パソコンの場合と同様にライン入力で文字起こしをする方が高精度なのでおすすめです。

 

リージョンフリーの DVD/Blu-ray プレイヤー

少々ややこしいですが、海外版 DVD/Blu-ray は家庭用のプレイヤーでは再生できない場合があるので注意が必要です。

海外版 DVD はパソコンや一部のゲーム機で再生できます。家庭用のプレイヤーでは再生できないので、その場合はリージョンフリーのプレイヤーが必要です。

Blu-ray では北米版なら家庭用のプレイヤーでも国コードをアメリカに設定すると再生できます。リージョン B の Blu-ray の場合はリージョンフリーのプレイヤーが必要です。

 

3-2. 手順(ライン入力で文字起こしする方法は後述)

 

Memo

スマホで文字起こしをする手順

  1. Google ドキュメントアプリを起動
  2. 右下の赤丸をタップ → 新しいドキュメント → 作成
    (テンプレートを選ぶときは「空白」をタップ)
  3. キーボードのマイクのアイコンをタップ
  4. DVD を再生してスマホのマイクをテレビのスピーカーに近づける

 

これで文字起こしが開始されます。

なお、アプリの操作は OS やバージョンによって多少異なるかもしれません。

音の良い外部スピーカーを利用すると精度が高まるかもしれません。

 

英語として認識されない場合は言語設定を英語にしてみてください。

 

言語設定:iOS の場合

Google 検索結果より引用。

 ›› https://support.apple.com/ja-jp/HT204031

言語設定:Android の場合

設定 → 言語と入力 → 言語

英語が候補にない場合は「+言語を追加」から English を追加

English の右にある4本線をタップしたまま一番上へ移動させる

 

なお、Android のバージョンによって設定方法は異なるかもしれません。

 

3-3. スマホでライン入力する方法

パソコンでの文字起こしの精度を高めるコツとしてライン入力を紹介しましたが、スマホでもライン入力すれば精度が上がる可能性があります。

下記の2つのケーブルを繋ぐとスマホやタブレットでもライン入力ができるようになります。

 

3極-4極変換アダプタケーブル

私はこちらを使用していますがしっかりしていて必要十分です。音質も。

 

オス-オスのステレオミニプラグケーブル ( AUX ケーブル)

パソコンのところで紹介したものと同じです。

 

ケーブルの繋ぎ方ははこちらの記事を参考にしてください。

 

スマホでさらに精度を上げたい場合はこちらの方法も試してみてください。

 

▽ちなみに(古い機種でも使える)

iPhone 4s(おつかれ)の内蔵マイク入力で試したところ iMac ほどではありませんが高い精度で文字起こししてくれました。(ライン入力は試していません)

数十秒で停止してしまいますが古い機種でも使えました。

 

4. 文字起こしの精度を上げるコツ

この章ではライン入力以外の文字起こしの精度を上げるコツを紹介します。

 

Memo

ライン入力以外で文字起こしの精度を上げるコツ

  • 再生速度を0.75倍に
  • 入力と出力レベルを最大値 (100%) に
  • 32 bit、96 kHz に設定
  • CPU とメモリに負荷をかけない

 

再生速度を0.75倍に

実際にアニメの英語音声で試したところ、再生速度を0.75倍くらいにすると通常速度よりも文字起こしの精度が上がりました。偶然かもしれませんが、試してみて精度が上がれば採用ください。

なお、さらに遅くすれば精度が上がるというわけではなさそうです。

倍速再生は VLC でもできます。やり方はこちらを参考にしてください。

 

動画配信サービスでは U-NEXT に倍速再生機能があります。

 

入力と出力レベルを最大値 (100%) に

音量(出力レベル)を最大にするとスピーカーやイヤホンだけでなく耳まで壊れそうな音量が出ますが、実は音声信号のレベルは最大値で100%です。

人間の耳には丁度いい音量であっても機械にとっては小さい音量である可能性があります。そのため入力と出力レベルを最大にすると文字起こしの精度が上がる可能性があります。

ここで気をつけなければならないのは、再生機によっては100%以上の音量が出せるものがあるので、出力レベルを100%が超えないように設定する必要がある点です。出力レベルが100%を超えると過大入力となるので音が歪み、文字起こしの精度が下がる可能性があります。

VLC プレイヤーでは200%まで出力(音量)レベルを調節できますが、100%に設定します。

最も注意しなければいけないのは、言わずもがなですが文字起こしが終わったら必ず音量を下げることです。うっかりそのままスピーカーやイヤホンで再生すると、どえらいことになります。

なお、100%と50%で比較して文字起こしの精度か変わらないのであれば50%にするとよいでしょう。

 

32 bit、96 kHz に設定

未確認ではありますが、パソコン音声の入出力を32 bit、96 kHz に設定すると精度が向上するかもしれません。

macOS では[アプリケーション → ユーティリティ → Audio MIDI Setup ]にて設定できます。

ただし、この設定はステレオミニプラグをヘッドホン出力端子から抜くとデフォルトに戻ります。

 

CPU とメモリに負荷をかけない

文字起こし中の CPU とメモリの使用率をアクティビティモニタで観察してみました。

Chrome の CPU 使用率は Google ドキュメント開いた状態で0.4%前後、文字起こし中は8%前後になりましたが再生中の VLC で20%前後なので負荷はあまりないと思われます。メモリは1分程度の使用では変化はありませんでした。

パソコンのスペックは文字起こしの精度にあまり関係なさそうですが、他のアプリケーションはなるべく閉じておいた方が無難だと思います。

なお、文字起こしをライン入力ではなく内蔵マイクや外部マイクを使用する場合はその性能に依存すると考えられます。

 

文字起こしの精度を上げるコツまとめ

 

Memo

文字起こしの精度を上げるコツ

  • ライン入力で文字起こしする
  • 再生速度を0.75倍くらいにする
  • 音量を最大値 (100%) にする → 文字起こし後は必ず音量を下げる
  • 他のアプリケーションをなるべく閉じておく

 

 

5. 音声にノイズがある場合

音声にノイズや音楽があると文字起こしができない場合があります。他の文字起こしアプリを試す方法もありますがノイズが原因であれば難しいと考えられます。

ノイズの除去は無料の音楽作成ソフト Audacity にその機能があります。

 ›› Audacity(公式サイト)

使い方は「 Audacity ノイズ除去」と検索してください。難しくはないと思います。

音楽の場合はボーカルや楽器ごとに分離する spleeter というオープンソースがあります。こちらも使い方は検索してください。

有料ソフトでは Steinberg SpectraLayers Pro 7 があります。ある動画でリポーターの中継に重なったサイレンを消す作業を確認しましたが、音が色分けして可視化されるので使いやすそうです。

記事更新時(2022年3月下旬)、ソースネクストでは SOUND FORGE Pro 15 Suite に同梱されて販売されていますが、キャンペーン時はなぜか公式サイトで買うよりも大幅に安いです。

公式サイトでは Steinberg SpectraLayers Pro 7 の体験版をダウンロードできます。

 ›› https://new.steinberg.net/ja/spectralayers/

 

音声分離ソフトは複数人が同時に喋っている場合にそれぞれの音声を分離することもできるので、文字起こしがしやすくなります。なお、分離できるとはいえ、男性同士など声の質が似ている場合は難しいかもしれません。

ソースネクストではときどき大幅値引きされていますが、私はそれでも文字起こしのためには高いかなと思ってしまいます。

文字起こしをする機会が多い人や「プロに依頼するのは…」という場合は検討してみてください。

 

6. 感想(人の頭の中っぽい)

パソコンでの文字起こしは Google ドキュメントが最適かも (無料では)

Google ドキュメントの音声入力を使うと高精度で文字起こしできるのにまずは驚きと、なんだか嬉しくなりました。自分が開発したわけでもないのに、なんでしょうね、感動ですね。

無料で使える文字起こしツールは Google ドキュメントの音声入力以外にも色々とあるようで、macOS と Windows にも標準で使える音声入力があります。

macOS( High Sierra )標準の音声入力はライン入力で試しましたが、数十秒で停止してしまうことと精度で Google ドキュメントの方が優れていると感じました。

 

音声文字変換&音検知通知がベスト

無料のスマホアプリでは、Android 限定ですが「音声文字変換&音検知通知」があります。Google ドキュメントよりも高精度ですが、一長一短な部分もあります。

両者の比較と使用感はこちらを参考にしてみてください。

 

▽有料ソフトもありますが

有料ソフトの「ドラゴンスピーチ11」ではオフラインで使えるのはもちろん辞書機能や音声ファイルを短時間で文字起こしできる(メーカーサイトの例では録音時間の6分の1)など音声入力に特化したより便利な機能が搭載されています。

「 Google ドキュメントより精度が低かったら…」と心配になりますが、どちらも使ったことがある方の比較記事ではまだまだ有料ソフトの方が優れているようです(日本語入力での比較でした)。

ドラゴンスピーチでは英語の音声入力は発音がネイティブレベルでないとできないとのことなので、発音トレーニングに良さそうです。でも、それって、音声サンプルが少ないのではないかと疑ってしまいます。曖昧な発音でも認識してくれる方が優秀ですし。

今回、有料ソフトを調べていると AmiVoice SP2 の販売が終了したところでした。理由は分かりませんが、今後、有料ソフトはより便利な機能を搭載して価格を下げないと誰も使わなくなりそうですね。

 

人の頭の中っぽい

Google ドキュメントの文字起こし中の画面を見ていると、一度起こした部分を修正しながら作業しているように見えます。おそらく、音声を解析するだけでなく文法に当てはめて直しているようです。

そう見えるだけかもしれませんが、もしそうだとすると、人の頭の中も同じことをして音声を認識していると思うので、なんだか画面を見ながら応援してしまいます。これも AI なのでしょうか。

人間はさらに文脈から内容を推測して理解しますが、画面を見ているとこれもしているんじゃないかと思えてきます。今後精度はさらに上がると思うのでとても楽しみです。しかも無料。

ちなみに、私は英語で会話するときには、特に相手の言いたいことに集中して内容を推測しています。音声としてはほとんど聞かないくらいにしています。こう書くと冷たい感じになりますが、つまり、相手の言いたいことに注目している、ということです。

 

7. どうしても文字起こしできない場合

英語の文字起こしができない場合の対策はこちらで紹介しています。

 

<ついでに英単語>

文字起こし:transcription
音声入力:dictation

英語ができない犯人は?

英語に苦手意識がある人は多いと思いますが、その犯人を特定できていますか?

英会話でいうと犯人は…

  • 喋る練習をしない自分
  • 興味がない方向で、効果がない方法でやらされていた自分

ちょっと厳しい言い方になったかもしれませんが、こんなシンプルなことを教えない人こそ犯人だと私は思います。

犯人は分かった。ではどうするか?

私も遊び感覚で使っている「スピーク」という AI 英会話アプリを使うと解決します。

スピークを使うと…

  • とにかく喋る練習をさせられる
  • 興味がある方向で、効果がある方法でやれる
  • 強力な AI 学習サポーターがいる

AI 相手だからこそ、いつでも喋る練習ができる、分からないことを何でも聞ける、恥ずかしくない、といったメリットもあります。

スピークで解決する詳しい理由は下記の記事で述べているので、英語に苦手意識を持っていた方はぜひ参考にしてほしいと思います。

初心者向けとしていますが、スピークの実力や概要を知るのにちょうどいいかなと思います。

AI 英会話アプリ「スピーク」初心者に◎の効果的な使い方
AI 英会話アプリ「スピーク」は英語苦手な初心者が使っても効果があるのか、大丈夫なのか、不安な方も多いと思います。 英会話アプリなのに会話にならなかったらどうしよう 他の AI 英会話アプリは全く合わなかった 発音が苦手で認識してくれなさそ...
スピーク (Speak) | シリコンバレー発のAI英会話アプリ
スピークは、米国シリコンバレーで生まれたスピーキング特化型の英語教育アプリです。ChatGPTの開発先で知られるOpenAIのスタートアップファンドから投資も受けており、今世界で最も注目されているAI教育アプリの1つです。「日本人=英語が話...

まずは無料で AI 英会話アプリ「スピーク」を使ってみる(公式サイト)  

 

なお、私も洋画や海外ドラマ、日本アニメ英語版を素材としたオンラインレッスンを提供しています。お好きな作品でレッスンできるので、勉強感なく、おしゃべり感覚で楽しく英語学習を続けられると思います。

「中学英語も怪しい…」という方も、英語仲間として基礎からお支えします。安心してお任せください。

洋画などでの英語学習に不安がある方は Lesson+ をご確認ください。

 

こちらもおすすめ!

初心者が英語を効率的に習得できる教材とサービス|目的&技能別
英語初心者は「効果的な方法で目的とレベルに合った学習をする」という、当たり前なことを実践して基礎を習得するのが一番です。一度英語の基礎を習得すれば以降の学習も効果的に行えます。 とはいえ、初心者は「それが難しいんですけど…」という状態だと思...
単語集は1冊3ヶ月で!英単語の効率的な覚え方&暗記術
英語の単語集は1冊3ヶ月で効率良くやり切るのがおすすめです。「そんなの無理」と思うかもしれませんが、意外と負担は少ないと思います。3ヶ月でやらないと逆にキツくもあるので、そのための戦略的な方法を紹介します。 大学入試、英検、TOEIC など...
独学で!英語の習得を最速化する4つの能力と鍛え方
「この4つを鍛えると英語学習が最速化、自動化、無料化する」と私が考える英語力があるので、その力と効果的な鍛え方を紹介します。 10年以上、私は独学で英語学習を続けてきましたが、いずれも学習初期に鍛えておけばよかったと思うものばかりです。 初...

 

Comment

Amazonのアソシエイトとして、当メディアは適格販売により収入を得ています。

タイトルとURLをコピーしました