英語の文字起こしを音声入力で自動化する方法・コツ( Google ドキュメント)

パソコンやスマホで利用する音声入力は口頭で文字を入力する機能ですが、録音された音声の文字起こしにも有効なのでとても便利です。

英語に限らず文字起こしをするのは大変ですが、高精度で文字起こしできる Google ドキュメントの音声入力を利用すれば手間を減らして時短できます。

英語学習では以下のようなときに便利です。

 

Memo

英語学習に便利な文字起こし活用方法

  • YouTube 動画に英語字幕がない
  • 録音した英会話の授業を復習したい
  • 自分の発音をチェックしたい
  • オーディオブックをスクリプト化したい
  • 日本アニメの英語吹替音声のスクリプトがほしい

 

なお、オンライン英会話などの授業を録音するときは許可を取りましょう。

 

より短時間でできる方法

 

起こせなかったときの対策

 

文字になるボイスレコーダー& AI ボイス筆談機

録音した音声ファイルを自動でテキスト化できるボイスレコーダー「AutoMemo(オートメモ)」は、録音、再生だけでなく会議メモや議事録、取材記事などを作成する際に役立ちそうです。また、会話をテキスト化できる AI ボイス筆談機「ポケトークmimi」は語学にも便利そうです。どちらも「ソースネクスト」サイトにて紹介されているのでチェックしてみてください。

 

1. 用意するもの(パソコン、スマホ共通)

この記事では Google ドキュメントを使った文字起こしのやり方を、日本アニメの英語音声を例として紹介します。

北米版などの日本アニメの DVD/Blu-ray には英語吹替音声付きのものがあるので英語学習に活用できますが、その英語字幕は日本語音声用であるためセリフの内容と異なるという学習しづらい点があるのが理由です。

 

用意するもの

パソコン、スマホ共通

  • 英語音声付き海外版 DVD/Blu-ray
    → ご自身が字起こししたい音声に置き換えてください
  • Google ドキュメント

 

Google ドキュメントとは

Google 検索結果より引用。

 ›› https://www.google.com/intl/ja_jp/docs/about/

有料の文字起こしソフトにはより便利な機能があるので「6. 感想」にて紹介しています。

 

DVD か Blu-ray かで迷ったら

機動性を重視して DVD、より高画質で高音質な Blu-ray、という選び方があります。私の環境では機動性に大きな違いはないので Blu-rayを選んでいます。

 

2. パソコンで文字起こし

この項はパソコンで Google ドキュメントを使って文字起こしをする方法の紹介です。

 

この項の目次

  1. 用意するもの
  2. 手順
  3. 手順おさらい

 

2-1. 用意するもの

 

Memo

用意するもの(パソコンの場合)

  • オスオスのステレオミニプラグケーブル
    (両端がスマホなどに使えるイヤホンプラグのもの)
  • USB サウンドカード
    (パソコンにマイク入力端子がない場合)
  • 動画プレイヤー
    VLC プレイヤーなど)

 

オスオスのステレオミニプラグケーブル ( AUX ケーブル)

 

USB サウンドカード

パソコンにマイク入力端子がない場合に使用します。

 

動画プレイヤー

動画を再生するソフトは無料で使える VLC が使いやすいです。

 

2-2. 手順

 

Memo

文字起こしの手順

  1. パソコンのヘッドホン出力端子とマイク入力端子を AUX ケーブルでつなぐ
  2. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する
  3. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節
  4. Google ドキュメントを Google Chrome で開く
  5. 新しいドキュメントを作成
  6. アイコン上部のプルダウンメニューから English( United States )を選択
  7. 動画プレイヤーで DVD を再生
  8. マイクのアイコンをクリック → 文字起こしが始まる
  9. セリフがないところで改行、してもいいし終わるまで放置でもいい
  10. 文字起こしが終わったらマイクのアイコンを押して終了

 

細かくしたので分かりづらいかもしれませんが、やることはシンプルです。

順に説明します。

 

1. パソコンのヘッドホン出力端子とマイク入力端子を AUX ケーブルでつなぐ

パソコン本体にマイク入力端子がない場合は USB サウンドカードを使います。

※ iMac に接続した外部スピーカーからの音声は内蔵マイクや手持ちの USB ヘッドセットのマイクでは認識しにくかったのでこの方法を提案しています。肉声でないと認識しづらいようです。

 

 

 

 

 

 

 

 

↑iMac(21.5-inch, Mid 2010)にケーブルを接続したところ。

イケナイことをしている感じと気持ち悪い感じがしたが大丈夫でした。iMac さんは自分が出した音が入力されていることには気づいてないはず。吸気口と排気口に換気扇用フィルター貼ってますがお気になさらず。

あえて写り込ませたスピーカーは私がいつも使っている TIMEDOMAIN light。

 › 英語学習におすすめ!音源忠実再生スピーカーでリスニング力・発音改善

 

Attention

パソコンによってはトラブルが発生するかもしれません。私は責任を負えないことを予めご了承くださいますようお願い申し上げます。不安な場合はテレビなどのヘッドホン出力端子との接続をおすすめします。

 

2. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する

USB サウンドカードを使う場合はそのデバイスに設定します。

※音声出力(音量)レベル、マイク入力レベルは共に0にしておくと無難だと思います。

 

Mac の場合

画面左上のリンゴ → システム環境設定 → サウンド → 出力・入力タブからデバイスを選択

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Windows10 の場合

スタートメニュー(画面左下にある[Windows]のアイコン)→ Windows システムツール → コントロールパネル → ハードウェアとサウンド → サウンド → 再生・録音タブからデバイスを選択

参考(エレコム):http://qa.elecom.co.jp/faq_detail.html?id=6507

 

3. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節

入力レベルをセリフのところで真ん中くらいにすると丁度いいはずです。

 

4. Google ドキュメントを Google Chrome で開く

Safari では音声入力がグレーアウトして使えませんでした。

 

5. 新しいドキュメントを作成

Google ドキュメントを Google Chrome で開いたら、

[新しいドキュメントを作成 → 空白 → ツール → 音声入力 → マイクのアイコン出現]

 

6. アイコン上部のプルダウンメニューから English( United States )を選択

 

7. 動画プレイヤーで DVD を再生

 

8. マイクのアイコンをクリック → 文字起こしが始まる

文字起こししたい部分だけでも1話丸ごとでも OK。

 

9. セリフがないところで改行、してもいいし終わるまで放置でもいい

パソコンから音は出ないので放置がいいかも。

 

10. 文字起こしが終わったらマイクのアイコンを押して終了

 

2-3. 手順おさらい(パソコン)

ケーブルをつないでデバイスの選択と入力レベルを調節

 1. パソコンのヘッドホン出力端子とマイク入力端子をケーブルでつなぐ
  (パソコン本体にマイク入力端子がない場合は USB サウンドカードを使う)

 2. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する
  ( USB サウンドカード使う場合はそのデバイスに設定)

 3. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節
  → 入力レベルがセリフのところで真ん中くらいになるようにする

 

ここから Google ドキュメント

 4. Google ドキュメントを Google Chrome で開く
  ( Safari では音声入力がグレーアウトして使えませんでした)

 5. 新しいドキュメントを作成 → 空白 → ツール
  → 音声入力 → マイクのアイコン出現

 6. アイコン上部のプルダウンから English ( United States ) を選択

 7. マイクのアイコンをクリック

 

いよいよ文字起こし

 8. 動画プレイヤーで DVD を再生 → 文字起こしが始まる
  (文字起こししたい部分だけでも1話丸ごとでも OK )

 9. セリフがないところで改行、してもいいし終わるまで放置でもいい
  (しておくとあとで整理しやすい)
  (パソコンから音は出ないので放置がいいかも)

 10. 文字起こしが終わったらマイクのアイコンを押して終了

 

3. スマホで英アニスク起こし

この項はスマホで Google ドキュメントを使って文字起こしをする方法の紹介です。

 

この項の目次

  1. 用意するもの
  2. 手順
  3. スマホでライン入力する方法

 

 

3-1. 用意するもの

 

Memo

用意するもの(スマホの場合)

  • テレビなど
    → スマホ1台のみでやる方法もあります。
  • リージョンフリーの DVD/Blu-ray プレイヤー
  • オーディオ変換ケーブル (3極メス×2-4極オス) 3.5mm
    (ライン入力する場合)

 

テレビなど

スマホで文字起こしをする場合は、テレビなどで音声を再生してその音をスマホに聞かせます。

だたし、この方法でも文字起こしはできるのですが、ライン入力で文字起こしをする方が高精度なのでおすすめです。

 

リージョンフリーの DVD/Blu-ray プレイヤー

リージョンフリーの DVD プレイヤーは海外版のそれを再生するために必要です。

Amazon などで3,000円くらいからあります。

 

3-2. 手順(ライン入力で文字起こしする方法は後述)

 1. Google ドキュメントアプリを起動

 2. 右下の赤丸をタップ → 新しいドキュメント → 作成
  (テンプレートを選ぶときは「空白」をタップ)

 3. キーボードのマイクのアイコンをタップ

 4. DVD を再生してスマホのマイクをテレビのスピーカーに近づける
  (音の良い外部スピーカーを利用すると精度が高まるかもしれません)

 

英語として認識されない場合は言語設定を英語にしてみてください。

 

言語設定:iOS の場合

Google 検索結果より引用。

 ›› https://support.apple.com/ja-jp/HT204031

言語設定:Android の場合

設定 → 言語と入力 → 言語

英語が候補にない場合は「+言語を追加」から English を追加

English の右にある4本線をタップしたまま一番上へ移動させる

 

なお、Android のバージョンによって設定方法は異なるかもしれません。

 

3-3. スマホでライン入力する方法

パソコンでの文字起こしの精度を高めるコツとしてライン入力を紹介しましたが、スマホでもライン入力すれば精度が上がる可能性があります。

下記の2つのケーブルを繋ぐとスマホやタブレットでもライン入力ができるようになります。

 

3極-4極変換アダプタケーブル

私はこちらを使用していますがしっかりしていて必要十分です。音質も。

 

オス-オスのステレオミニプラグケーブル ( AUX ケーブル)

 

スマホで再生中の音声を自動で文字起こしすることもできます。

やり方はこちらを参考にしてください。

 

スマホでさらに精度を上げたい場合はこちらの方法も試してみてください。

 

▽ちなみに(古い機種でも使える)

iPhone 4s(おつかれ)の内蔵マイク入力で試したところ iMac ほどではありませんが高い精度で文字起こししてくれました。(ライン入力は試していません)

数十秒で停止してしまいますが古い機種でも使えました。

 

4. 文字起こしの精度を上げるコツ

再生速度を0.75倍に

実際にアニメの英語音声で試したところ、再生速度を0.75倍くらいにすると通常速度よりも文字起こしの精度が上がりました。偶然かもしれませんが、試してみて精度が上がれば採用ください。

なお、さらに遅くすれば精度が上がるというわけではなさそうです。

倍速再生は VLC でもできます。やり方はこちらを参考にしてください。

 

動画配信サービスでは U-NEXT に倍速再生機能があります。

 

入力と出力レベルを最大値 (100%) に

音量(出力レベル)を最大にするとスピーカーやイヤホン、耳が壊れそうな音量が出ますが、実は音声信号のレベルは最大値で100%です。

人間の耳には丁度いい音量であっても機械にとっては小さい音量である可能性があります。そのため入力と出力レベルを最大にすると文字起こしの精度が上がる可能性があります。

 

ここで気をつけなければならないのは、再生機によっては100%以上の音量が出せるものがあるので、出力レベルを100%が超えないように設定する必要がある点です。出力レベルが100%を超えると過大入力となるので文字起こしの精度が下がる可能性があります。

VLC プレイヤーでは200%まで出力(音量)レベルを調節できますが、100%に設定します。

最も注意しなければいけないのは、言わずもがなですが文字起こしが終わったら必ず音量を下げることです。うっかりそのままスピーカーやイヤホンで再生すると、どえらいことになります。

 

32 bit、96 kHz に設定

未確認ではありますが、パソコン音声の入出力を32 bit、96 kHz に設定すると精度が向上するかもしれません。

macOS では[アプリケーション → ユーティリティ → Audio MIDI Setup ]にて設定できます。

ただし、この設定はステレオミニプラグをヘッドホン出力端子から抜くとデフォルトに戻ります。

 

CPU とメモリに負荷をかけない

文字起こし中の CPU とメモリの使用率をアクティビティモニタで観察してみました。

Chrome の CPU 使用率は Google ドキュメント開いた状態で0.4%前後、文字起こし中は8%前後になりましたが再生中の VLC で20%前後なので負荷はあまりないと思われます。メモリは1分程度の使用では変化はありませんでした。

パソコンのスペックは文字起こしの精度にあまり関係なさそうですが、他のアプリケーションはなるべく閉じておいた方が無難だと思います。

なお、文字起こしをライン入力ではなく内蔵マイクや外部マイクを使用する場合はその性能に依存すると考えられます。

 

文字起こしの精度を上げるコツまとめ

 

Memo

文字起こしの精度を上げるコツ

  • ライン入力で文字起こしする
  • 再生速度を0.75倍くらいにする
  • 音量を最大値 (100%) にする → 文字起こし後は必ず音量を下げる
  • 他のアプリケーションをなるべく閉じておく

 

5. 音声にノイズがある場合

音声にノイズや音楽があると文字起こしができない場合があります。他の文字起こしアプリを試す方法もありますがノイズが原因であれば難しいと考えられます。

ノイズの除去は無料の音楽作成ソフト Audacity にその機能があります。

 ›› Audacity(公式サイト)

使い方は「 Audacity ノイズ除去」と検索してください。難しくはないと思います。

音楽の場合はボーカルや楽器ごとに分離する spleeter というオープンソースがあります。こちらも使い方は検索してください。

 

有料ソフトでは Steinberg SpectraLayers Pro(リンク先はソースネクストサイト)があります。リンク先にある動画ではリポーターの中継に重なったサイレンを消す作業を確認できますが、音が色分けして可視化されるので使いやすそうです。

記事更新時(2021年2月下旬)、ソースネクストでは「SOUND FORGE Pro 14 Suite」に同梱されて販売されていますが、なぜか公式サイトで買うよりも大幅に安いです。

公式サイトでは Steinberg SpectraLayers Pro 7 の体験版をダウンロードできます。

 ›› https://new.steinberg.net/ja/spectralayers/

 

音声分離ソフトは複数人が同時に喋っている場合にそれぞれの音声を分離することもできるので、文字起こしがしやすくなります。なお、できるとはいえ、男性同士など声の質が似ている場合は難しいかもしれません。

ソースネクストではときどき大幅値引きされていますが、私はそれでも文字起こしのためには高いかなと思ってしまいます。

文字起こしをする機会が多い人や「プロに依頼するのは…」という場合は検討してみてください。

 

6. 感想(人の頭の中っぽい)

パソコンでの文字起こしは Google ドキュメントが最適かも (無料では)

Google ドキュメントの音声入力を使うと高精度で文字起こしできるのにまずは驚きと、なんだか嬉しくなりました。自分が開発したわけでもないのに、なんでしょうね、感動ですね。

無料で使える文字起こしツールは Google ドキュメントの音声入力以外にも色々とあるようで、macOS と Windows にも標準で使える音声入力があります。

macOS( High Sierra )標準の音声入力はライン入力で試しましたが、数十秒で停止してしまうことと精度で Google ドキュメントの方が優れていると感じました。

 

音声文字変換&音検知通知がベスト

無料のスマホアプリでは、Android 限定ですが「音声文字変換&音検知通知」があります。Google ドキュメントよりも高精度ですが、一長一短な部分もあります。

両者の比較と使用感はこちらを参考にしてみてください。

 

▽有料ソフトもありますが

有料ソフトの「ドラゴンスピーチ11」ではオフラインで使えるのはもちろん辞書機能や音声ファイルを短時間で文字起こしできる(メーカーサイトの例では録音時間の6分の1)など音声入力に特化したより便利な機能が搭載されています。

「 Google ドキュメントより精度が低かったら…」と心配になりますが、どちらも使ったことがある方の比較記事ではまだまだ有料ソフトの方が優れているようです(日本語入力での比較でした)。

ドラゴンスピーチでは英語の音声入力は発音がネイティブレベルでないとできないとのことなので、発音トレーニングに良さそうです。でも、それって、音声サンプルが少ないのではないかと疑ってしまいます。曖昧な発音でも認識してくれる方が優秀ですし。

今回、有料ソフトを調べていると AmiVoice SP2 の販売が終了したところでした。理由は分かりませんが、今後、有料ソフトはより便利な機能を搭載して価格を下げないと誰も使わなくなりそうですね。

 

人の頭の中っぽい

Google ドキュメントの文字起こし中の画面を見ていると、一度起こした部分を修正しながら作業しているように見えます。おそらく、音声を解析するだけでなく文法に当てはめて直しているようです。

そう見えるだけかもしれませんが、もしそうだとすると、人の頭の中も同じことをして音声を認識していると思うので、なんだか画面を見ながら応援してしまいます。これも AI なのでしょうか。

人間はさらに文脈から内容を推測して理解しますが、画面を見ているとこれもしているんじゃないかと思えてきます。今後精度はさらに上がると思うのでとても楽しみです。しかも無料。

ちなみに、私は英語で会話するときには、特に相手の言いたいことに集中して内容を推測しています。音声としてはほとんど聞かないくらいにしています。こう書くと冷たい感じになりますが、つまり、相手の言いたいことに注目している、ということです。

 

7. どうしても文字起こしできない場合

英語の文字起こしができない場合の対策はこちらで紹介しています。

 

しかし、どうしても文字起こしできない部分はあるでしょうし、そもそも「文字起こしをする時間がない」という方も多いと思います。文字起こしをする時間を英語学習に当てたいものです。

そんな場合はやはりプロに依頼するのが最善策でしょう。手間と時間をお金で買う戦略です。

 

<ついでに英単語>

文字起こし:transcription
音声入力:dictation

オンライン英会話に疲れた? VR×AI で解決

コミュ以前に気持ちの切り替えが億劫

昨今は手軽に英会話学習ができるオンライン英会話サービスが一般化していますが、講師と話すのが恥ずかしい以前に人と話すのが億劫に感じる方も多いのではないでしょうか。私も日常と仕事でお疲れなときには「対話モード」への切り替えが面倒に感じます。

 

VR×AI なら独りで好きなときに自分が納得するまで学習できる

そこでおすすめなのが VR 英会話サービスの スマート・チューター です。VR 空間で AI 人物と会話するため好きなときにニュートラルな自分のままで英会話の練習ができますし、講師に余計な気を遣うことなく学習に集中できるでしょう。

レッスン予約や講師待ちはもちろん不要ですし、決められた時間にドキドキしながら準備して待つこともありません。むしろ、その時間を使って学習できます。

Smart Tutor 使用の流れ

 

AI ならではの会話感と弱点分析力

一般的な英会話学習アプリは選択問題なのでどうしても会話感は乏しくなりますが、スマート・チューターならよりリアルな英会話の練習ができます。なぜなら、AI の質問や返答が毎回変わるので選択問題よりも自由な回答が求められるからです。

さらに、AI が自分に合ったカリキュラムを作成する機能や、自分の話す速さが数値化される機能があるので弱点を効果的に改善できそうです。

加えて、リアルでは相手が言ったり自分が使ったりした英語表現を一撃で覚えた経験がある人も多いと思いますが、VR なら没入感と臨場感でこの現象が起きやすく学習効果アップに繋がるメリットもあるのではと考えられます。

\10日間の無料お試し実施中 (VR無料でレンタル中) /

5,000円引きとなる上記リンク専用コード[NEW50]のご利用をお忘れなく。

VR ゴーグルは無料でレンタルできるのでお得です。

コメント

タイトルとURLをコピーしました