英語の文字起こしを音声入力で自動化する方法・コツ（ Google ドキュメント）

＼楽天ポイント4倍セール！／

オートメモS はカラオケ字幕！英語の文字起こし精度を洋画などで検証

ポチップ

「オートメモ」も便利！

録音から自動文字起こしまで１台で完結する AI ボイスレコーダー「 AutoMemo（オートメモ）」も便利なのでおすすめです。

実際に私も使ってみましたが、従来の IC レコーダーにはない以下のような便利な機能があるので語学が革命的に便利になると感じています。

Memo

オートメモの便利機能

録音と自動文字起こしが１台でできる（英語など計72言語）
発話部分の単語ハイライト（カラオケ字幕風）
自動スクロール
タップした単語から音声を再生できる
本体で読める、テキスト検索できる
→ 聞きたいところを目で探せる
文字起こしした内容（テキスト）をメールで送信できる
→ クラウドにも保存できる
音声ファイルをダウンロードできる
スマホアプリでも使える

✔︎ ２〜５は本体ではオートメモS のみ。オートメモでもスマホアプリで利用可能。

特に「発話部分の単語ハイライト＋自動スクロール」を革命的に便利だと感じています。

なお、Google ドキュメントはリアルタイムに文字起こしを行うものですが、オートメモは録音後に少し待てば文字起こしが完了するというものです。ただし、［ ( IC レコーダーなどで) 録音 → 文字起こし］という作業の場合は大幅に時短できます。

文字起こしの精度や革命的に便利な理由はこちらの記事で紹介しているので参考にしてみてください。

AI ボイスレコーダー AutoMemo S（オートメモS ）は自動文字起こしするとカラオケ字幕風に表示するし高精度だったので「英語学習にとって革命！」というのが使ってみた率直な感想です。「発話部分のカラオケ字幕化」については動画で紹介して...

AutoMemo S（オートメモ）AIボイスレコーダー（文字起こし機能付き）

¥19,250 （2023/03/18 16:29時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

ポチップ

Amazon や楽天がお買い得な印象ですが、公式サイトもキャンペーンなどでお得な場合がありますよ。

サイトもチェックしてみてください。

「オートメモ」を公式サイトでチェックする

２. パソコンで文字起こし

この章ではパソコンで Google ドキュメントを使って文字起こしをする方法を紹介します。

この項の目次

用意するもの
手順
手順おさらい

2-1. 用意するもの

Memo

用意するもの（パソコンの場合）

オスオスのステレオミニプラグケーブル
（両端がスマホなどに使えるイヤホンプラグのもの）
USB サウンドカード
（パソコンにマイク入力端子がない場合）
動画プレイヤー
（ VLC プレイヤーなど）

オスオスのステレオミニプラグケーブル ( AUX ケーブル)

低品質なケーブルは解像度が低いので文字起こしの精度に影響しそうです。

おすすめはこちら。今や珍しい日本製で、私もケーブル類は JVC のものを使っています。

JVC ステレオミニプラグ-ステレオミニプラグ 0.5m CN-MM50-B

¥943 （2021/08/18 02:19時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

ポチップ

USB サウンドカード

パソコンにマイク入力端子がない場合に使用します。

BUFFALO USBオーディオアダプター BSHSAU105BK

¥1,380 （2021/08/18 02:32時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

› 英語学習におすすめ！音源忠実再生スピーカーでリスニング力・発音改善

ポチップ

動画プレイヤー

動画を再生するソフトは無料で使える VLC が使いやすいです。

2-2. 手順

Memo

文字起こしの手順

パソコンのヘッドホン出力端子とマイク入力端子を AUX ケーブルでつなぐ
パソコンの音声出力をヘッドホン、音声入力をラインインに設定する
動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節
Google ドキュメントを Google Chrome で開く
新しいドキュメントを作成
アイコン上部のプルダウンメニューから English（ United States ）を選択
動画プレイヤーで DVD を再生
マイクのアイコンをクリック → 文字起こしが始まる
セリフがないところで改行、してもいいし終わるまで放置でもいい
文字起こしが終わったらマイクのアイコンを押して終了

細かくしたので分かりづらいかもしれませんが、やることはシンプルです。

順に説明します。

１. パソコンのヘッドホン出力端子とマイク入力端子を AUX ケーブルでつなぐ

パソコン本体にマイク入力端子がない場合は USB サウンドカードを使います。

※ iMac に接続した外部スピーカーからの音声は内蔵マイクや手持ちの USB ヘッドセットのマイクでは認識しにくかったのでこの方法を提案しています。肉声でないと認識しづらいようです。

↑iMac（21.5-inch, Mid 2010）にケーブルを接続したところ。

イケナイことをしている感じと気持ち悪い感じがしたが大丈夫でした。iMac さんは自分が出した音が入力されていることには気づいてないはず。吸気口と排気口に換気扇用フィルター貼ってますがお気になさらず。

あえて写り込ませたスピーカーは私がいつも使っている TIMEDOMAIN light。

Attention

パソコンによってはトラブルが発生するかもしれません。私は責任を負えないことを予めご了承くださいますようお願い申し上げます。不安な場合はテレビなどのヘッドホン出力端子との接続をおすすめします。

２. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する

USB サウンドカードを使う場合はそのデバイスに設定します。

※音声出力（音量）レベル、マイク入力レベルは共に０にしておくと無難だと思います。

Mac の場合

画面左上のリンゴ → システム環境設定 → サウンド → 出力・入力タブから当該デバイスを選択

Windows10 の場合

スタートメニュー（画面左下にある［Windows］のアイコン）→ Windows システムツール → コントロールパネル → ハードウェアとサウンド → サウンド → 再生・録音タブから当該デバイスを選択

参考（エレコム）：http://qa.elecom.co.jp/faq_detail.html?id=6507

３. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節

入力レベルがセリフ（音声）のところで真ん中になるくらいにすると丁度いいはずです。

４. Google ドキュメントを Google Chrome で開く

Safari では音声入力がグレーアウトして使えませんでした。

５. 新しいドキュメントを作成

Google ドキュメントを Google Chrome で開いたら、

［新しいドキュメントを作成 → 空白 → ツール → 音声入力 → マイクのアイコン出現］

６. アイコン上部のプルダウンメニューから English（ United States ）を選択

７. 動画プレイヤーで DVD を再生

８. マイクのアイコンをクリック → 文字起こしが始まる

文字起こししたい部分だけでも１話丸ごとでも OK。

９. セリフがないところで改行、してもいいし終わるまで放置でもいい

パソコンから音は出ないので放置がいいかも。

ちなみに、こちらを使うとモニターしながら文字起こしできます。

JVC オーディオ分配プラグ (ステレオミニ⇔ステレオミニ×2) AP-120A

posted with カエレバ

10. 文字起こしが終わったらマイクのアイコンを押して終了

2-3. 手順おさらい（パソコン）

ケーブルをつないでデバイスの選択と入力レベルを調節

１. パソコンのヘッドホン出力端子とマイク入力端子をケーブルでつなぐ
　　（パソコン本体にマイク入力端子がない場合は USB サウンドカードを使う）

２. パソコンの音声出力をヘッドホン、音声入力をラインインに設定する
　　（ USB サウンドカード使う場合はそのデバイスに設定）

３. 動画プレイヤーで DVD を再生して音声出力レベルとマイク入力レベルを調節
　　→ 入力レベルがセリフのところで真ん中くらいになるようにする

ここから Google ドキュメント

４. Google ドキュメントを Google Chrome で開く
　　（ Safari では音声入力がグレーアウトして使えませんでした）

５. 新しいドキュメントを作成 → 空白 → ツール
　　→ 音声入力 → マイクのアイコン出現

６. アイコン上部のプルダウンから English ( United States ) を選択

７. マイクのアイコンをクリック

いよいよ文字起こし

８. 動画プレイヤーで DVD を再生 → 文字起こしが始まる
　　（文字起こししたい部分だけでも１話丸ごとでも OK ）

９. セリフがないところで改行、してもいいし終わるまで放置でもいい
　　（しておくとあとで整理しやすい）
　　（パソコンから音は出ないので放置がいいかも）

10. 文字起こしが終わったらマイクのアイコンを押して終了

３. スマホで英アニスク起こし

この章ではスマホで Google ドキュメントを使って文字起こしをする方法を紹介します。

この項の目次

用意するもの
手順
スマホでライン入力する方法

3-1. 用意するもの

Memo

用意するもの（スマホの場合）

テレビなど
→ スマホ１台のみでやる方法もあります。
リージョンフリーの DVD/Blu-ray プレイヤー
オーディオ変換ケーブル (3極メス×2-4極オス) 3.5mm
（ライン入力する場合）

テレビなど

スマホで文字起こしをする場合は、テレビなどで DVD/Blu-ray を再生して、スピーカーの音をスマホに聞かせる方法を思いつくかもしれません。

しかし、この方法でも文字起こしはできるのですが、パソコンの場合と同様にライン入力で文字起こしをする方が高精度なのでおすすめです。

リージョンフリーの DVD/Blu-ray プレイヤー

少々ややこしいですが、海外版 DVD/Blu-ray は家庭用のプレイヤーでは再生できない場合があるので注意が必要です。

海外版 DVD はパソコンや一部のゲーム機で再生できます。家庭用のプレイヤーでは再生できないので、その場合はリージョンフリーのプレイヤーが必要です。

Blu-ray では北米版なら家庭用のプレイヤーでも国コードをアメリカに設定すると再生できます。リージョン B の Blu-ray の場合はリージョンフリーのプレイヤーが必要です。

プロテック BEX リージョンフリー DVDプレーヤー BSD-M1BK

¥3,240 （2021/07/14 03:29時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

ポチップ

SONY リージョンフリーBD/DVDプレーヤー BDP-S3700

¥29,980 （2021/07/14 03:26時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

ポチップ

3-2. 手順（ライン入力で文字起こしする方法は後述）

Memo

スマホで文字起こしをする手順

Google ドキュメントアプリを起動
右下の赤丸をタップ → 新しいドキュメント → 作成
（テンプレートを選ぶときは「空白」をタップ）
キーボードのマイクのアイコンをタップ
DVD を再生してスマホのマイクをテレビのスピーカーに近づける

これで文字起こしが開始されます。

なお、アプリの操作は OS やバージョンによって多少異なるかもしれません。

音の良い外部スピーカーを利用すると精度が高まるかもしれません。

TIMEDOMAIN light

＼楽天ポイント4倍セール！／

サンワサプライ変換アダプタケーブル (ヘッドホン＋マイク用・3極-4極)

ポチップ

英語として認識されない場合は言語設定を英語にしてみてください。

言語設定：iOS の場合

Google 検索結果より引用。

›› https://support.apple.com/ja-jp/HT204031

言語設定：Android の場合

設定 → 言語と入力 → 言語

英語が候補にない場合は「＋言語を追加」から English を追加

English の右にある４本線をタップしたまま一番上へ移動させる

なお、Android のバージョンによって設定方法は異なるかもしれません。

3-3. スマホでライン入力する方法

パソコンでの文字起こしの精度を高めるコツとしてライン入力を紹介しましたが、スマホでもライン入力すれば精度が上がる可能性があります。

下記の２つのケーブルを繋ぐとスマホやタブレットでもライン入力ができるようになります。

３極-４極変換アダプタケーブル

私はこちらを使用していますがしっかりしていて必要十分です。音質も。

¥573 （2021/08/18 02:22時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

ポチップ

オス-オスのステレオミニプラグケーブル ( AUX ケーブル)

パソコンのところで紹介したものと同じです。

JVC ステレオミニプラグ-ステレオミニプラグ 0.5m CN-MM50-B

¥943 （2021/08/18 02:19時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

ポチップ

ケーブルの繋ぎ方ははこちらの記事を参考にしてください。

スマホでさらに精度を上げたい場合はこちらの方法も試してみてください。

▽ちなみに（古い機種でも使える）

iPhone 4s（おつかれ）の内蔵マイク入力で試したところ iMac ほどではありませんが高い精度で文字起こししてくれました。（ライン入力は試していません）

数十秒で停止してしまいますが古い機種でも使えました。

４. 文字起こしの精度を上げるコツ

この章ではライン入力以外の文字起こしの精度を上げるコツを紹介します。

Memo

ライン入力以外で文字起こしの精度を上げるコツ

再生速度を0.75倍に
入力と出力レベルを最大値 (100％) に
32 bit、96 kHz に設定
CPU とメモリに負荷をかけない

再生速度を0.75倍に

実際にアニメの英語音声で試したところ、再生速度を0.75倍くらいにすると通常速度よりも文字起こしの精度が上がりました。偶然かもしれませんが、試してみて精度が上がれば採用ください。

なお、さらに遅くすれば精度が上がるというわけではなさそうです。

倍速再生は VLC でもできます。やり方はこちらを参考にしてください。

動画配信サービスでは U-NEXT に倍速再生機能があります。

入力と出力レベルを最大値 (100％) に

音量（出力レベル）を最大にするとスピーカーやイヤホンだけでなく耳まで壊れそうな音量が出ますが、実は音声信号のレベルは最大値で100％です。

人間の耳には丁度いい音量であっても機械にとっては小さい音量である可能性があります。そのため入力と出力レベルを最大にすると文字起こしの精度が上がる可能性があります。

ここで気をつけなければならないのは、再生機によっては100％以上の音量が出せるものがあるので、出力レベルを100％が超えないように設定する必要がある点です。出力レベルが100％を超えると過大入力となるので音が歪み、文字起こしの精度が下がる可能性があります。

VLC プレイヤーでは200％まで出力（音量）レベルを調節できますが、100％に設定します。

最も注意しなければいけないのは、言わずもがなですが文字起こしが終わったら必ず音量を下げることです。うっかりそのままスピーカーやイヤホンで再生すると、どえらいことになります。

なお、100％と50％で比較して文字起こしの精度か変わらないのであれば50％にするとよいでしょう。

32 bit、96 kHz に設定

未確認ではありますが、パソコン音声の入出力を32 bit、96 kHz に設定すると精度が向上するかもしれません。

macOS では［アプリケーション → ユーティリティ → Audio MIDI Setup ］にて設定できます。

ただし、この設定はステレオミニプラグをヘッドホン出力端子から抜くとデフォルトに戻ります。

CPU とメモリに負荷をかけない

文字起こし中の CPU とメモリの使用率をアクティビティモニタで観察してみました。

Chrome の CPU 使用率は Google ドキュメント開いた状態で0.4％前後、文字起こし中は８％前後になりましたが再生中の VLC で20％前後なので負荷はあまりないと思われます。メモリは１分程度の使用では変化はありませんでした。

パソコンのスペックは文字起こしの精度にあまり関係なさそうですが、他のアプリケーションはなるべく閉じておいた方が無難だと思います。

なお、文字起こしをライン入力ではなく内蔵マイクや外部マイクを使用する場合はその性能に依存すると考えられます。

文字起こしの精度を上げるコツまとめ

Memo

文字起こしの精度を上げるコツ

ライン入力で文字起こしする
再生速度を0.75倍くらいにする
音量を最大値 (100％) にする → 文字起こし後は必ず音量を下げる
他のアプリケーションをなるべく閉じておく

５. 音声にノイズがある場合

音声にノイズや音楽があると文字起こしができない場合があります。他の文字起こしアプリを試す方法もありますがノイズが原因であれば難しいと考えられます。

ノイズの除去は無料の音楽作成ソフト Audacity にその機能があります。

›› Audacity（公式サイト）

使い方は「 Audacity ノイズ除去」と検索してください。難しくはないと思います。

音楽の場合はボーカルや楽器ごとに分離する spleeter というオープンソースがあります。こちらも使い方は検索してください。

有料ソフトでは Steinberg SpectraLayers Pro 7 があります。ある動画でリポーターの中継に重なったサイレンを消す作業を確認しましたが、音が色分けして可視化されるので使いやすそうです。

記事更新時（2022年3月下旬）、ソースネクストでは SOUND FORGE Pro 15 Suite に同梱されて販売されていますが、キャンペーン時はなぜか公式サイトで買うよりも大幅に安いです。

公式サイトでは Steinberg SpectraLayers Pro 7 の体験版をダウンロードできます。

›› https://new.steinberg.net/ja/spectralayers/

音声分離ソフトは複数人が同時に喋っている場合にそれぞれの音声を分離することもできるので、文字起こしがしやすくなります。なお、分離できるとはいえ、男性同士など声の質が似ている場合は難しいかもしれません。

ソースネクストではときどき大幅値引きされていますが、私はそれでも文字起こしのためには高いかなと思ってしまいます。

文字起こしをする機会が多い人や「プロに依頼するのは…」という場合は検討してみてください。

６. 感想（人の頭の中っぽい）

パソコンでの文字起こしは Google ドキュメントが最適かも (無料では)

Google ドキュメントの音声入力を使うと高精度で文字起こしできるのにまずは驚きと、なんだか嬉しくなりました。自分が開発したわけでもないのに、なんでしょうね、感動ですね。

無料で使える文字起こしツールは Google ドキュメントの音声入力以外にも色々とあるようで、macOS と Windows にも標準で使える音声入力があります。

macOS（ High Sierra ）標準の音声入力はライン入力で試しましたが、数十秒で停止してしまうことと精度で Google ドキュメントの方が優れていると感じました。

音声文字変換＆音検知通知がベスト

無料のスマホアプリでは、Android 限定ですが「音声文字変換＆音検知通知」があります。Google ドキュメントよりも高精度ですが、一長一短な部分もあります。

両者の比較と使用感はこちらを参考にしてみてください。

▽有料ソフトもありますが

有料ソフトの「ドラゴンスピーチ11」ではオフラインで使えるのはもちろん辞書機能や音声ファイルを短時間で文字起こしできる（メーカーサイトの例では録音時間の６分の１）など音声入力に特化したより便利な機能が搭載されています。

「 Google ドキュメントより精度が低かったら…」と心配になりますが、どちらも使ったことがある方の比較記事ではまだまだ有料ソフトの方が優れているようです（日本語入力での比較でした）。

ドラゴンスピーチ 11 日本語版

posted with カエレバ

ニュアンスコミュニケーションズ 2012-09-28