音声認識アプリを使用して講義音声を文字化する

個々のニーズによっては、音声を聞くよりも文字を読む方が情報を得やすいという場合があります。読む方が良いという場合であれば、講義等の音声を聞くことに加えて、音声を文字化して視覚的に情報を取得することで、より講義の理解が深まるかもしれません。また、音声を文字にしたテキストデータを保存しておくことで、復習に活用することができます。今回は音声認識を利用して講義の音声を文字化する方法をご紹介します。

Index

端末等の準備

音声を聞きながら、端末の画面に表示される認識された文字を読んでいくことになります。スマートフォンでも表示可能ですが、閲覧時の見やすさを考慮するとiPad等の比較的画面の大きいタブレット端末が良いでしょう。ノートPCを所有している場合は、PCを使用することも可能です。ただし、PCによっては使用出来ないアプリがあるため注意が必要です。一方で、Appleシリコン搭載のMacではiPad版のアプリが動作するため、iPad版の音声認識アプリが利用できます。
また、外部マイクを活用することで、音声をクリアに集音することができ、認識率が向上することがあります。端末内蔵のマイクだけでは期待した認識結果が得られない場合は導入を検討しても良いでしょう(https://www.assdr.kyoto-u.ac.jp/heap/at-column/ipad_onseininsiki/)。補聴援助システムも外部マイクとして端末に音声を入力することができます。なお、Bluetooth接続のマイクは通信距離が短いため、教卓等(マイク)から座席(端末)までの距離が離れると接続が切れる可能性が高くなります。無線のマイクを使用する場合は、2.4GHzワイヤレス接続マイクの使用をおすすめします。

iPadの画像iPad等のタブレット端末

MacBookProの画像
iPadアプリが利用できるMacPC

補聴援助システムを接続したiPad外部マイクとして利用した補聴援助システム

音声認識アプリ

音声認識アプリは様々あり、それぞれ少しずつ機能や操作性が異なっています。加えて、集音環境や話者の話し方、使用する音声認識エンジンによって認識精度が変わってきますので、実際にそれぞれのアプリを試して使用するアプリを決めていくと良いでしょう。
音声認識アプリに加えてOSに標準搭載されている音声認識機能を使ってWord等のテキストエディタに文字起こししていく方法もあります(https://www.assdr.kyoto-u.ac.jp/heap/at-column/onsei_ninsiki/)。音声認識アプリが使用できない端末の場合は、OS標準の音声認識機能を使用することができます。
OS標準の音声認識機能も含めて音声認識アプリ(機能)は数多くありますが、自分が見やすい、あるいは使いやすいアプリを使用すると良いでしょう。以下に音声認識アプリの例をいくつかあげています。

UDトーク

iPhone等のiOS端末やAndroid端末で使用できます。音声認識エンジンを選択することや外部マイクを接続することが可能です。外部マイクを接続すると画面下部のボタンが緑に変化します。単語登録にも対応しています。

UDトークのスクリーンショット
UDトークのスクリーンショット
出典:UDトーク

YY文字起こし

iPhone等のiOS端末で使用できます。外部マイクを接続することができ、現在選択されているマイクを確認することもできます。単語登録にも対応しています。

YY文字起こしのスクリーンショット
YY文字起こしのスクリーンショット
出典:YY文字起こし

Notta

iPhone等のiOS端末やAndroid端末で使用できます。外部マイクを接続することも可能です。単語登録にも対応しています。

Nottaのスクリーンショット
Nottaのスクリーンショット
出典:Notta

ペン型デバイス

アプリの他にペン型のデバイスで音声認識することもできます。ペン型デバイスだけで音声認識が動作するため、タブレット端末に比べて持ち運びが容易になります。ただし、文字を表示するディスプレイが小さいため、講義中の閲覧は少し見づらいかもしれません。復習のためのテキストデータの作成などの使い方が向いているでしょう。

ペン型デバイスの画像
ペン型デバイスの画像

環境調整

音声認識アプリを使用する際は、周囲が騒がしくない環境を整えることや、二人以上が同時に話さないといった利用上の工夫も重要です。AT活用の効果を最大限引き出せるように支援機器以外の準備も必要です。

参考

iPadを使った音声認識とマイクを選ぶ際のポイント
https://www.assdr.kyoto-u.ac.jp/heap/at-column/ipad_onseininsiki/

音声認識を使ってテキストを入力する
https://www.assdr.kyoto-u.ac.jp/heap/at-column/onsei_ninsiki/


公開日:2023年10月18日

以下のGoogleフォームからあなたの感想や要望をお聞かせください。
https://forms.gle/4DkKF5ns13sxzRRk8