タイトル:テキストデータ化 ver1.2 (2021.6) コピーライト:HEAP <概要> 墨字や画像形式の文字をテキストデータに変換することを「テキストデータ化」といいます。 テキストデータから音声や点字等へ変換が可能であるため、視覚障害その他の理由で通常の活字の印刷物の読書が困難な学生(プリントディスアビリティ)に対して、アクセシビリティを確保する一つの有効な方法となります。本Tipsではテキストデータ化の流れやポイントを整理します。 <必要な機器> ・スキャナー →種類は大きく分けて3種類です。まずは既存のものを活用してみましょう。 フラット:高精度にスキャン フィーダー:裁断したものを効率的にスキャン スタンド:裁断できないものを効率的にスキャン ・OCRソフト (Optical Character Recognition/Reader) →無償ソフトから有償ソフトまで様々あります。多種多様な資料に対応することを考えると、認識範囲を調整できるものが効率的です。 ・パソコン →ハイエンドモデルは必要ではありませんが、OCRソフトを購入する場合は対応OSや必要スペックの情報が参考になります。 <手順> 1)確認:既存のデータの有無について、出版社・国立国会図書館・サピエ図書館、担当教員に確認 ・どのようなデータ形式であっても、データがあれば校正作業の効率化が図れます。 ・講義資料等は、ppt形式やword形式など直接テキストデータにアクセスできるものがあれば、校正作業が大幅に短縮できます。講義担当教員に相談しましょう。 2)打合せ:関係者(学生、担当教員)で必要箇所、図表の扱い方、校正ルールを打ち合わせ 例)○章〜○章だけで良い。 例)急ぎのため図表のテキスト化は不要、未校正のままでもよい。 例)飾り文字には「校正者注」を入れる。 3)取込み:紙や画像の取込み(スキャン) ・裁断をしたほうが作業がスムーズになりますが、書籍の取扱いに関しては学生に確認しましょう。 →書籍を裁断できない場合は、コピーを取る要領で1枚ずつスキャンします。 ・スキャン時の歪みはこの工程で処理しておくと次の工程がスムーズになります。 4)変換:OCRソフトでテキストデータに変換 ・画像として取込まれた内容を、OCRソフトを使って文字認識し、テキストデータに変換します。 ・必要に応じて、OCRソフトの設定(色彩・言語・範囲)を調整します。 5)校正:文字認識したデータを人の目で確認する ・テキストエディタソフトを使って原本を見ながら、文字の誤変換や改行位置などを修正します。 ・テキストデータ及び図表の校正ルールは「学術文献の原本とする視覚障害者等用資料・データの製作仕様」(国立国会図書館WEBサイト)が参考になります。 (Tips)校正作業をスムーズに行うための工夫 ・学生サポーターに依頼する場合は専攻分野を考慮できるとスムーズに進みます。 ・校正時はスペルチェック機能があるアプリ(Word)等で行うとよいでしょう。 <よくある問い合わせ> Q.一連の作業を“障害学生支援部署主体”で行うことに関して、どのような議論がありますか? A.著作権法第30条で認められる個人利用に対して、特定の障害学生へのいわゆる手足論の範疇で校正作業を行うことは法律上認められています。また、個人利用の範疇を超える、公共リソースを前提とした作成についても「(一部条件付きで)支援室が主体となることは問題ない」と解釈されています(参照「著作権法施行令第2条第1項第1号ロに規定する「大学等の図書館及びこれに類する施設」の解釈について(周知)」)。大学図書館との連携を検討できれば、安定したデータ提供や図書館のアクセシビリティ機能向上にも繋がるでしょう。 <関連法> ・「著作権法」第37条(視覚障害者等のための複製等) ・「著作権法施行令」第2条第1項第1号ロ(視覚障害者等のための複製等が認められる者) ・「著作権法の一部を改正する法律」平成30年法律第30号 <関連省庁> ・文化庁著作権課