身体障害、認知障害、感覚障害、学習障害のある人は、コンピュータの操作に支障がある場合がありま
す。
従来、コンピュータの操作には標準的なマウス (ポイントとクリックをする) とQWERTYキーボード (左上部分のキー配列からこう呼ぶ) が利用されてきま
した。 これらを利用してコンピュータに情報が入力され処理されます。
身体障害もしくは感覚障害、発達障害を持つ人は、これらの標準的な入力機器を効率よく利用することができない場合があり、その場合音声認識装置の利用が効
果的なことがあります。 標準的なキーボードが、両手の10本の指を使ってタイプすることを前提としています;
音声入力装置は、手や指がまったく動かせない人をはじめとして、さまざまな障害を持った利用者に対応可能です。
背景
音声認識技術には、いくつかのコンポーネントがあります:
入力音声の雑音除去、音声認識エンジン、辞書、アプリケーションインターフェイス、初歩的な自然言語処理など、いくつかの技術の組み合わせから成ります。
また、声紋認証装置 (ボイスIDとも言う) にも応用されています。 このページでは、音声認識システムの様々な形について取り扱います。
音声認識技術には2種類あり: 話者依存型 (利用者が自分の声を登録する必要がある) と話者非依存型の2種類がそれです。
音声認識には2つのカテゴリがあり: キーボード代替タイプとキーパッド代替タイプがそれです。
キーボード代替タイプは、音声で直接コンピュータを操作できるものです。
キーパッド代替タイプは、音声を電話のダイヤルボタン (キーパッド) の代わりとして利用するもので、ボイスメールや電話機のダイヤルの代わりとして利用し
ます。 電話機をコンピュータのリモート端末として利用することもできます。
1997年以前は、音声認識エンジンに搭載された辞書データベースは単独の単語にしか対応しておらず、利用者は1つ1つの単語を区切って入力する必要があ
りました.1997年に、連続音声に対応した辞書データベースを搭載した音声認識エンジンが発表され、より「自然な」入力が可能になりました
これにより、音声入力を利用した職務の遂行の効率が向上しました。
この文書は音声認識装置についての情報を完全に網羅したものではありません。次にあげる機器について
の詳細な情報は、JANまでお問い合わせください;人間工学的な、小型の、あるいは機能を拡張した装置や、片手用キーボード; タッチパッド;
トラックボール; ジョイスティック; コンピュータ用スイッチ; 手書き入力; スキャナ; マウスを変更; コミュニケーション拡張機器;
代替の入力装置やソフトウェア。
| Windowsプラットホーム
| マッキントッシュプラットホーム|
電話との統合
| プログラミング | その他OS | 特殊環境|
Windows用音声認識ソフトウェア
Dragon NaturallySpeakingの音声認識ソフトウェアは、文書、レポー
ト、スプレッドシート、電子メールの全てが音声によって作成、編集可能となります。 Microsoft Word、Microsoft
Excel、Microsoft Outlook、およびCorel WordPerfectに統合することで、Dragon
NaturallySpeakingはほとんどすべてのWindowsベースのアプリケーションで利用可能です。
家庭用およびオフィス用のソフトウェアだけでなく、法学用、医療用、公安用のパッケージが利用可能です。 Dragon
NaturallySpeakingは小売店、企業向けストアで購入可能です。
取り扱い業者のリストに関してはリンク先をご覧下さい:
../cgi-win/Alt62
IBMのViaVoiceは、頻繁に使うフレーズ、パラグラフ、アドレス、文書などの入力コ
マンドが設定可能な、巨大な辞書データベースを持つ、連続音声対応の口述筆記ソフトウェアです。
また、ViaVoiceは、医学と法律の専門辞書と3バージョンの基本辞書: プロUSB版、拡張版、標準版、パーソナル版を選択できます。
IBM (International Business Machines)
IBM Special Needs
11400 Burnet Road
Bldg。 904/6
Austin、TX 78758
800-426-4832/800-426-4833 (TDD)
http://www-3.ibm.com/software/speech
マッキントッシュ用音声認識ソフトウェア
アップルの音声認識機能によって、Macintoshはあなたの話し言葉を理解します。音声による対
話を通じてコンピュータを操作するという、まったく新しい世界が実現します。
Apple Computer
1 Infinite Loop
Cupertino、CA 95014
1-800-MY-APPLE/408-996-1010
http://www.apple.com/macos/speech
IBMのViaVoiceは、頻繁に使うフレーズ、パラグラフ、アドレス、文書などの入力コマンドが設定可
能な、巨大な辞書データベースを持つ、連続音声対応の口述筆記ソフトウェアです。
また、ViaVoiceは、医学と法律の専門辞書と3バージョンの基本辞書: プロUSB版、拡張版、標準版、パーソナル版を選択できます。
IBM (International Business Machines)
11400 Burnet Road
Bldg。 904/6
Austin、TX 78758
800-426-4832/800-426-4833 (テレタイプライター)
http://www-3.ibm.com/software/speech
MacSpeechのiListenはどんなアプリケーションでも口述、編集、形式、および簡単な音声ナビ
ゲーションをしてくれます。 iListenTMはキーボードとマウスからあなたを解放してくれます。
あなたは、まさにあなたの声の力で、文章を口述し、編集し、記入することができるのです。
MacSpeech, Inc.
431 Britton Road East
Barre、MA
978-355-4872
http://www.macspeech.com
PCにDragon Systems
NaturallySpeakingをインストールすると、TAPデバイスとしてMacに接続することが可能になります。これを利用すれば、Sun、
SGI、Mac、PCなどのコンピュータをSynapse TAP Speech Accessing
Workstationに接続することができます。 (http://www.synapseadaptive.com/synapse/tap1host.htm) 。
Synapse AdaptiveはTAPスイッチをオンデマンドで設定します。 (http://www.synapseadaptive.com/synapse/tapdesc.htm) 。
Synapse Adaptive
3095 Kerner Blvd。 Suite S
San Rafael、CA 94901
415-455-9700
http://www.synapseadaptive.com
音声認識 (電話との統合)
VXI
Corporationのコンピュータ/電話機兼用ヘッドセットは、電話機とコンピュータの同時利用を可能にします。
VXI Corporation
One Front Street PO Box 490
Rollinsford、NH 03869
800-742-8588/603-742-2888
http://www.vxicorp.com
Andrea ElectronicsのPersonal Computer and
Telephone
Interface (PCTIとPCTI-II) は、ヘッドセットからの電話とコンピュータの同時利用を実現することで、コンピュータによる音声認識と既
存の電話アプリケーションを統合します。
Andrea Electronics
45 Melville Park Road
Melville、NY 11747
800-442-7787
http://www.andreaelectronics.com
音声認識 (プログラミング)
Codevox for Visual Basicには、Visual
Basic開発環境向けの世界最高水準の音声認識プログラムであるL&H Dragon
NaturallySpeakingが付属しています。 Visual
Basicが、コードウィンドゥに直接口述筆記が可能で、Dragonが特許を取得しているSelect-and-Sayテクノロジーを利用したコードの
修正と編集ができる、最高峰の会話可能アプリケーションになります。
NaturallySpeakingにビルトインされたコマンドと制御機能を利用して、Visual Basicの操作ができます。
メニューアイテムやダイアログボックスに声でアクセスすることができます。
Codevox
PO Box 85778
Seattle、WA 98145
http://www.codevox.com
音声認識 (Windowsパソコンとその
他のOS)
Synapse TAP Workstations (http://www.synapseadaptive.com/synapse/tapdesc.htm)
は、Sun、シリコングラフィックス (SGI) 、HP
UNIX、PCオペレーティングシステム、マッキントッシュ、またはメインフレーム環境での音声認識を可能とします。 Synapse TAP
Deviceを利用した統合クロスプラットフォームソリューションを提供します。
音声認識機能を利用しているコンピュータからのキーストロークやマウスイベントを、ホストコンピュータへの送信前に、利用者が理解しやすいようエンコード
して表示します。 Sun、SGI、Mac、PCのホストをSynapse TAP Speech Accessing
Workstationに接続する場合、それぞれのホストコンピュータに対するTAPデバイスのインストールと、
Synapse TAP Switchの増設 (http://www.synapseadaptive.com/synapse/tap1host.htm)
が必要です。
Synapse
3095 Kerner Blvd。 Suite S
San Rafael、CA 94901
415-455-9700
http://www.synapseadaptive.com
Narratekが販売するDVI's
VoicePowerは、WindowsNT上でのデジタル口述筆記と音声情報システムの最高峰で、医療現場でのWindowsOSではトップシェアを誇
ります。
Narratek
46 Hyslop Road
Brookline、MA 02445
617-566-1066
http://www.narratek.com
Voice Automatedは、医師によるインターフェイスダイレクトな医療記録作成を実現します。
カルテのメモ、医療文書、その他のビジネス文書が作成できます。
Voice Automated
215 1/2 Main Street
Huntington Beach、CA 92648
800-597-6600/714-969-7632
http://www.voiceautomated.com
Voice Powered Clinical
Documentation (VoxDox) は、データベースと連結した音声入力による医療支援システムを構築し、患者記録、経過記録、推薦状、処方箋、
学術論文などの、ハンドフリーでの口述筆記を実現します。
Voice Documentation Systems、LLC
930 Tahoe Blvd
Bldg。 802,Suite 520 89451-9436
Incline Village、NV
800-404-VOICE
http://www.voxdox.com
特定用途の音声認識
Integrated Wave Technologies、Inc.は、Totally Voice
Controlled Cell Phone Systemを販売しています。 手持ち式の携帯電話からcellphoneへの切り替えを行います。
Integrated Wave Technologies、Inc。
800-565-8642
4042 Clipper Court
Fremont、CA 94538-6540
http://www.i-w-t.com
Philipsは、口述装置、家電および自動車の装置のための最先端の音声認識ソフトウェアを設計、開発し
ています。
Philips Speech Processing
64 Perimeter Centre East、Sixth Floor
PO Box 467300
Atlanta、GA 30346
423-475-1053
http://www.speech.be.philips.com