ビックデータや機械学習の発展、リモートワーク等の生活様式の変化により音声データに注目されてきています。
音声認識により、以下のようなユースケースが可能になります。
音声認識の具体的な種類
音声認識には具体的に以下のような種類があります
文字起こし
発話した内容を文字に起こすことです。
話者認識/話者識別
声の特徴から人物を特定することです。
異常音検知
異常な音が発生しているかどうか検知することです。
音声認識の応用例
音声認識により、以下のようなユースケースが可能になります。
- 自動議事録作成
- 音声によるカスタマーサポートの顧客満足度調査
- 声色の変化による病気の一次診断
- 会社等の電話窓口の自動対応
アーキテクチャ
Azure Cognitive Serviceについて
このアーキテクチャで使用している「Speech-to-Text」と「Text Analytics」はいずれもMicrosoftのAzure Cognitive Serviceになります。Azure Cognitive
Serviceは以下の特徴をもっています。
- Azure Cognitive Serviceは様々なAIサービスを提供するAzureのサービスです。音声認識や自然言語処理だけでなく、画像や異常検知も実行することができます。
- 事前学習済みモデルをすでに内蔵しているため、ユーザはAPIを呼び出すだけで簡単に実行することが可能です。
- API形式であるため様々なサービスに容易に組み込むことが可能です。
この音声認識AIでは音声ファイルをアップロードやサンプルボイスを使用することによって、
音声の解析および感情推定(ネガティブ・ポジティブ推定)が可能です。
ぜひお試しください。
(アップロードファイルはwavファイルのみ使用可能です。)
※アップロードするファイルは処理完了後削除されます。
注意:アップロードファイルのサイズは最大10MBです。
 
または