概要

音声認識AI

ビックデータや機械学習の発展、リモートワーク等の生活様式の変化により音声データに注目されてきています。
音声認識により、以下のようなユースケースが可能になります。

音声認識の具体的な種類
音声認識には具体的に以下のような種類があります


文字起こし
発話した内容を文字に起こすことです。

話者認識/話者識別
声の特徴から人物を特定することです。

異常音検知
異常な音が発生しているかどうか検知することです。

音声認識の応用例
音声認識により、以下のようなユースケースが可能になります。
  • 自動議事録作成
  • 音声によるカスタマーサポートの顧客満足度調査
  • 声色の変化による病気の一次診断
  • 会社等の電話窓口の自動対応

アーキテクチャ

Azure Cognitive Serviceについて
このアーキテクチャで使用している「Speech-to-Text」と「Text Analytics」はいずれもMicrosoftのAzure Cognitive Serviceになります。Azure Cognitive Serviceは以下の特徴をもっています。

  • Azure Cognitive Serviceは様々なAIサービスを提供するAzureのサービスです。音声認識や自然言語処理だけでなく、画像や異常検知も実行することができます。

  • 事前学習済みモデルをすでに内蔵しているため、ユーザはAPIを呼び出すだけで簡単に実行することが可能です。

  • API形式であるため様々なサービスに容易に組み込むことが可能です。

デモ

音声認識AIを試す

この音声認識AIでは音声ファイルをアップロードやサンプルボイスを使用することによって、
音声の解析および感情推定(ネガティブ・ポジティブ推定)が可能です。
ぜひお試しください。
(アップロードファイルはwavファイルのみ使用可能です。)
※アップロードするファイルは処理完了後削除されます。

注意:アップロードファイルのサイズは最大10MBです。

サンプル1   サンプル2
または
  選択されていません