株式会社シナジーでは、英国Cantab Research社の自動音声認識サービス 「Speechmatics」の日本国内取扱いをおこなっています。
「Speechmatics」は、回帰型ニューラルネットワークおよび統計分析による言語モデリングをベースとした認識精度の高い自動音声認識サービスで、日本語を含む30以上の言語に対応しています。ライブ音声を即座に認識しテキスト化する「Realtime ASR」、そして録音された音声ファイルを自動認識しテキスト化することに特化した「Batch ASR」を用意し、利用形態に合わせたサービスを提供しています。
● 最高峰の文字認識精度
ほとんどの顧客による他社競合サービスとの比較検討において、最高精度のエンジンであるとの評価を獲得しています。1980年代までに遡るSpeechmatics独自の回帰型ニューラルネットワークおよび統計分析による言語モデリングをベースとした音声認識は、AI技術が隆盛する2020年代の今日においても先駆的な認識精度を誇っています。
● 約50言語に対応
統計分析モデルによる学習により、各言語にわたって高い精度の認識率を維持したまま多数の言語への対応を実現しています。また、地域差などの対応においても、英語の例では、米国英語、英国英語、その他の英語などの細別化を廃し、単一のランゲージパックとして提供しています。
● 幅広い内容に対応
非常に広範囲にわたる学習データと統計の構築により、さまざまな専門分野など幅広い分野の音声データの認識にも対応します。
● 柔軟な運用形態
SaaSのほか、オンプレミスでの動作も可能。オンプレミス運用では、仮想ホストでの運用や、よりスケーラブルなDockerコンテナでの運用も可能です。