Azureの文字起こし (Speech To Text)関連サービスを検討した やっぱりその辺簡潔にいくならAzure AI 音声(a k a Azure Speech Service)のリアルタイムの文字起こし(a k a ファストトランスクリプション)が楽で早くて良いという感想です。 1文あたりの長さとか、行数とか、すごくよかったです。
リアルタイムのダイアライゼーションのクイックスタート - 音声サービス - Azure AI services 環境をセットアップする Speech SDK は NuGet パッケージとして提供されていて、 NET Standard 2 0 が実装されています。 Azure Cognitive Service for Speech SDK は、このガイドで後でインストールしますが、まず、これ以上要件がないか SDK のインストール ガイドを確認してください。
Azure AI 音声(Azure Speech to Text)とは? - AI Market Azure AI 音声(Azure Speech to Text)とは? Azure AI 音声(Azure Speech to Text)は、Microsoftが提供するクラウドベースの音声認識サービスです。このサービスは、Microsoft Azureの一部として、音声データをリアルタイムまたはバッチ処理によりテキストに変換する機能を提供し
音声を認識する方法 - Speech Service - Azure AI services デバイスのマイクを使用して音声を認識するには、SpeechRecognizer を渡さずに AudioConfig インスタンスを作成し、speech_config を渡します。 import azure cognitiveservices speech as speechsdk def from_mic(): speech_config = speechsdk SpeechConfig(subscription="YourSpeechKey", region="YourSpeechRegion