Amazon Transcribe: głos na tekst na żywo
W ostatnim czasie pojawia się bardzo dużo projektów związanych z obróbką dźwięku i obrazu. Od tych mrożących krew w żyłach po całkiem pożyteczne.
Tytułowa usługa potrafi automatycznie rozpoznawać mowę i w czasie rzeczywistym przekładać to na tekst. Robi to szybko i sprawnie co jest nowością w tej branży. Konkurencja potrafiła robić podobne rzeczy, ale nie była w tym aż tak szybka - mowa o usługach Google Cloud Speech-to-Text, Twilio Speech Recognition API i IBM Watson Speech to Text.
Przewaga możliwa jest za sprawą HTTP/2 i streamingu w obu kierunkach. W jednym kierunku streaming audio (np. WAV, MP3, MP4 lub FLAC) a w drugim rozpoznany tekst (m.in. angielski, hiszpański i francuski wraz z miejscowymi odmianami).
Na chwilę obecną usługa jest dostępna na serwerach firmy Amazon w USA. W 2020 roku ma się pojawić we Włoszech po wybudowaniu tam nowego centrum danych.
Źródło: VentureBeat