Amazon Transcribe: głos na tekst na żywo

Firma Amazon ruszyła ze świadczeniem usługi o nazwie Transcribe.

Sylwester Cyba, Opublikowany 20/11/2018

W ostatnim czasie pojawia się bardzo dużo projektów związanych z obróbką dźwięku i obrazu. Od tych mrożących krew w żyłach po całkiem pożyteczne.

Tytułowa usługa potrafi automatycznie rozpoznawać mowę i w czasie rzeczywistym przekładać to na tekst. Robi to szybko i sprawnie co jest nowością w tej branży. Konkurencja potrafiła robić podobne rzeczy, ale nie była w tym aż tak szybka - mowa o usługach Google Cloud Speech-to-Text, Twilio Speech Recognition API i IBM Watson Speech to Text.

Przewaga możliwa jest za sprawą HTTP/2 i streamingu w obu kierunkach. W jednym kierunku streaming audio (np. WAV, MP3, MP4 lub FLAC) a w drugim rozpoznany tekst (m.in. angielski, hiszpański i francuski wraz z miejscowymi odmianami).

Na chwilę obecną usługa jest dostępna na serwerach firmy Amazon w USA. W 2020 roku ma się pojawić we Włoszech po wybudowaniu tam nowego centrum danych.

Źródło: VentureBeat