Notebookcheck Logo

Whisper-Medusa to nowy model rozpoznawania mowy aiOla o otwartym kodzie źródłowym, który twierdzi, że jest o 50% szybszy niż Whisper OpenAI

aiOla to izraelska firma, która wykorzystuje rozwiązania oparte na sztucznej inteligencji do digitalizacji papierowych przepływów pracy. (Źródło zdjęcia: aiOla)
aiOla to izraelska firma, która wykorzystuje rozwiązania oparte na sztucznej inteligencji do digitalizacji papierowych przepływów pracy. (Źródło zdjęcia: aiOla)
aiOla uruchomiła Whisper-Medusa, model sztucznej inteligencji typu open-source zaprojektowany w celu poprawy automatycznego rozpoznawania mowy. Łącząc Whisper OpenAI z technologią aiOla, Whisper-Medusa twierdzi, że działa o 50% szybciej niż sam Whisper. Model ten obsługuje ponad 100 języków i przekształca nieustrukturyzowane dane mowy w przydatne informacje, obiecując przyszłość w branżach takich jak lotnictwo, logistyka i opieka zdrowotna.
AI Software

aiOla to izraelska firma założona w 2019 roku, która specjalizuje się w rozwiązaniach opartych na sztucznej inteligencji do digitalizacji papierowych przepływów pracy. Firma niedawno wprowadziła Whisper-Medusa, model sztucznej inteligencji typu open source, który jest połączeniem OpenAI's Whisper i technologii aiOla. Twierdzi on, że działa o ponad 50% szybciej przy zachowaniu wysokiej dokładności. Szybkość tę osiąga się dzięki unikalnej metodzie przewidywania tokenów, przewidując dziesięć tokenów na raz zamiast jednego, jak widać w OpenAIwhisper.

Whisper-Medusa został opracowany przy użyciu słabego nadzoru. Proces ten obejmuje wykorzystanie Whispera do transkrypcji zbiorów danych audio, które następnie służą jako etykiety do trenowania modułów przewidywania tokenów Medusa.

Whisper-Medusa może okazać się wielkim atutem dla firm, które nadal polegają na papierowych przepływach pracy w codziennej pracy. Technologia aiOla, poprzez swój system zaplecza "aiOla Jargonic", może pomóc pracownikom pierwszej linii w różnych branżach. Na przykład w przemyśle spożywczym aiOla usprawniła kontrolę jakości, przekształcając ręczne listy kontrolne w cyfrowe przepływy pracy. Firma twierdzi, że cały proces jest "tak prosty, jak przesłanie zdjęcia lub pliku z istniejącymi procesami".

Obsługując ponad 100 języków i różne akcenty, Whisper-Medusa może być również przydatna w branżach takich jak lotnictwo, produkcja żywności, logistyka i opieka zdrowotna. Przekształcając nieustrukturyzowane dane mowy w przydatne informacje, firmy mogą obniżyć koszty i poprawić alokację zasobów.

Zainteresowani mogą znaleźć pliki open-source na Hugging Face i GitHub.

whisper-Medusa firmy aiOla twierdzi, że jest o 50% szybszy niż Whisper OpenAI. (Źródło obrazu: aiOla)
whisper-Medusa firmy aiOla twierdzi, że jest o 50% szybszy niż Whisper OpenAI. (Źródło obrazu: aiOla)

Źródło(a)

Please share our article, every link counts!
Mail Logo
> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2024 08 > Whisper-Medusa to nowy model rozpoznawania mowy aiOla o otwartym kodzie źródłowym, który twierdzi, że jest o 50% szybszy niż Whisper OpenAI
Anubhav Sharma, 2024-08- 4 (Update: 2024-08- 4)