Whisper-Medusa to nowy model rozpoznawania mowy aiOla o otwartym kodzie źródłowym, który twierdzi, że jest o 50% szybszy niż Whisper OpenAI
aiOla to izraelska firma założona w 2019 roku, która specjalizuje się w rozwiązaniach opartych na sztucznej inteligencji do digitalizacji papierowych przepływów pracy. Firma niedawno wprowadziła Whisper-Medusa, model sztucznej inteligencji typu open source, który jest połączeniem OpenAI's Whisper i technologii aiOla. Twierdzi on, że działa o ponad 50% szybciej przy zachowaniu wysokiej dokładności. Szybkość tę osiąga się dzięki unikalnej metodzie przewidywania tokenów, przewidując dziesięć tokenów na raz zamiast jednego, jak widać w OpenAIwhisper.
Whisper-Medusa został opracowany przy użyciu słabego nadzoru. Proces ten obejmuje wykorzystanie Whispera do transkrypcji zbiorów danych audio, które następnie służą jako etykiety do trenowania modułów przewidywania tokenów Medusa.
Whisper-Medusa może okazać się wielkim atutem dla firm, które nadal polegają na papierowych przepływach pracy w codziennej pracy. Technologia aiOla, poprzez swój system zaplecza "aiOla Jargonic", może pomóc pracownikom pierwszej linii w różnych branżach. Na przykład w przemyśle spożywczym aiOla usprawniła kontrolę jakości, przekształcając ręczne listy kontrolne w cyfrowe przepływy pracy. Firma twierdzi, że cały proces jest "tak prosty, jak przesłanie zdjęcia lub pliku z istniejącymi procesami".
Obsługując ponad 100 języków i różne akcenty, Whisper-Medusa może być również przydatna w branżach takich jak lotnictwo, produkcja żywności, logistyka i opieka zdrowotna. Przekształcając nieustrukturyzowane dane mowy w przydatne informacje, firmy mogą obniżyć koszty i poprawić alokację zasobów.
Zainteresowani mogą znaleźć pliki open-source na Hugging Face i GitHub.
Źródło(a)
aiOla przez PR Newswire