Konwerter ebooków na audiobooki o otwartym kodzie źródłowym obsługuje ponad 1000 języków
Deweloper Drew Thomasson udostępnił niedawno wersję 2.0 popularnego projektu ebook2audiobook. Wersja 2.0 przynosi nowy graficzny interfejs użytkownika, łatwy dostęp do dopracowanych modeli i łatwy w użyciu instalator dla lokalnych instalacji Mac, Windows i Linux. Te funkcje to jednak tylko wierzchołek góry lodowej możliwości ebook2audiobooks.
Wykorzystując połączenie projektów AI typu open source, ebook2audiobook tworzy audiobooki z kompletnymi rozdziałami i metadanymi, a nawet jest w stanie klonować głos. W tym celu ebook2audiobook pobiera kompatybilne ebooki bez DRM i konwertuje je do użytecznego formatu za pomocą Calibre. Następnie książka jest dzielona na rozdziały, aby ułatwić organizację dźwięku w ebooku. Na koniec ebook jest konwertowany na format audio przy użyciu kombinacji Coqui XTTSv2 i Fairseq. Coqui zapewnia model zamiany tekstu na mowę, który generuje wysokiej jakości dźwięk i pozwala użytkownikom używać ich głosów do narracji. Dzięki modelowi Fairseq Facebooka użytkownicy mają do dyspozycji ponad 1107 języków.
Podczas gdy wersja 2.0 zawiera łatwiejszą metodę lokalnej instalacji na różnych systemach operacyjnych, projekt jest również hostowany na Hugging Face i Google Colabco czyni go znacznie bardziej dostępnym. Należy jednak pamiętać, że konwersja ebooka na format audio jest procesem długotrwałym. Dodatkowo, użytkownicy korzystający z Hugging Face do konwersji ebooka są ograniczeni darmową warstwą mocy obliczeniowej, co prowadzi do wolniejszych czasów renderowania i potencjalnych limitów czasu. Jednak dla użytkowników, którzy chcą uruchomić projekt lokalnie, wymagania techniczne są rozsądne, a projekt został zaprojektowany tak, aby działał na zaledwie 4 GB pamięci RAM. Aby uzyskać więcej informacji lub wypróbować projekt, prosimy odwiedzić poniższe zasoby.