Biznesowe słuchawki douszne Timekettle W4 Pro z AI w teście: Tricorder ze Star Treka czy wreszcie babel fish?
Smartfony stały się ostatnio dość wszechstronnymi i potężnymi komputerami codziennego użytku. Dzięki Google Translate, DeepL i tym podobnym, są one również całkiem skutecznymi urządzeniami tłumaczącymi.
Niemniej jednak nadal istnieją samodzielne urządzenia do tłumaczeń ustnych, w przypadku Timekettle W4 Pro płacą Państwo za niego 450 euro (~476 USD). Za tę cenę otrzymują już Państwo bardzo dobry smartfon ze średniej półki. Czy warto? W czym słuchawki douszne mogą być lepsze od smartfona? Czy dzięki sztucznej inteligencji mamy długo wyczekiwaną funkcjonalność tłumaczeniową trikordera ze Star Treka? Przekonają się Państwo w naszym teście.
Funkcje techniczne - 40 języków, 93 akcenty
Proszę od razu wyjaśnić jeden fakt: W4 Pro nie zastępuje smartfona do tłumaczeń ustnych, aplikacja Timekettle jest absolutnym warunkiem koniecznym do korzystania z niej, to właśnie tam po raz pierwszy dostępne są funkcje AI i nawet rozmowa 1 na 1 nie jest możliwa bez połączenia z aplikacją.
Możliwe jest również tłumaczenie offline, ale wtedy dostępnych jest "tylko" 13 języków. Dopiero w trybie online ujawniają się pełne możliwości tłumaczy. W4 Pro może tłumaczyć na 40 języków i podobno opanowuje 93 akcenty.
Producenci zwracają szczególną uwagę na niemal bezbłędną szybkość tłumaczenia. Czas reakcji ma wynosić zaledwie 0,2 sekundy.
Wkładki douszne są tutaj bardzo ważne. W przeciwieństwie na przykład do Timekettle X1, który miał wkładki douszne, W4 Pro ma otwartą konstrukcję, co ma całkowity sens. W końcu słuchawki douszne mogą wydawać się niehigieniczne, zwłaszcza w rozmowach 1 na 1, kiedy przekazujemy jedną z dwóch wkładek dousznych drugiej osobie. W przeciwieństwie do W4 Pro, otwarta konstrukcja oznacza, że nie trzeba się martwić, że woskowina poprzedniego użytkownika przyklei się do nich. Ułatwia to również słyszenie własnego głosu, co również ma swoje zalety. W każdej z dwóch wkładek dousznych wbudowane są trzy mikrofony, które mają zapewnić precyzyjne nagrywanie tego, co się mówi i odfiltrować nieistotne dźwięki.
Oprócz połączeń 1 na 1, wkładki douszne oferują również funkcje "Listen and Play" i Media Translation w połączeniu z aplikacją. Dzięki tej pierwszej, użytkownik może na przykład śledzić spotkanie w obcym języku za pomocą obu słuchawek. Jeśli użytkownik chce mówić, dotyka jednej z wkładek dousznych, a następnie jego mowa jest tłumaczona i przekazywana wszystkim za pośrednictwem głośników smartfona.
Tłumaczenie multimediów odnosi się do tłumaczeń aplikacji uruchamianych na smartfonie. W tym przypadku można na przykład przetłumaczyć film z YouTube uruchomiony na smartfonie.
W przeciwieństwie do Google, producent reklamuje się również jako "Privacy-First Translation Earbuds"; wszystkie rozmowy powinny pozostać prywatne i nie powinny być wykorzystywane. Niemniej jednak dane mogą być przekazywane, a warunki ochrony danych są dość obszerne i bardzo ogólne.
Obudowa i ergonomia - Nietypowe etui ładujące
Same wkładki douszne są w większości wykonane z tworzywa sztucznego. Utrzymują się na miejscu w uchu, ale chwieją się dość mocno, jeśli osoba je nosząca porusza głową nieco szybko. Mała, kolorowa dioda LED wskazuje, kiedy są ładowane lub włożone do etui ładującego. Nie ma ochrony przed zachlapaniem ani innych funkcji. W4 Pro są również dość duże, nawet jak na słuchawki nauszne. Dla porównania Marshall Motif II A.N.C. słuchawki douszne.
Etui ładujące jest jeszcze większe i nieco nietypowe. Zewnętrzna rama wykonana jest z aluminium, reszta to plastik. Można go podzielić na dwie części, dzięki czemu nie trzeba wyciągać gołych słuchawek do rozmówcy, ale zamiast tego można przekazać słuchawkę w etui ładującym. Jednak rozmiar pudełka może również prowadzić do opinii, że W4 Pro są nieporęczne i znacznie mniej mobilne niż inne wkładki douszne. Z tyłu obudowy znajduje się port ładowania USB-C. Dioda LED wskazuje stan ładowania. Etui wraz z wkładkami dousznymi waży 187 gramów (~ 6,6 uncji).
Zrównoważony rozwój
Zrównoważony rozwój nie odgrywa żadnej roli w marketingu drogich wkładek dousznych dla tłumaczy; producent nie podaje żadnych informacji na temat użytych materiałów.
Słuchawki są zapakowane w stylowe czarne kartonowe pudełko, a wewnątrz zastosowano sztywną piankę jako izolację.
Obsługa i funkcje - aplikacja AI obsługuje wszystkie tłumaczenia
Jak wspomniano, korzystanie z aplikacji Timekettle jest obowiązkowe i trzeba utworzyć konto przy pierwszym uruchomieniu. Niestety, nie znajdą Państwo aplikacji w sklepach, kod QR prowadzi do strony pobierania, której należy zaufać. Aby sparować słuchawki, należy również aktywować lokalizację przy każdym ponownym uruchomieniu aplikacji.
Same słuchawki mają tylko jedną funkcję operacyjną: dotykając słuchawek, można przełączać się między słuchaniem a mówieniem w trybie "Listen and Play", co jest praktyczne, ponieważ nie trzeba wtedy sięgać po smartfon, który może leżeć na stole konferencyjnym, aby przetłumaczyć swój głos wszystkim uczestnikom.
Oprócz trzech trybów tłumaczenia One-on-One, Listen & Play i Media Translation, tryb offline można również aktywować na ekranie głównym aplikacji, ale tłumaczenie multimediów jest wtedy wyszarzone. Status wkładek dousznych jest również wyświetlany u góry. Opinie można również przesyłać bezpośrednio za pośrednictwem ekranu głównego lub skontaktować się z obsługą klienta.
Na dole znajdują się również zakładki, pod "Odkryj" znajduje się kilka instrukcji dotyczących produktów Timekettle, w przypadku W4 Pro tylko jedna, a mianowicie jak sparować je ze smartfonem. Zakładka AI jest z pewnością ekscytująca. Można tu wpisywać wyrażenia, które zostaną przetłumaczone, a nawet wypowiedziane na głos. Można tu również znaleźć notatki z poprzednich rozmów i nagrania, które można również podsumować. Można również trenować własne umiejętności językowe, ponieważ istnieje model sztucznej inteligencji, z którym można rozmawiać w ćwiczonym języku, model następnie sugeruje poprawę i zadaje pytania, aby symulować rozmowę. W przeciwieństwie do 40 języków w tłumaczeniach, bot AI wydaje się być dostępny tylko w języku angielskim, hiszpańskim i chińskim.
Test praktyczny - Gdzie jest kontekst?
Dźwięk
Niestety, jakość dźwięku słuchawek jest rozczarowująca w stosunku do ceny. Wyraźnie widać, że producent nie zaprojektował słuchawek do uniwersalnego użytku, a raczej zostały one zaprojektowane specjalnie do celów tłumaczeń. Muzyka nie brzmi atrakcyjnie na W4 Pro. Basy są wyraźnie niedoreprezentowane, a tony wysokie i średnie nie wydają się szczególnie zróżnicowane. Ogólnym rezultatem jest puszysty, nieatrakcyjny dźwięk podczas odtwarzania muzyki.
Zauważalne jest również, że regulacja głośności (za pośrednictwem smartfona) wpływa na balans słuchawek, co w rzeczywistości nie powinno mieć miejsca. Jeśli więc zmienimy głośność, nie zostanie ona zmniejszona lub zwiększona w równym stopniu na lewym i prawym uchu, ale nagle lewa lub prawa wkładka douszna wydaje się głośniejsza / cichsza w porównaniu do drugiej.
Jest więc mało prawdopodobne, aby wkładki douszne były używane do czegokolwiek innego niż tłumaczenie. Ponadto można usłyszeć niski hałas w tle na słuchawkach bez dźwięku, bardziej jak rodzaj minimalnego grzechotania, który nie jest już wyczuwalny z dźwiękiem. Za tę cenę Timekettle mógł zapewnić słuchawkom znacznie lepszą jakość dźwięku.
Jeden na jednego
Podstawowa działalność W4 Pro. Jeśli chcesz prowadzić dwujęzyczną rozmowę z drugą osobą, po prostu podajesz jej jedną z dwóch słuchawek w podstawce ładującej, ustawiasz dwa języki w aplikacji i jesteś gotowy do pracy. Oczywiście nie możemy wypowiadać się na temat wielu języków, w teście skupiliśmy się na angielskim i niemieckim.
Jednak nawet tutaj jakość nie jest tak dobra, jak w przypadku ludzkiego tłumacza. Przerwy w mowie mówcy w środku zdania są szczególnym problemem dla systemu Timekettle. Tłumacz AI po prostu wstawia wtedy nieodpowiednie zakończenie zdania w środku. Jeśli mówca zacznie ponownie i dokończy zdanie, tłumacz AI rozpocznie nowe zdanie. Łatwo sobie wyobrazić, że może to czasami znacznie mylić znaczenie tego, co zostało powiedziane.
Zauważalne jest również, że system nie rozumie szerszego kontekstu rozmowy. Chociaż testuję z moim synem (on jest Niemcem, ja Anglikiem) i zwraca się do mnie jako "Papa", sztuczna inteligencja interpretuje również mój adres do niego jako "Du", a następnie ponownie jako "Sie" w trakcie rozmowy. Biorąc pod uwagę kontekst biznesowy, proszę przynajmniej konsekwentnie trzymać się "Sie".
Jakość innych tłumaczeń również jest raczej mierna, co w większości przypadków wynika z nierozpoznania kontekstu. Podobnie brzmiące słowa, takie jak "Meine" i "Deine", są często mylone, co oznacza, że to, co zostało powiedziane, nie ma już sensu; rozpoznawanie kontekstu mogłoby to poprawić. Innym przykładem są mniej znane słowa, które są po prostu tłumaczone niepoprawnie i losowo. Sztuczna inteligencja najwyraźniej nie była również w stanie wywnioskować z kontekstu, że wymiana słów dotyczyła modnego sportu, jakim jest slacklining. "Flecklein" jest tak samo mało popularnym sportem jak "Select Lining", chociaż sztuczna inteligencja poprawnie rozpoznała "Slackline" minutę wcześniej, ale to się nie utrzymało, więc niestety sztuczna inteligencja nie uczy się z przebiegu rozmowy. Rozpoznanie kontekstu przynajmniej nie zawsze prowadziłoby do tworzenia nowych słów.
Ponieważ głos tłumaczenia w uchu drugiej osoby jest zawsze bardzo opóźniony i nie chcą Państwo mówić ponad tłumaczeniem, należy trzymać się pewnych zasad rozmowy, aby zapewnić najlepsze możliwe tłumaczenie. Obejmują one mówienie płynnie, ale niezbyt szybko i wyraźnie, bez przerw na zastanowienie, ale po około 2 zdaniach, jasne struktury zdań i jak najmniej języka potocznego. Niektóre zasady zachowania są trudniejsze do przestrzegania niż inne, nawet w środowisku biznesowym.
Listen & Play
Prawdopodobnie najbardziej wszechstronny tryb. Tutaj słuchają Państwo różnych źródeł i otrzymują tłumaczenie na ucho, a transkrypcję na telefon komórkowy. Jest on reklamowany do użytku podczas spotkań, ale audycje radiowe lub telewizyjne mogą być również tłumaczone w ten sposób, a inne sytuacje są również możliwe. Jeśli chcą Państwo odwrócić role i mówić samodzielnie, wystarczy dotknąć prawej słuchawki lub aplikacji, a telefon komórkowy przetłumaczy to, co mówią inni uczestnicy spotkania.
Z drugiej strony, jest to być może również najbardziej podatny na błędy tryb, ponieważ system często musi działać w większym, szerszym kontekście, więc może być zmuszony do radzenia sobie z wieloma, naprzemiennymi głosami, większym hałasem w tle i mówcami, którzy są dalej. Dowiedzieliśmy się również od Timekettle, że część Listen w Listen & Play jest również jedynym trybem, w którym smartfon jest odpowiedzialny za nagrywanie dźwięku zamiast wkładek dousznych. Rozpoznawanie jest zatem wysoce zależne od modelu.
Na przykład odtworzyliśmy film z YouTube przez głośniki naszego laptopa. Podczas gdy głośność była dla nas normalna lub wysoka, W4 Pro najwyraźniej nie mógł odbierać wystarczająco dobrze. Dopiero gdy znacznie zwiększyliśmy głośność, słuchawki mogły zostać zmotywowane do tłumaczenia. Zdarza się również, że tłumaczenie rozpoczyna się, a następnie zatrzymuje w środku zdania, ponieważ rozpoznawanie najwyraźniej cierpi z powodu nagrywania na smartfonie (Pixel 7 Pro). Proszę pamiętać, że na moim biurku z dość głośnym filmem na YouTube (70% głośności laptopa przez wewnętrzne głośniki) bez hałasu w tle. Nawet przy 100% tłumaczenie często po prostu nie jest kontynuowane, co nie może być spowodowane głośnością. Ogólnie rzecz biorąc, tryb jest raczej zawodny, przynajmniej podczas przechwytywania odtwarzanych multimediów.
Przechwytywanie naturalnych głosów działa tutaj lepiej, przynajmniej bez hałasu w tle. Jednak jakość tłumaczenia czasami pozostawia wiele do życzenia. W szczególności, jeśli mówca zrobi małą pauzę podczas zdania, jest to szybko interpretowane jako koniec zdania i mówca zaczyna od nowa, co czasami zniekształca znaczenie tego, co zostało pierwotnie powiedziane. Speaking for yourself wydaje się działać naprawdę dobrze, to co sami mówiliśmy było tłumaczone bez żadnych problemów, a w razie przerw uczestnicy spotkania mogą słuchać tłumaczeń przez głośnik smartfona.
Tłumaczenie mediów
Tłumaczenie mediów polega w szczególności na tłumaczeniu z aplikacji działających na tym samym smartfonie co aplikacja Timekettle.
Jeśli więc aktywujemy ten tryb w aplikacji Timekettle i jednocześnie otworzymy YouTube (lub Zoom itp.), możemy na przykład przetłumaczyć głosy w filmie, a to, co zostało powiedziane, jest również transkrybowane i, jeśli jest to pożądane, wyświetlane w oryginalnym języku i tłumaczeniu lub tylko jako tłumaczenie lub wcale. Jak na razie jest dobrze. Tłumaczenia również działają całkiem dobrze i szybko, ponieważ aplikacja jest w stanie przechwycić ścieżkę dźwiękową bezpośrednio ze smartfona. Okno nakładki z transkrypcjami można zmniejszać lub powiększać, a także dowolnie przesuwać lub zamykać - bardzo dobrze.
Jednak i tutaj jest co najmniej jeden drobny problem.
- Ponieważ na smartfonie znajduje się tylko jeden przełącznik głośności dla wszystkich aplikacji, głośność oryginału, który niestety nie staje się cichszy, i głośność tłumaczenia nakładają się na siebie, co bardzo utrudnia skupienie się i słuchanie w szczególności kanału tłumaczenia. W tym przypadku oryginalne wideo na YouTube powinno automatycznie stać się cichsze.
- Timekettle twierdzi, że tłumaczenie jest w dużej mierze wolne od opóźnień. Dotyczy to jednak co najwyżej transkrypcji, ale nie dźwięku. Dźwięk tłumaczenia zaczyna się dopiero kilka linii transkrypcji później. Oznacza to, że dźwięk nie pokrywa się z transkrypcją, co utrudnia czytanie. Gorsze jest jednak to, że dźwięk tłumaczenia nie pasuje do oryginalnego wideo. Na przykład, gdy nasz dobry Alex mówi o konkretnym modelu laptopa w filmie (po angielsku), głos niemieckiego tłumacza dopiero zaczyna tłumaczyć jego intro. To znacznie utrudnia śledzenie wideo. Nie słyszymy gola w podsumowaniu meczu sportowego w tłumaczeniu audio aż do 7-10 sekund później.
- Jeśli zatrzymamy wideo, tłumaczenie (audio) również zatrzyma się około 2 sekundy później. Ma to oczywiście sens, ale w połączeniu z dużym opóźnieniem między oryginałem a tłumaczeniem audio może to oznaczać, że po zakończeniu wideo (tj. automatycznym zatrzymaniu wideo) nie otrzymamy już tłumaczenia audio niektórych sekcji końcowych. Jeśli zatrzymamy wideo/audio, a następnie wznowimy je, dźwięk rozpocznie się ponownie po zwykłym opóźnieniu, ale tylko od nowego początku; to, co nie zostało jeszcze przetłumaczone do końca z powodu opóźnienia i pauzy, nie jest już tłumaczone słuchowo, ale można je odczytać tylko w transkrypcji.
Ogólnie jednak tłumaczenie działa całkiem dobrze, wszystkie testowane aplikacje zostały rozpoznane, w tym słuchowiska radiowe z odtwarzaczem VLC lub biblioteką multimediów ARD. Jest to bardzo praktyczne, a jakość tłumaczenia jest imponująca. Timekettle musi jednak jeszcze popracować nad dużym opóźnieniem w tłumaczeniu głosowym.
Model cenowy z rybą
Nawet po zakupie wkładek dousznych z tłumaczem mogą zostać poniesione dodatkowe opłaty, co wynika z faktu, że producenci płacą za integrację AI, prawdopodobnie również z powodu opłat licencyjnych. Nie wiadomo dokładnie, na którym LLM Timekettle się tutaj opiera. Każdy użytkownik otrzymuje 300 darmowych minut tłumaczenia miesięcznie, po czym trzeba wykupić dodatkowe pakiety minut. A jak się za nie płaci? Oczywiście za pomocą "rybek".
Fish prawdopodobnie pochodzi od Babelfish, który można włożyć do ucha w powieści Douglasa Adamsa "The Hitchhiker's Guide to the Galaxy", a następnie zrozumieć wszystkie języki mówione. Każdy, kto nie jest zaznajomiony z tym tłem, może uznać nazwę waluty za nieco wątpliwą, szczególnie w sektorze biznesowym.
W każdym razie, 500 dodatkowych minut kosztuje 5 Fish, 1200 minut 10 Fish, a za 2000 minut płaci się 15 Fish. A skąd Państwo biorą "Ryby"? Fish Coins, czyli wirtualne monety, należy kupić, dokonując wpłaty za pośrednictwem płatności w aplikacji Google za pośrednictwem sklepu Google Play. Tutaj 5 Fish kosztuje obecnie 10,99 euro (~11 dolarów), czyli dokładnie tyle, ile zapłacimy za 500 dodatkowych minut.
Oprócz dodatkowych minut, niestety płacą Państwo również dodatkowo za pakiety offline. Pierwsze dwa są nadal bezpłatne za pośrednictwem kuponów, po czym każdy pakiet offline kosztuje 5 ryb, czyli również około 11 euro (~ 11 USD). Tak więc, jeśli chcą Państwo angielsko-hiszpański (niemiecki jest dostępny offline tylko w połączeniu z angielskim i chińskim), trzeba zapłacić 11 euro, za angielsko-francuski kolejne 11 euro i tak dalej. Można to zrobić w ten sposób, ale nie wzbudza to sympatii.
W końcu wirtualne monety nie powinny wygasać, ale nie można ich też później wypłacić.
Za
Przeciw
Werdykt - jeszcze nie ma małych rybek
Ile Babelfisha lub Tricordera jest w Timekettle W4 Pro? Fajnie jest móc komunikować się z drugą osobą w obcym języku, nawet nie znając języka, a kiedy rozpoznawanie działa dobrze, jak w trybie tłumaczenia multimediów, można poczuć się świetnie z wizją, która za tym stoi. Ale ogólny pakiet jeszcze nas nie przekonuje.
Tłumaczenia nie działają jeszcze wystarczająco niezawodnie, zbyt często rozpoznawanie nie działa optymalnie lub jest niedokładne. W trybie listy nadal można to przypisać smartfonowi, ale nieoptymalne rozpoznawanie i brak rozpoznawania kontekstu to ogólnie słabe punkty. Irytujące jest również opóźnienie dźwięku, słuchawki mają gorszą jakość dźwięku i nie nadają się do słuchania muzyki, ale pakiet jest nadal dość drogi. Co więcej, nawet po zakupie naliczane są dodatkowe opłaty za bardziej intensywne użytkowanie. Producent pobiera dodatkowe opłaty za pakiety offline.
Tłumacz Timekettle W4 Pro nie jest jeszcze w pełni zoptymalizowany w obecnym stanie, zwłaszcza rozpoznawanie, ale także szybkość, jakość tłumaczenia i jakość dźwięku wykazują duży potencjał, ale nie są (jeszcze) na reklamowanym poziomie. Ponadto pakiet jest obecnie zbyt drogi w stosunku do tego, co oferuje.
Cena i dostępność
Czajnik Timekettle W4 Pro jest dostępny zarówno na stronie producenta https://www.timekettle.co/products/w4-pro-ai-interpreter-earbuds-s jak i na Amazon w cenie 449 dolarów. Jak jednak wspomniano w teście, po zakupie nadal istnieją różne potencjalne dodatkowe koszty w postaci pakietów głosowych offline, dodatkowych minut użytkowania i innych.
Transparency
The selection of devices to be reviewed is made by our editorial team. The test sample was given to the author by the manufacturer free of charge for the purposes of review. There was no third-party influence on this review, nor did the manufacturer receive a copy of this review before publication. There was no obligation to publish this review. We never accept compensation or payment in return for our reviews. As an independent media company, Notebookcheck is not subjected to the authority of manufacturers, retailers or publishers.