Bioinżynierowie z UCLA stworzyli samozasilający się plaster, który tłumaczy ruchy mięśni gardła podczas cichej mowy na mowę mówioną za pomocą uczenia maszynowego
Grupa bioinżynierów z UCLA stworzyła elastyczny, samozasilający się plaster, który tłumaczy ruchy mięśni krtani na powierzchni szyi podczas cichej mowy na mowę mówioną za pomocą uczenia maszynowego. Ten nadający się do noszenia plaster umożliwia osobom, które w przeciwnym razie są nieme lub nie mogą mówić prawidłowo z powodu urazu fałdu głosowego, choroby lub zaburzeń, mówienie za pomocą systemu plastra głosowego.
Ludzki głos powstaje podczas wydychania powietrza przez gardło i jest modulowany przez wiele obecnych mięśni krtani. Wszystkie mięśnie krtani muszą poruszać się w koordynacji, aby wytworzyć mowę, a ruchy na powierzchni szyi są odzwierciedleniem ruchów wewnątrz gardła.
W szczególności krtań jest najważniejsza, ponieważ zawiera mięśnie strun głosowych, które zmieniają kształt podczas tworzenia różnych dźwięków. Zapalenie krtani i nadużywanie strun głosowych (krzyk, śpiew lub krzyk) są częstymi przyczynami, dla których nie można mówić, ponieważ kluczowe mięśnie nie poruszają się prawidłowo, aby wygenerować dźwięk. Jednak nawet gdy struny głosowe nie działają prawidłowo, inne mięśnie krtani nadal poruszają się podczas próby mówienia.
Naukowcy stworzyli plaster samoprzylepny, który może wykrywać ruch mięśni gardła. Plaster składa się z zewnętrznych warstw polidimetylosiloksanu (PDMS) z dwiema warstwami miedzianych cewek służących jako warstwy indukcji magnetycznej (MI), które są oddzielone pojedynczą warstwą PDMS i magnesami służącymi jako warstwa sprzężenia magnetyczno-mechanicznego (MC). Warstwa MC ma wiele nacięć, aby umożliwić jej łatwiejsze rozszerzanie się i kurczenie, gdy mięśnie gardła się napinają.
Gdy osoba próbuje mówić, nosząc plaster o wadze 7,2 grama (0,25 uncji), mięśnie poruszają się, a plaster wygina się, generując niewielki sygnał elektryczny, który jest odbierany przez moduł czujnika. Sygnał jest przetwarzany, a następnie przekazywany do modułu uczenia maszynowego, który analizuje sygnał i interpretuje, co mówca próbuje powiedzieć z zestawu pięciu zdań używanych do szkolenia systemu. W ciągu 40 ms komputer wypowiada zamierzone zdanie z dokładnością 94,68 procent.
System musi zostać przeszkolony w zakresie znacznie szerszego zakresu słów i zdań, zanim technologia noszenia głosu będzie w stanie wokalizować zwykłą mowę, więc czytelnicy, którzy są niemi, mogą uznać książkę o alfabecie Morse'a lub języku migowym za pomocną podczas oczekiwania na łatkę.