Ludzkie ucho jak sokole oko

W ponad 99 proc. przypadków zaledwie dwa krótkie słowa wystarczą ludziom, aby rozpoznać głos bliskiej osoby. Żaden komputerowy system do identyfikacji dźwięków nie jest w stanie im dorównać.

Do takiego wniosku doszedł Julien Plante-Hébert z Uniwersytetu w Montrealu. W swoim badaniu odtwarzał francuskojęzycznym Kanadyjczykom nagrania audio, na którym zarejestrowano dziesięć głosów męskich. Uczestnicy badania mieli za zadanie rozpoznać, który z tych głosów należał do osoby, którą znają. Okazało się, że do poprawnego rozpoznania potrzebowali jedynie czterech sylab, z tylu bowiem sylab składa się na zwrot: „merci beaucoup” (dziękuję bardzo).

Zdaniem Plante-Héberta, ludzie posiadają wyjątkowe zdolności, jeśli chodzi o identyfikowanie znajomych głosów. – Noworodki od razu po urodzeniu są w stanie rozpoznać głos matki i rozróżnić brzmienie języka, którym ona się posługuje od innych języków – tłumaczy badacz.  Zainspirowany tą obserwacją, Plante-Hébert stworzył serię głosowych „line-upów”. Jest to technika wzorowana na popularnej procedurze identyfikacji wizualnej stosowanej przez policję, w ramach której grupa ludzi o podobnych cechach fizycznych jest pokazywana świadkowi, a następnie ma on wśród nich zidentyfikować sprawcę przestępstwa.

Line-up głosowy jest oparty na podobnej zasadzie – osobie badanej jest prezentowanych kilka głosów o podobnych cechach akustycznych. W badaniu przeprowadzonym przez Plante-Héberta każda próbka głosowa zawierała wypowiedzi o różnej długości – od jednej do osiemnastu sylab. Stopień znajomości każdego głosu przez osobę badaną był ustalany na podstawie częstości kontaktu pomiędzy osobą, udzielającą głosu do próbki, a osobą badaną. W badaniu wzięły udział 44 osoby w wieku od 18 do 65 lat.

Wyniki badania wskazują, że osoby badane nie są w stanie zidentyfikować głosu, gdy wypowiedzi były krótsze niż cztery sylaby i to niezależnie od stopnia znajomości, jaki wiązał je z osobami udzielającymi głosu. Natomiast w przypadku wypowiedzi składającej się z minimum czterech sylab, osoby badane  odpowiadały niemal bezbłędnie. Co zaskakujące, poprawność odpowiedzi materiale językowym złożonym z minimum czterech sylab była tak wysoka, że przewyższyła trafność odpowiedzi udzielanych przez komputerowe systemy identyfikacji głosu! Te ostatnie miały bowiem  92 procentową skuteczność, gdy tymczasem poprawność odpowiedzi udzielanych przez osoby badane sięgała 99,9 proc.  Wyższość ludzi nad maszynami była widoczna szczególnie wtedy, gdy na nagraniu głosowi lektora towarzyszyły dźwięki zakłócające w tle.

Joanna Kołak

Źródło: http://www.sciencedaily.com/releases/2015/10/151008142626.htm

Serwis „Wszystko o dwujęzyczności” jest dostępny na licencji Creative Commons znanie autorstwa 3.0 Polska. Pewne prawa zastrzeżone na rzecz Uniwersytetu Warszawskiego. Utwór powstał w ramach projektu finansowanego w ramach konkursu „Współpraca z Polonią i Polakami za granicą w 2015 r.” realizowanego za pośrednictwem MSZ w roku 2015. Zezwala się na dowolne wykorzystanie utworu, pod warunkiem zachowania ww. informacji, w tym informacji o stosowanej licencji, o posiadaczach praw oraz o konkursie Współpraca z Polonią i Polakami za granicą w 2015 r.”.

 

Może Ci się również spodoba

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.