На 3D-принтері надрукували «піцу» для вирішення проблеми «ефекту вечірки»

Група вчених з Університету Дьюка надрукувала на 3D-принтері складний сенсор з акустичних метаматеріалів і написала для нього спеціальний алгоритм. Створена система дозволяє технічним пристроям подолати проблему так званого «ефекту вечірки». Попередні експерименти показали, що завдяки новому сенсору комп'ютер виявився здатний розрізнити три незалежних, але накладаються один на одного джерела звуку з точністю 96,67 відсотків. Поки система працює тільки на досить високих частотах, проте кілька груп дослідників вже планую доопрацювати і вдосконалити її. Роботу з описом пристрою опубліковано в журналі.


Людська слухова сенсорна система має здатність вичленувати серед безлічі голосів і сторонніх звуків один єдиний голос прямого співрозмовника і довгий час концентрувати увагу тільки на нім. До недавнього часу ніяким системам штучного інтелекту не вдавалося реалізувати цю властивість, що отримала назву «ефект вечірки».


Відомо, що тільки люди, які володіють бінауральним нормальним слухом здатні вичленувати один голос з безлічі інших (глухі на одне вухо або користуються слуховим апаратом значною мірою його втрачають). Ґрунтуючись на цих відомостях, вчені припустили, що ключ до проблеми лежить сортування звуків відповідно до положення їхнього джерела щодо сенсора.

Вчені надрукували зі спеціальних акустичних метаматеріалів складно влаштований сенсор. Зовні він нагадує піцу або пиріг, порізаний на 36 шматків. Всередині кожної з часток «пирога» знаходиться різна кількість шестикутних трубочок. Різниться не тільки їхнє число в кожному шматку, а й висота і положення. Звукові хвилі, проходячи вздовж кожної дольки від меж диска до встановленого в центрі «пирога» мікрофону, резонують всередині шестикутних трубочок. В результаті звук всередині кожного з шматків пирога невловимо змінюється (людське вухо не здатне їх розрізнити), а особливий алгоритм в комп'ютері аналізує ці відмінності і на їх основі обчислює джерело звуку, що дозволяє селективно вибирати звук від конкретного джерела, тобто «концентрувати увагу».

«Ефект вечірки» був відкритий когнітивним психологом, фахівцем з уваги, і, за сумісництвом, інженером-електронником Едвардом Коліном Черрі в 1953 році в ході вирішення проблеми сенсорного перевантаження авіадиспетчерів. Справа в тому, що в той час диспетчери отримували одночасно безліч повідомлень від різних пілотів через навушники. Поставивши кілька експериментів, Черрі з'ясував, що якщо на праве вухо подається один голос, а на ліве - інший, то людина здатна концентрувати увагу і запам'ятовувати інформацію тільки від одного голосу, в той час як повідомлення від другого не практично не вловлюються і не запам'ятовуються. Цю особливу селективність аудіальної уваги людини він і назвав «ефектом вечірки».

Раніше, щоб імітувати цю людську здатність вчені та інженери пропонували дуже складні системи мікрофонів, розподілені по простору кімнат, а в разі аналізу аудіозаписів не менш витончені алгоритми штучного інтелекту. Так, у травні цього року група британських дослідників використовувала глибоке машинне навчання на штучній нейромережі, щоб виділити голос зі сторонніх шумів.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND