Локалізація звуків: як мозок розпізнає джерела звуків

448
202
23.11.2019
Локалізація звуків: як мозок розпізнає джерела звуків

Світ, що оточує нас, наповнений всілякою інформацією, яку наш мозок безперервно обробляє. Отримує він цю інформацію за допомогою органів почуттів, кожен з яких відповідає за свою частку сигналів: очі (зір), мова (смак), ніс (нюх), шкіра (дотик), вестибулярний апарат (рівновага, положення в просторі і почуття ваги) і вуха (звук).

Зібравши воєдино сигнали від усіх цих органів, наш мозок може побудувати точну картину навколишнього середовища. Але далеко не всі аспекти обробки зовнішніх сигналом нам відомі. Однією з таких таємниць є механізм локалізації джерела звуків.

Вчені з лабораторії нейроінженеріі мови і слуху (технологічний інститут Нью-Джерсі) запропонували нову модель нейронного процесу локалізації звуку. Які саме процеси протікають в головному мозку під час сприйняття звуку, як наш мозок розуміє становище джерела звуку і як дане дослідження може допомогти в боротьбі з дефектами слуху. Про це ми дізнаємося з доповіді дослідницької групи. Поїхали.

Основа дослідження

Інформація, яку отримує наш мозок від органів чуття, відрізняється один від одного як з точки зору джерела, так і з точки зору її обробки. Одні сигнали відразу постають перед нашим мозком у вигляді точної інформації, інші ж потребують додаткових обчислювальних процесів. Грубо кажучи, дотик ми відчуваємо відразу, а ось почувши звук, нам належить ще знайти звідки він виходить.

Основою локалізації звуків в горизонтальній площині є інтерауральная* різниця в часі (ITD від interaural time difference) звуків, що досягають вух слухача.

Інтерауральная база* - відстань між вухами.

У головному мозку є певна ділянка (медійна верхня олива або МВО), який відповідає за цей процес. У момент отримання звукового сигналу в МВО відбувається перетворення інтерауральних різниць у часі в швидкість реакції нейронів. Форма кривих швидкості вихідного сигналу МВО як функції ITD нагадує форму взаємнокорреляційну функцію вхідних сигналів для кожного вуха.

Те, як обробляється і інтерпретується інформація в МВО, залишається не до кінця зрозумілим, через що існує кілька досить суперечливих теорій. Найвідомішою і за фактом класичною теорією локалізації звуку є модель Джеффресса (Lloyd A. Jeffress). Вона заснована на маркованій лінії* нейронів-детекторів, які чутливі до бінауральної синхронності нейронних вхідних сигналів від кожного вуха, причому кожен нейрон максимально чутливий до певної величини ITD ().

Принцип маркованої лінії * - гіпотеза, що пояснює, як різні нерви, всі з яких використовують одні і ті ж фізіологічні принципи при передачі імпульсів вздовж своїх аксонів, здатні генерувати різні відчуття. Структурно подібні нерви можуть генерувати різні сенсорні сприйняття, якщо вони пов'язані з унікальними нейронами в центральній нервовій системі, які здатні декодувати подібні нервові сигнали різними способами.


(A) Частота спрацьовування моделярного нейрона laminaris ядра з переважним ITD 375 мкс, як функція вихідного ITD.
(B) Відмінності в півкулі по скорострільності, усереднені по всіх 81 модельованих нижнім коллікулярним одиницям.
(C) Середня реакція населення з використанням кодованого позначення лінії в діапазоні ITD і інтенсивності звуку.
(D) Середня популяціонна реакція з використанням полусферичного разностного кодування.

Дана модель в обчислювальному плані схожа на нейрони кодування, засноване на необмежених взаємних кореляції звуків, що досягають обох вух.

Також існує модель, в якій передбачається, що локалізація звуку може бути змодельована на основі відмінностей в швидкості реакції певних популяцій нейронів з різних півкуль мозку, тобто модель міжпівкульної асиметрії ().

Досі було складно однозначно заявити яка з двох теорій (моделей) правильна, з огляду на що кожна з них передбачає різні залежності локалізації звуку від інтенсивності звуку.

У розглянутому дослідженні вчені вирішили об'єднати обидві моделі, щоб зрозуміти, засноване чи сприйняття звуків на нейронному кодуванні або на різниці реакції окремо взятих нейронних популяцій. Було проведено кілька експериментів, в яких брали участь люди у віці від 18 до 27 років (5 жінок і 7 чоловіків).

Аудіометрія (вимір гостроти слуху) учасників становила 25 дБ або вище при частоті від 250 до 8000 Гц. Учасника дослідів розміщували в звукоізольованій кімнаті, в якій було розміщено спеціальне обладнання, відкалібровані з високою точністю. Учасники повинні були, почувши звуковий сигнал, вказати напрямок, звідки він виходить.

Результати дослідження

Для оцінки залежності латерализації* мозкової активності від інтенсивності звуку у відповідь на марковані нейрони були використані дані про швидкість реакції нейронів в ламінарному ядрі мозку сипуха.

Латеральність* - асиметрія лівого і правого половин тіла.

Для оцінки залежності латерализации мозкової активності від швидкості реакції певних популяцій нейронів були використані дані активності нижнього двухолмия мозку макаки-резусу, після чого додатково було спрямовано відмінності в швидкості нейронів з різних півкуль.

Модель маркованої лінії нейронів-детекторів передбачає, що при зменшенні інтенсивності звуку латеральність сприйманого джерела буде сходитися в середніх значеннях, схожих для відносини тихих і гучних звуків ().

Модель міжпівкульна асиметрії, в свою чергу, передбачає, що при зниженні інтенсивності звуку до майже порогових сприймається латеральність зміщуватиметься до середньої лінії (1D).


При більш високій загальній інтенсивності звуку передбачається, що латерализація буде інваріантною за інтенсивністю (вставки на і 1D).

Отже, аналіз того, як інтенсивність звуку впливає на сприймаємість напрямку звуку, дозволяє точно визначити природу протікаючих в цей момент процесів - нейрони з однією спільної області або нейрони з різних півкуль.

Очевидно, що здатність людини розрізняти ITD може варіюватися в залежності від інтенсивності звуку. Однак вчені заявляють, що досить складно інтерпретувати попередні висновки, що зв'язують чутливість до ITD і оцінку слухачем напрямки джерела звуку як функції інтенсивності звуку. Одні дослідження говорять, що при досягненні інтенсивності звуку до граничного порогу, знижується сприймаєма латеральність джерела. Інші ж дослідження говорять про те, що впливу інтенсивності на сприйняття немає взагалі.

Іншими словами, вчені «м'яко» натякають, що в літературі досить мало інформації щодо зв'язку ITD, інтенсивності звуку і визначення напрямку його джерела. Є теорії, які існують як свого роду аксіоми, загальноприйняті науковим співтовариством. Тому було вирішено детально перевірити всі теорії, моделі і можливі механізми сприйняття слуху на практиці.

Перший експеримент був поставлений на основі використання психофізичної парадігми, що дозволило вивчити латералізацію на основі ITD як функцію інтенсивності звуку в групі з десяти нормально чуючих учасників досвіду.


(A) Стимули: спектрально плоский шум, використаний в експерименті 1 (темно-сірий) в порівнянні з A-зваженим шумом, протестований в якості контролю чутності в експерименті 2 (світло-сірий). Фіолетова лінія показує величину зворотнього А-зважульного фільтра нульової фази.
(B) Відповіді від одного репрезентативного слухача (TCW) за двома интенсивностям звуку, і відповідний NLME підходить для цих даних.
(C і D) Сприймається латеральність як функція ITD для C) спектрально плоский шум (експеримент 1) або D) A-зважений шум (експеримент 2). Стовпчики помилок, досить великі, щоб їх можна було побачити, показують одну стандартну помилку середнього значення для слухачів.
*Кольори позначають інтенсивність звуку. Вставки ілюструють збільшений ділянку графіків. Кола показують необроблені дані, лінії і стрічки показують відповідності NLME і один стандарт середнього.

Джерела звуку були спеціально налаштовані так, щоб охоплювати більшу частину частотного діапазону, в межах якого люди здатні розпізнавати ITD, тобто від 300 до 1200 Гц ().

У кожному з випробувань слухач повинен був вказати передбачувану латеральність, вимірювану як функцію рівня відчуттів, в діапазоні значень ITD від 375 до 375 мс. Щоб визначити вплив інтенсивності звуку, використовувалася нелінійна модель змішаного ефекту (NMLE), яка включала як фіксовану, так і випадкову інтенсивність звуку.

Графік демонструє оцінену латералізацію зі спектрально плоским шумом при двох интенсивностях звуку для репрезентативного слухача. А графік показує необроблені дані (кола) і підігнані під модель NMLE (лінії) всіх слухачів.

Таблиця вище показує всі параметри NLME. Видно, що сприймаєма латеральність зростала при збільшенні ITD, як того й очікували вчені. Зі зменшенням інтенсивності звуку сприйняття все більше зміщуються в сторону середньої лінії (вставка на графіку 2C). Отже, як для спектрально плоского шуму, так і для A-зваженого шуму статистичний аналіз, в якому були визначені загальні відмінності між слухачами, несумісний з позначеною лінією моделі локалізації людського звуку.

Ці тенденції були підкріплені моделлю NLME, яка показала істотний вплив ITD і інтенсивності звуку на максимальну ступінь латеральності, підтверджуючи модель міжпівкульних відмінностей.

Крім того, незначний вплив на сприйняту латеральність мали середні аудіометричні пороги чистих тонів. А ось інтенсивність звуку істотно не впливала на показники психометричних функцій.

Основною метою другого експерименту було визначення того, як отримані в попередньому експерименті результати поміняються при обліку спектральних особливостей стимулів (звуків). Необхідність перевірки спектрально плоского шуму при низької інтенсивності звуку полягає в тому, що частини спектра можуть бути не чутні, і це може вплинути на визначення напрямку звуку. Отже, за результати першого експерименту можна помилково прийняти факт того, що ширина чутної частини спектра може зменшуватися зі зменшенням інтенсивності звуку.

Тому було вирішено провести ще один досвід, але вже із застосуванням назад А-зважених * шумів.


А-зважування * застосовується до рівнів звуку, щоб врахувати відносну гучність, сприйняту людським вухом, оскільки вухо менш чутливо до низьких звукових частот. А-зважування реалізується шляхом арифметичного додавання таблиці значень, перерахованих в октавних смугах, до виміряних рівнями звукового тиску в дБ.

На графіку 2D показані необроблені дані (кола) і підігнані під модель NMLE дані (лінії) всіх учасників експерименту.

Аналіз даних показав, що коли всі частини звуку є приблизно однаково чутними (як в першому, так і в другому досвіді), сприймається латеральність і нахил на графіку, що пояснює зміну латеральності з ITD, зменшуються з падінням інтенсивності звуку.

Таким чином, результати другого експерименту підтвердили результати першого. Тобто на практиці було показано, що модель, запропонована ще в 1948 році Джеффрессом, не є правильною.

Виходить, що локалізація звуків погіршується при зниженні інтенсивності звуку, а Джеффресс вважав, що звуки сприймаються і обробляються людиною однаково незалежно від їх інтенсивності.

** Для більш детального ознайомлення з нюансами дослідження рекомендую заглянути в доповідь учених.


 

Епілог

Теоретичні припущення і підтверджують їх практичні досліди показали, що нейрони головного мозку у ссавців активуються з різною швидкістю в залежності від напрямку звукового сигналу. Слідом мозок порівнює ці швидкості між усіма задіяними в процесі нейронами для динамічної побудови карти звукового середовища.

Модель Джеффрессона насправді не на 100% є помилковою, так як з її допомогою можна ідеально описати локалізацію джерела звуку у сівухи. Так, для сипух інтенсивність звуку не має значення, вони в будь-якому випадку визначать положення його джерела. Однак ця модель не працює з макаками-резусами, як показали раніше проведені досліди. Отже, ця модель Джеффрессона не може описати локалізацію звуків для всіх живих істот.

Експерименти за участю людей зайвий раз підтвердили, що локалізація звуків протікає у різних організмів по-різному. Багато хто з учасників не змогли вірно визначити положення джерела звукових сигналів через низьку інтенсивності звуків.

Вчені вважають, що їхня праця показує певну схожість між тим, як ми бачимо і як ми чуємо. Обидва процеси пов'язані зі швидкістю нейронів в різних ділянках мозку, а також з оцінкою цієї різниці для визначення як положення видимих ​​нами предметів в просторі, так і положення джерела чутного нами звуку.

Надалі дослідники мають намір провести ряд експериментів для більш детального розгляду зв'язку між слухом і зором людини, що дозволить краще зрозуміти, як саме наш мозок динамічно будує карту навколишнього світу.

Залишайтеся зацікавленними ☺!

Підписуйся на наш телеграм-канал: @sko4_com, щоб бути в курсі музичних електронних подій, і не тільки.

Джерело : https://habr.com/ru/company/ua-hosting/blog/476396/

Відгуки 0

Залиште свій відгук

Підпишись на розсилку