Презентация Оптимизация программы для определения частоты аудиосигнала

Смотреть слайды в полном размере
Презентация Оптимизация программы для определения частоты аудиосигнала


Вашему вниманию предлагается презентация «Оптимизация программы для определения частоты аудиосигнала», с которой можно предварительно ознакомиться, просмотреть текст и слайды к ней, а так же, в случае, если она вам подходит - скачать файл для редактирования или печати.

Презентация содержит 73 слайда и доступна для скачивания в формате ppt. Размер скачиваемого файла: 1.48 MB

Просмотреть и скачать

Pic.1
Оптимизация программы для определения частоты аудиосигнала Ивонин Владимир Алексеевич, студент групп
Оптимизация программы для определения частоты аудиосигнала Ивонин Владимир Алексеевич, студент группы 01321-ДБ
Pic.2
Введение Цель: изучить и реализовать алгоритм быстрого преобразования Фурье и выяснить, как избежать
Введение Цель: изучить и реализовать алгоритм быстрого преобразования Фурье и выяснить, как избежать ошибочного определения фундаментальной частоты. Задачи: Изучить алгоритм БПФ; Реализовать алгоритм БПФ; Изучить теорию восприятия высоты тона; Применить теорию восприятия высоты тона к предмету исследований.
Pic.3
Преобразование Фурье , k=0, …, N-1, (1) , n=0, …, N-1, (2) где S(k) – отсчёты спектра отсчётов сигна
Преобразование Фурье , k=0, …, N-1, (1) , n=0, …, N-1, (2) где S(k) – отсчёты спектра отсчётов сигнала s(n), N – количество отсчётов, n – индекс временных отсчётов сигнала, а k – индекс спектральных отсчётов ДПФ. – прямое ДПФ, (2) – обратное ДПФ. Вычислительная сложность алгоритма ДПФ составляет N2 операций комплексного умножения и сложения
Pic.4
Замена N-точечного ДПФ двумя 0,5N-точечными ДПФ
Замена N-точечного ДПФ двумя 0,5N-точечными ДПФ
Pic.5
БПФ Алгоритмы БПФ, использующие выборки длиной N=2L, называются «алгоритмами БПФ по основанию 2» кол
БПФ Алгоритмы БПФ, использующие выборки длиной N=2L, называются «алгоритмами БПФ по основанию 2» количество операций умножения будет раз.
Pic.6
Быстрое преобразование Фурье с прореживанием по времени Введём обозначение в (1): , k=0, …, N-1, (3)
Быстрое преобразование Фурье с прореживанием по времени Введём обозначение в (1): , k=0, …, N-1, (3) где – поворачивающий коэффициент, k – степень, а не индекс Прореживание по времени заключается в разделении исходной последовательности s(n), n=0, …, N-1, на две последовательности половинной длительности s0(m) и s1(m), m=0, …, 0,5N-1, таким образом, что s0(m)=s(2m), а s1(m)=s(2m+1). Последовательность s0(m) содержит отсчёты с чётными индексами, а s1(m) — с нечётными
Pic.7
Прореживание по времени для N=8
Прореживание по времени для N=8
Pic.8
, k=0, …, 0,5N-1, (4) , k=0, …, 0,5N-1, (5) где , а – 0,5N-точечные ДПФ прореженных последовательнос
, k=0, …, 0,5N-1, (4) , k=0, …, 0,5N-1, (5) где , а – 0,5N-точечные ДПФ прореженных последовательностей s0(m) и s1(m), m=0, …, 0,5N-1, соответственно.
Pic.9
Таким образом, прореживание по времени можно считать алгоритмом разделения последовательности на две
Таким образом, прореживание по времени можно считать алгоритмом разделения последовательности на две последовательности половинной длительности. Первая половина ДПФ – сумма ДПФ S0(k) «чётной» последовательности s0(m) и ДПФ S1(k) «нечётной» последовательности s1(m), умноженного на поворотные коэффициенты .
Pic.10
Этимология названия поворачивающих коэффициентов
Этимология названия поворачивающих коэффициентов
Pic.11
Свойства поворачивающих коэффициентов
Свойства поворачивающих коэффициентов
Pic.12
Граф «бабочка»
Граф «бабочка»
Pic.13
Такую процедуру объединения можно применить для расчёта каждого из 0,5N-точечных ДПФ S0(k) и S1(k) ч
Такую процедуру объединения можно применить для расчёта каждого из 0,5N-точечных ДПФ S0(k) и S1(k) через два 0,25N-точечных ДПФ. Тогда для N=2L можно произвести L-1 этап деления последовательности на «чётную» и «нечётную» и после этого производить объединение спектра за L этапов. В результате получается полный граф алгоритма БПФ.
Pic.14
Полный граф алгоритма БПФ по основанию 2 с прореживанием по времени для N=8
Полный граф алгоритма БПФ по основанию 2 с прореживанием по времени для N=8
Pic.15
На первом этапе отсчёты входного сигнала переставляются местами, и исходная последовательность делит
На первом этапе отсчёты входного сигнала переставляются местами, и исходная последовательность делится на «чётную» и «нечётную» последовательности. Потом «чётная» и «нечётная» последовательности в свою очередь делятся на «чётную» и «нечётную» последовательности. Данная процедура называется двоично-инверсной перестановкой, так как можно выполнить перенумерацию отсчётов, переписав номер отсчёта в двоичной системе счисления в обратном направлении.
Pic.16
Основные идеи алгоритма БПФ Разделить сумму (1) из N слагаемых на две суммы по N/2 слагаемых и вычис
Основные идеи алгоритма БПФ Разделить сумму (1) из N слагаемых на две суммы по N/2 слагаемых и вычислить их по отдельности. Для вычисления каждой из подсумм нужно их тоже разделить на две и т. д. Повторно использовать уже вычисленные слагаемые
Pic.17
Пример деления последовательности s(n) для N=16
Пример деления последовательности s(n) для N=16
Pic.18
На первом шаге чётные элементы с номером n переместились в позицию n/2, а нечётные – в позицию N/2+(
На первом шаге чётные элементы с номером n переместились в позицию n/2, а нечётные – в позицию N/2+(n-1)/2, где n=0, 1, …, N-1. Таким образом, новая позиция вычисляется из старой позиции с помощью функции , где [n/2] – целая часть от деления n на 2, а { n/2} – дробная.
Pic.19
Циклический сдвиг вправо Циклический сдвиг вправо при одном разбиении
Циклический сдвиг вправо Циклический сдвиг вправо при одном разбиении
Pic.20
Оптимизация вычисления поворачивающих коэффициентов Формула , (6) позволяет заменить операцию возвед
Оптимизация вычисления поворачивающих коэффициентов Формула , (6) позволяет заменить операцию возведения в степень операцией умножения, если заранее вычислить WN для N=2, 4, 8, …. WN не целое, т. к. , но можно избежать множества обращений к относительно медленным функциям sin(x) и cos(x):
Pic.21
В приведённом примере понадобилось всего 5 умножений, вместо 13. Для возведения в степень 0,5N-1 нуж
В приведённом примере понадобилось всего 5 умножений, вместо 13. Для возведения в степень 0,5N-1 нужно умножений, вместо 0,5N, что позволяет значительно уменьшить погрешность при вычислении поворачивающих коэффициентов. В приведённом примере понадобилось всего 5 умножений, вместо 13. Для возведения в степень 0,5N-1 нужно умножений, вместо 0,5N, что позволяет значительно уменьшить погрешность при вычислении поворачивающих коэффициентов. Можно вдвое сократить количество умножений на каждом шаге, если использовать уже рассчитанные результаты: , для хранения которых нужно дополнительно использовать комплексных ячеек памяти
Pic.22
Если какое-либо не было вычислено предварительно, то анализируется двоичный вид числа k. Каждому еди
Если какое-либо не было вычислено предварительно, то анализируется двоичный вид числа k. Каждому единичному биту соответствует ровно один коэффициент. В общем случае единице в бите с номером b (младший бит имеет номер 0) соответствует коэффициент , хранящийся в b-й ячейке упомянутого выше массива.
Pic.23
Можно уменьшить количество умножений для вычисления до одного на два цикла. Для этого нужно отвести
Можно уменьшить количество умножений для вычисления до одного на два цикла. Для этого нужно отвести 0,5N комплексных ячеек для хранения всех предыдущих . Алгоритм таков: нечётные элементы вычисляются по формуле (6), чётные – по формуле (7): Можно уменьшить количество умножений для вычисления до одного на два цикла. Для этого нужно отвести 0,5N комплексных ячеек для хранения всех предыдущих . Алгоритм таков: нечётные элементы вычисляются по формуле (6), чётные – по формуле (7): (7) То есть ничего не вычисляется, а используется одно из значений, вычисленных на предыдущем шаге, когда N было вдвое меньше.
Pic.24
Оптимизация программы для определения частоты аудиосигнала, слайд 24
Pic.25
Основные задачи психоакустики понять, как слуховая система расшифровывает звуковой образ установить
Основные задачи психоакустики понять, как слуховая система расшифровывает звуковой образ установить основные соответствия между физическими стимулами и слуховыми ощущениями выявить, какие именно параметры звукового сигнала являются наиболее значимыми для передачи семантической (смысловой) и эстетической (эмоциональной) информации.
Pic.26
Периферическая часть слухового анализатора акустическая антенна, принимающая, локализующая, фокусиру
Периферическая часть слухового анализатора акустическая антенна, принимающая, локализующая, фокусирующая и усиливающая звуковой сигнал; микрофон; частотный и временной анализатор; аналого-цифровой преобразователь, преобразующий аналоговый сигнал в двоичные нервные импульсы – электрические разряды.
Pic.27
Основные функции внешних ушей бинауральное (пространственное) восприятие локализация звукового источ
Основные функции внешних ушей бинауральное (пространственное) восприятие локализация звукового источника усиление звуковой энергии
Pic.28
Строение внешних ушей Уши и голова – компоненты внешней акустической антенны Слуховой канал представ
Строение внешних ушей Уши и голова – компоненты внешней акустической антенны Слуховой канал представляет собой изогнутую цилиндрическую трубку длиной 22,5 мм, имеющую первую резонансную частоту порядка 2,6 кГц, поэтому в этой области частот он существенно усиливает звуковой сигнал Барабанная перепонка – тонкая плёнка толщиной 74 мкм, имеет вид конуса, обращённого остриём в сторону среднего уха. На низких частотах она движется, как поршень, на более высоких – на ней образуется сложная система узловых линий
Pic.29
Структура периферической слуховой системы
Структура периферической слуховой системы
Pic.30
Строение среднего уха Это заполненная воздухом полость, соединённая с носоглоткой евстахиевой трубой
Строение среднего уха Это заполненная воздухом полость, соединённая с носоглоткой евстахиевой трубой для выравнивания атмосферного давления. Там находятся три маленькие слуховые косточки: молоточек наковальня стремечко
Pic.31
Структура периферической слуховой системы
Структура периферической слуховой системы
Pic.32
Основные функции среднего уха согласование импеданса воздушной среды с жидкой средой улитки внутренн
Основные функции среднего уха согласование импеданса воздушной среды с жидкой средой улитки внутреннего уха защита от громких звуков (акустический рефлекс) усиление (рычаговый механизм), за счёт которого звуковое давление, передаваемое во внутреннее ухо, усиливается почти на 38 дБ по сравнению с тем, которое попадает на барабанную перепонку.
Pic.33
Строение внутреннего уха орган равновесия (вестибулярный аппарат) улитка
Строение внутреннего уха орган равновесия (вестибулярный аппарат) улитка
Pic.34
Структура периферической слуховой системы
Структура периферической слуховой системы
Pic.35
Строение улитки Это трубка переменного сечения, свёрнутая три раза, внутри по всей длине она разделе
Строение улитки Это трубка переменного сечения, свёрнутая три раза, внутри по всей длине она разделена двумя мембранами на три полости: лестница преддверия срединная полость барабанная лестница Сверху срединная полость закрыта мембраной Рейсснера, снизу – базилярной мембраной. Все полости заполнены жидкостью. Верхняя и нижняя полости соединены через отверстие у вершины улитки (геликотрему). В верхней полости находится овальное окно, через которое стремечко передаёт колебания во внутреннее ухо, в нижней полости находится круглое окно, выходящее обратно в среднее ухо.
Pic.36
Схематическое изображение развёрнутой улитки (оп – окно преддверия)
Схематическое изображение развёрнутой улитки (оп – окно преддверия)
Pic.37
Базилярная мембрана Состоит из нескольких тысяч поперечных волокон: длина – 32 мм, ширина у стремечк
Базилярная мембрана Состоит из нескольких тысяч поперечных волокон: длина – 32 мм, ширина у стремечка – 0,05 мм (этот конец узкий, лёгкий и жесткий), у геликотремы ширина – 0,5 мм (этот конец толще и мягче). На внутренней стороне базилярной мембраны находится орган Корти, а в нём – специализированные слуховые рецепторы – волосковые клетки. В поперечном направлении орган Корти состоит из одного ряда внутренних волосковых клеток и трёх рядов наружных волосковых клеток. Между ними образуется тоннель. Волокна слухового нерва пересекают тоннель и контактируют с волосковыми клетками.
Pic.38
Слуховой нерв представляет собой перекрученный ствол, сердцевина которого состоит из волокон, отходя
Слуховой нерв представляет собой перекрученный ствол, сердцевина которого состоит из волокон, отходящих от верхушки улитки, а наружные слои – от нижних её участков. Войдя в ствол мозга, нейроны взаимодействуют с клетками различных уровней, поднимаясь к коре и перекрещиваясь по пути так, что слуховая информация от левого уха поступает в основном в правое полушарие, где происходит, главным образом, обработка эмоциональной информации, а от правого уха – в левое полушарие, где в основном обрабатывается смысловая информация. В коре основные зоны слуха находятся в височной области, между обоими полушариями имеется постоянное взаимодействие. Слуховой нерв представляет собой перекрученный ствол, сердцевина которого состоит из волокон, отходящих от верхушки улитки, а наружные слои – от нижних её участков. Войдя в ствол мозга, нейроны взаимодействуют с клетками различных уровней, поднимаясь к коре и перекрещиваясь по пути так, что слуховая информация от левого уха поступает в основном в правое полушарие, где происходит, главным образом, обработка эмоциональной информации, а от правого уха – в левое полушарие, где в основном обрабатывается смысловая информация. В коре основные зоны слуха находятся в височной области, между обоими полушариями имеется постоянное взаимодействие.
Pic.39
Упрощённый механизм передачи звука Звуковые волны проходят звуковой канал и возбуждают колебания бар
Упрощённый механизм передачи звука Звуковые волны проходят звуковой канал и возбуждают колебания барабанной перепонки Эти колебания через систему косточек среднего уха передаются овальному окну, толкающему жидкость в верхнем отделе улитки, в ней возникает импульс давления, заставляющий жидкость переливаться из верхней половины в нижнюю через барабанную лестницу и геликотрему, и оказывает давление на перепонку круглого окна, вызывая при этом его смещение в сторону, противоположную движению стремечка Движение жидкости вызывает колебания базилярной мембраны (бегущая волна). Преобразование механических колебаний мембраны в дискретные электрические импульсы нервных волокон происходят в органе Корти. Когда базилярная мембрана вибрирует, реснички на волосковых клетках изгибаются, и это генерирует электрический потенциал, что вызывает поток электрических нервных импульсов, несущих всю необходимую информацию о поступившем звуковом сигнале в мозг для дальнейшей переработки и реагирования.
Pic.40
Бегущая волна на базилярной мембране
Бегущая волна на базилярной мембране
Pic.41
Слуховая система способна различать высоту звука только у периодических сигналов. Если это простое г
Слуховая система способна различать высоту звука только у периодических сигналов. Если это простое гармоническое колебание, например, синусоидальный сигнал от генератора, то период колебаний T определяет частоту f0=1/T, поэтому определяющим параметром для различения высоты является частота сигнала Если это сложный звук, то высоту слуховая система может присвоить по его основному тону, но только если он имеет периодическую структуру, т. е. спектр его состоит из гармоник – обертонов – с частотами
Pic.42
Зависимость высоты тона от частоты звука
Зависимость высоты тона от частоты звука
Pic.43
Кривые частотной разрешающей способности слуха
Кривые частотной разрешающей способности слуха
Pic.44
Зависимость высоты звука от его интенсивности
Зависимость высоты звука от его интенсивности
Pic.45
Ощущение высоты тона зависит и от его длительности: короткие звуки воспринимаются как сухой щелчок,
Ощущение высоты тона зависит и от его длительности: короткие звуки воспринимаются как сухой щелчок, но при удлинении звука щелчок начинает давать ощущение высоты тона. Время, требуемое для перехода от щелчка к тону, зависит от частоты: для низких частот требуется для распознания высоты тона примерно 60 мс, для частот от 1 до 2 кГц – 15 мс. Для сложных звуков это время увеличивается, для звуков речи оно может составлять 20-30 мс.
Pic.46
В музыке простые синусоидальные тоны практически не используются, каждый музыкальный тон имеет сложн
В музыке простые синусоидальные тоны практически не используются, каждый музыкальный тон имеет сложную структуру и состоит из основного тона и гармоник. Однако можно установить соответствие по высоте музыкального тона, например, ноты ля первой октавы и чистого синусоидального сигнала с частотой 440 Гц. Высоты этих двух звуков будут одинаковыми, но тембры – разными. Это свидетельствует о том, что для сложных периодических сигналов высота присваивается по частоте основного тона – именно он имеет частоту 440 Гц. В музыке простые синусоидальные тоны практически не используются, каждый музыкальный тон имеет сложную структуру и состоит из основного тона и гармоник. Однако можно установить соответствие по высоте музыкального тона, например, ноты ля первой октавы и чистого синусоидального сигнала с частотой 440 Гц. Высоты этих двух звуков будут одинаковыми, но тембры – разными. Это свидетельствует о том, что для сложных периодических сигналов высота присваивается по частоте основного тона – именно он имеет частоту 440 Гц.
Pic.47
До частоты примерно 5000 Гц увеличение высоты тона на октаву связано с удвоением частоты. Но выше ча
До частоты примерно 5000 Гц увеличение высоты тона на октаву связано с удвоением частоты. Но выше частоты 5000 Гц это соответствие нарушается: чтобы получить ощущение увеличения высоты на октаву, надо увеличить соотношение частот почти в 10 раз. Это дало основание некоторым ученым предложить две размерности высоты тона: психофизическую – в мелах, пропорциональную в некоторых пределах логарифму частоты, установленную для чистых тонов, и музыкальную, соответствующую названию нот, которая может быть определена примерно до 5000 Гц. До частоты примерно 5000 Гц увеличение высоты тона на октаву связано с удвоением частоты. Но выше частоты 5000 Гц это соответствие нарушается: чтобы получить ощущение увеличения высоты на октаву, надо увеличить соотношение частот почти в 10 раз. Это дало основание некоторым ученым предложить две размерности высоты тона: психофизическую – в мелах, пропорциональную в некоторых пределах логарифму частоты, установленную для чистых тонов, и музыкальную, соответствующую названию нот, которая может быть определена примерно до 5000 Гц.
Pic.48
Теория места Теория места при восприятии высоты основана на способности базилярной мембраны выполнят
Теория места Теория места при восприятии высоты основана на способности базилярной мембраны выполнять частотный анализ сложного звука, т. е. действовать как спектральный анализатор Базилярная мембрана организована тонотопически, т. е. каждый тон имеет свою топографию размещения Максимум смещения бегущей волны располагается в разных местах базилярной мембраны: низкие частоты имеют максимум смещения вблизи вершины мембраны, высокие – вблизи овального окна. Каждая частота имеет своё место максимума возбуждения на мембране
Pic.49
В зависимости от спектрального состава на базилярной мембране возбуждаются различные участки. Возбуж
В зависимости от спектрального состава на базилярной мембране возбуждаются различные участки. Возбуждаются волосковые клетки, находящиеся на этом месте, и их электрическая активность сообщает мозгу, какие частоты присутствуют в спектре Таким образом, частота тона представлена в коде, основанном на том, нейроны каких участков активны, а каких – нет
Pic.50
При действии синусоидального сигнала в слуховом нерве формируется «образец возбуждения» – скорость р
При действии синусоидального сигнала в слуховом нерве формируется «образец возбуждения» – скорость разрядов нейронов как функция места на базилярной мембране. При этом пик этого образца движется вдоль мембраны при изменении частоты. Для того чтобы слух различил два тона по высоте, необходимо, чтобы на базилярной мембране максимум смещения, соответствующий данным частотам, сместился всего на 52 мкм При действии синусоидального сигнала в слуховом нерве формируется «образец возбуждения» – скорость разрядов нейронов как функция места на базилярной мембране. При этом пик этого образца движется вдоль мембраны при изменении частоты. Для того чтобы слух различил два тона по высоте, необходимо, чтобы на базилярной мембране максимум смещения, соответствующий данным частотам, сместился всего на 52 мкм Таким образом, можно считать, что периферическая слуховая система содержит банк полосовых фильтров («слуховых фильтров») с перекрывающимися полосами. Их ширина свыше 1 кГц составляет примерно 10-17% от центральной частоты
Pic.51
«Слуховые фильтры»
«Слуховые фильтры»
Pic.52
Методы определения высоты Локализовать место фундаментальной частоты и по нему определить высоту тон
Методы определения высоты Локализовать место фундаментальной частоты и по нему определить высоту тона Найти минимальную частотную разницу между соседними гармониками, равную фундаментальной частоте: , (8) где n =1,2,3, … и принять её за основу при распознавании высоты 3. Найти общий наибольший сомножитель, который получается при делении всех гармоник на последовательные целые числа, и использовать его как базу для определения частоты.
Pic.53
Метод 1 Присутствие фундаментальной частоты является обязательным для определения высоты звука Но в
Метод 1 Присутствие фундаментальной частоты является обязательным для определения высоты звука Но в 1940 году Шутен продемонстрировал, что ощущение высоты тона не изменится, если вырезать в музыкальном тоне фундаментальную частоту. Этот эффект получил название «феномен пропущенной фундаментальной» и доказал, что метод 1 не может служить единственной базой для определения высоты сложного тона, хотя он работает для большинства музыкальных звуков.
Pic.54
Метод 2 Для большинства музыкальных звуков соседние гармоники обычно присутствуют. Слуховая система,
Метод 2 Для большинства музыкальных звуков соседние гармоники обычно присутствуют. Слуховая система, оценивая положение их максимумов на базилярной мембране, вычисляет частотную разницу между ними и по ней определяет высоту Но если подать звук, в котором присутствуют только нечётные гармоники f0, 3f0, 5f0, 7f0, например, 100 Гц, 300 Гц, 500 Гц, 700 Гц и др. Если фундаментальная частота есть в спектре, то слух определяет высоту по ней f0=100 Гц. Если её вырезать, то расстояние между гармониками останется равным 2f0, но слух продолжает определять высоту тона, равную фундаментальной f0=100 Гц.
Pic.55
Метод 3 Позволяет объяснить и пропущенную фундаментальную частоту, и наличие только нечётных гармони
Метод 3 Позволяет объяснить и пропущенную фундаментальную частоту, и наличие только нечётных гармоник, т. к. от отсутствия каких-либо гармоник общий наибольший сомножитель 100 Гц не меняется. Этот метод позволяет также объяснить восприятие слабого ощущения высоты тона у колоколов и других источников квазипериодических тонов.
Pic.56
Выводы теории места Механизм места разворачивает данную гармонику, если критическая полоса её слухов
Выводы теории места Механизм места разворачивает данную гармонику, если критическая полоса её слухового фильтра, построенного на ней как на срединной частоте, достаточна узкая и соседние гармоники внутрь этого фильтра не попадают Если гармоники находятся настолько близко по частоте друг от друга, что внутрь одного слухового фильтра попадает несколько гармоник, то они не разворачиваются. Какой бы ни была фундаментальная частота, слуховой механизм разворачивает только первые 6-7 гармоник – именно они и являются определяющими при определении высоты звука
Pic.57
Выводы теории места Теория места создаёт базис для понимания того, как можно определить высоту путём
Выводы теории места Теория места создаёт базис для понимания того, как можно определить высоту путём анализа гармонического ряда, но эта теория не может объяснить ряд проблем, например, очень высокая точность определения высоты звука для тонов, чьи частотные компоненты не разворачиваются (т. е. звуки с гармониками выше седьмой).
Pic.58
Временная теория Эта теория использует синхронизацию разрядов нейронов органа Корти с фазой колебани
Временная теория Эта теория использует синхронизацию разрядов нейронов органа Корти с фазой колебания базилярной мембраны (эффект запирания фазы). При смещениях определённой точки мембраны в сторону расположения волосковых клеток в них возникает электрический потенциал, при смещении в противоположную сторону потенциал отсутствует. Благодаря фазовому запиранию время между импульсами в любом отдельном волокне будет равно целому числу 1, 2, 3, …, умноженному на период в основной звуковой волне
Pic.59
Основа временной теории – анализ формы волны в различных частях базилярной мембраны. Если рассматрив
Основа временной теории – анализ формы волны в различных частях базилярной мембраны. Если рассматривать механизм частотного анализа на базилярной мембране как работу линейки фильтров различной ширины, то форма волны звукового сигнала, выходящего из этого набора фильтров, должна иметь такой вид:
Pic.60
Волновая форма выходного сигнала для фильтра, центральная частота которого выше шестой, не синусоида
Волновая форма выходного сигнала для фильтра, центральная частота которого выше шестой, не синусоидальная, т. к. гармоники не разворачиваются индивидуально, демонстрируя, что частотный диапазон полосового фильтра шире, чем расстояния между ними. По меньшей мере две гармоники комбинируются на выходе этого фильтра. Известно, что если две частоты находятся достаточно близко друг от друга, между ними возникают биения, т. е. амплитудно модулированное колебание с частотой модуляции, равной разности частот. В данном случае, когда взаимодействуют две гармоники, этот период определяется фундаментальной частотой T=1/f0. Таким образом, период всех волн, выходящих после фильтров с центральной частотой выше шестой гармоники и состоящих из соседних гармоник, будет одинаковым и равным 1/f0. Волновая форма выходного сигнала для фильтра, центральная частота которого выше шестой, не синусоидальная, т. к. гармоники не разворачиваются индивидуально, демонстрируя, что частотный диапазон полосового фильтра шире, чем расстояния между ними. По меньшей мере две гармоники комбинируются на выходе этого фильтра. Известно, что если две частоты находятся достаточно близко друг от друга, между ними возникают биения, т. е. амплитудно модулированное колебание с частотой модуляции, равной разности частот. В данном случае, когда взаимодействуют две гармоники, этот период определяется фундаментальной частотой T=1/f0. Таким образом, период всех волн, выходящих после фильтров с центральной частотой выше шестой гармоники и состоящих из соседних гармоник, будет одинаковым и равным 1/f0.
Pic.61
Минимальное время между импульсами от различных мест на базилярной мембране определяется периодом во
Минимальное время между импульсами от различных мест на базилярной мембране определяется периодом волны, выходящей от соответствующего фильтра. Для мест, соответствующих частотам от основной до шестой гармоники, минимальное время равно периоду данной гармоники. Для мест, соответствующих более высоким гармоникам, промежутки между импульсами равны периоду огибающей, т. е. основному тону. Таким образом, выше шестой гармоники разряды нейронов синхронизированы с формой огибающей, и период разрядов совпадает с периодом для фундаментальной частоты. Иными словами, для всех гармоник периоды разрядов или равны, или отличаются в целое число раз от частоты основного тона.
Pic.62
Основа временной теории восприятия высоты тона Мозг определяет периодичность разрядов и по ним восст
Основа временной теории восприятия высоты тона Мозг определяет периодичность разрядов и по ним восстанавливает частоту основного тона. Восприятие музыкальной высоты связано с оценкой временной формы звукового сигнала (за счёт использования эффекта «фазового запирания»)
Pic.63
Выводы временной теории Временная теория позволяет понять, как найти фундаментальную частоту на осно
Выводы временной теории Временная теория позволяет понять, как найти фундаментальную частоту на основе анализа временных интервалов между нервными импульсами от различных мест на базилярной мембране и по ней определить высоту тона. Но временная теория не объясняет восприятия высоты тона на частотах выше 5000 Гц, т. к. эффект фазового запирания не срабатывает на этих частотах. Вероятно, в этой области частот меняется механизм восприятия высоты тона.
Pic.64
Современная теория восприятия высоты тона Согласно современным теориям, мозг принимает информацию от
Современная теория восприятия высоты тона Согласно современным теориям, мозг принимает информацию от периферийной слуховой системы как за счёт индикации места (частотный анализ), так и за счёт информации о форме звуковой волны (временной анализ).
Pic.65
Современная модель для восприятия высоты тона
Современная модель для восприятия высоты тона
Pic.66
Анализ восприятия высоты музыкального тона с помощью предложенной модели позволил получить ряд интер
Анализ восприятия высоты музыкального тона с помощью предложенной модели позволил получить ряд интересных результатов: Для музыкальных тонов с основной частотой от 100 до 400 Гц (с уровнем звукового давления не менее 50 дБ) основную роль в определении высоты тона играют первые пять-шесть гармоник (если их уровень превышает 10 дБ), т. е. те гармоники, которые разворачиваются слуховыми фильтрами Звуковые сигналы, содержащие только очень высокие гармоники (свыше двадцатой), не вызывают ощущения высоты тона Музыкальные сигналы, содержащие очень низкие частоты (с основной частотой ниже 50 Гц) вызывают ощущение высоты тона только по обертонам, т. к. такие низкие частоты не вызывают смещений базилярной мембраны – они на ней не размещаются, им не хватает места. При этом наиболее существенную роль играют пятые-шестые гармоники Фундаментальная частота звука, если она выше 1000 Гц, является доминантной компонентой в определении высоты тона
Pic.67
Музыкальные звуки, содержащие только неразвёрнутые гармоники (свыше шестой), могут дать ощущение выс
Музыкальные звуки, содержащие только неразвёрнутые гармоники (свыше шестой), могут дать ощущение высоты тона по огибающей, при этом слух производит достаточно тонкую дифференциацию сдвига максимума огибающей, т. е. точно ощущает высоту. Музыкальные звуки, содержащие только неразвёрнутые гармоники (свыше шестой), могут дать ощущение высоты тона по огибающей, при этом слух производит достаточно тонкую дифференциацию сдвига максимума огибающей, т. е. точно ощущает высоту. Фазовые соотношения различных гармоник в музыкальном сигнале оказывают влияние на восприятие высоты, т. к. их изменение приводит к изменению структуры огибающей для высших неразвёрнутых гармоник. Для музыкальных сигналов, содержащих много низких и высоких гармоник, изменение фазовых соотношений может привести к улучшению чёткости восприятия высоты, не вызывая её сдвига (т. к. они не влияют на оценку низших развернутых гармоник). Для сигналов, содержащих в основном высокие гармоники, изменение их фазы может вызвать сдвиг высоты тона и изменение его чёткости, т. к. может привести к сдвигу пиков в огибающей, по которым и определяется высота тона.
Pic.68
Обработка звуковой информации в мозге В настоящее время принята гипотеза, что мозг, получив информац
Обработка звуковой информации в мозге В настоящее время принята гипотеза, что мозг, получив информацию от периферической слуховой системы о наличии компонент с кратными периодами в музыкальном звуке, группирует их и сравнивает с гармоническим шаблоном, в котором имеются все последовательные гармоники Если к данному сигналу подходят два шаблона с разными фундаментальными частотами, можно ожидать услышать или неопределённую высоту, или две высоты
Pic.69
Применение теории восприятия высоты тона к программе В программе был применён 1 метод теории места,
Применение теории восприятия высоты тона к программе В программе был применён 1 метод теории места, в результате чего возникает «феномен пропущенной фундаментальной» Было решено воспользоваться вторым методом теории места, т. е. находить два пика, соответствующих соседним гармоникам (двум обертонам или обертону и фундаментальной частоте), находить разность их частот и принимать её за фундаментальную частоту
Pic.70
Возникшие проблемы Но возникла проблема: в амплитудном спектре пик с максимальной среди всех других
Возникшие проблемы Но возникла проблема: в амплитудном спектре пик с максимальной среди всех других амплитудой оказался как бы размазанным, то есть на расстоянии одного или совсем небольшого числа отсчётов есть пики, меньшие по амплитуде, чем обертон, но большие, чем все остальные, но расположенные практически в том же месте спектра. Это т. н. эффект размазывания, из-за которого воспользоваться вторым методом теории места невозможно, если его (эффект) не устранить, потому что вместо двух соседних обертонов определяется размазанный один и тот же.
Pic.71
Оптимизация программы для определения частоты аудиосигнала, слайд 71
Pic.72
Заключение В ходе данной работы был изучен и реализован алгоритм быстрого преобразования Фурье по ос
Заключение В ходе данной работы был изучен и реализован алгоритм быстрого преобразования Фурье по основанию два с прореживанием по времени, в результате чего скорость работы программы многократно возросла. Была изучена теория восприятия высоты тона, в результате чего была установлена причина ошибочного определения фундаментальной частоты и найдены методы избегания данной ошибки. Но при попытке применить эти методы была определена ещё одна нерешённая проблема: эффект размазывания.
Pic.73
Вследствие чего задачами и перспективами дальнейших исследований являются Изучить и устранить эффект
Вследствие чего задачами и перспективами дальнейших исследований являются Изучить и устранить эффект размазывания; Применить второй метод теории места; Применить временную теорию, т. е. задействовать фазовый спектр; Для снижения влияния помех реализовать оконное преобразование Фурье; Реализовать анализ аудиосигнала непосредственно со звукоснимающего устройства в режиме реального времени, сделать тюнер.


Скачать презентацию

Если вам понравился сайт и размещенные на нем материалы, пожалуйста, не забывайте поделиться этой страничкой в социальных сетях и с друзьями! Спасибо!