Дигитално процесирање на аудио

Предмет: Дигитално процесирање на аудио

Код: 3ФЕИТ05003

Број на ЕКТС кредити: 6 ЕКТС

Неделен фонд на часови: 3+0+0+3

Наставник: Доц. д-р Бранислав Геразов

Цели на предметната програма (компетенции): Целта на програмата е да им овозможи на студентите да се стекнат со проширени знаења за техниките за анализа, синтеза и препознавање на аудиосигналите. Истата е дизајнирана да им ги доближи најразличните пристапи и апликации во дигиталното процесирање на аудиото, преку разгледување на најновите достигнувања.

Содржина на предметната програма: 1. Основи на дигитално аудио, принципи на дигитализација на звукот, фреквенција на семплирање, надсемплирање, џитер. 2. Работа со аудиосигналите во дигитален домен; квантизација, резолуција и шум на квантизација, дитер, обликување на шумот. 3. Фуриеова трансформација, Z-трансформација, амплитуден и фазен спектар на аудиосигналите. 4. Метода на прозорци, принцип на квазистационарност, Фуриеова трансформација на временски отсечоци (STFT), типови на прозорци и нивни карактеристики, спектрограм. 5. Основи на дигиталните филтри, филтрирање на аудиосигналите, филтри со конечен импулсен одѕив (FIR), филтри со бесконечен импулсен одѕив (IIR), типови на филтри со линеарна фазна карактеристика, дизајн на FIR филтри. 6. Ниско-пропусни (НП), високо-пропусни (ВП), филтри пропусници на опсег (ПО), филтри непропусници на опсег (НО), Notch филтри. Банки на филтри, еквализација. 7. Аудиоефекти во временски домен: Процесирање на аудиосигналите базирано на доцнење, ехо, реверберација, филтер сèпропусник (СП), Шредеров природен ревербератор, фленџ, хор, дисторзија. 8. Аудиоефекти во трансформациски домен: тремоло, вибрато, wah-wah, фејзер, роботизација, вокодер. 9. Компресија на аудиосигналите, основи на психоакустиката, компресија базирана на психоакустика, праг на чујност, маскирање, критични опсези, MP3, AAC, битска брзина. 10. Компресија на говор, основи на создавање на говорот, LP анализа на спектарот; LP10, CELP, VOCODER. 11. Примена на машинско учење во анализата на аудиосигналите, препознавање на музички инструмент, екстракција на обележја за тренинг на алгоритми за машинско учење, аудиторен спектрограм, мел-фреквенциски кепстрални коефициенти (MFCC). 12. Гаусови мешавински модели (ГММ), тренирање со максимизација на очекувањето (ЕМ), универзален позадински модел (UBM), адаптација на UBM моделот, пресметка на логаритамот од односот на веројатности (LLRM). 13. Синтеза на музички инструменти, синтеза со конкатенација.

Литература:

Задолжителна литература
Бр.	Автор	Наслов	Издавач	Година
1	Udo Zölzer	Digital Audio Signal Processing	Wiley	2008
2	Andreas Spanias, Ted Painter,‎ Venkatraman Atti	Audio Signal Processing and Coding	Wiley-Interscience	2007
Дополнителна литература
Бр.	Автор	Наслов	Издавач	Година
1	Ian McLoughlin	Applied Speech and Audio Processing: With Matlab Examples	Cambridge University Press
2	Udo Zölzer	DAFX: Digital Audio Effects	Wiley	2011
3	Julius O. Smith III	Spectral Audio Signal Processing	W3K Publishing	2011

Лични алати

делови

Дигитално процесирање на аудио