četvrtak, 12. ožujka 2015.

Digitalna obrada akustičnih signala - 1. Uvod

Digitalna obrada akustičnih signala


1. Uvod


Kako bih što brže prešao na neke aktuelne rezultate do kojih sam došao u zadnja dva-tri dana, staviću sve one teme neophodne za razumjevanje ovoga posta kao zasebne teme u crveno i na njih ću se vratiti nekom drugom prilikom.

Ukratko rečeno, započeo sam s analizom frekvencijskih spektara muzičkih instrumenata. Kao prvo, u tu svrhu je valjalo naći odgovarajući materijal, po mogućnosti muzičke primjere u kojima sviraju solo-instrumenti, kako bi se stvari pojednostavile (iskreno rečeno, krenuo sam i sa spektralnom analizom "Patetične simfonije" P. I. Čajkovskog, ali - prema očekivanju - tu nisam daleko stigao). 

Za neke od isntrumenata (npr. klavir, gitara, violina, orgulje), to nije bio nikakav problem, pošto postoji veliki klasični repertoar za te instrumente. Za većinu drugih je to već bilo već teže, jer je repertoar tu već puno manji. Osim analize muzike, paralelno radim i na spektralnoj analizi govora, što isto tako zaslužuje nekoliko zasebnih postova.

Kod izbora instrumenta za prvi pokušaj sam na kraju izabrao flautu, jer mi se čini najjednostavnija za analizu, i to iz jednostavnog razloga - na njoj je moguće svirati samo jedan ton, dok kod većine drugih to nije slučaj, jer su ondje mogući akordi, tj. istovremeno sviranje nekoliko tonova, što dodatno komplicira stvari.

Prva stvar, koju valja imati u vidu, je odabir muzičkog formata. Zbog jednostavnosti sam odabrao mp3-format, iako bi wav-format bio vjerniji originalu. Osim toga, bilo bi interesantno napraviti usporedbu frekvencijskih spektara mp3 i wav-formata i vidjeti kolika je razlika u frekvencijskim spektrima kod ova dva formata, ovisno o vrsti signala (muzike ili govora) i o razini komprimiranja kod mp3-formata (u tom pogledu je naročito interesantno prepoznavanje govora uz prisutnost smetnji, npr. kod prenosa signala telefonom)

Sâm proces analize isto tako zaslužuje zasebni post, naime fast-fourier-transform (FFT), baš kao i implementacija FFT-a u MATLAB-u. Kako je samplovanje (sampling) muzičkih signala na CD-u 44100 samplova/sekundi i kanalu (kojih je 2), to određuje iznose vremenske i frekvencijske rezolucije. Ukoliko, npr. za uzorak uzmemo 4096 (4k) samplova, vremenska rezolucija je 93 ms, dok je frekvencijska rezolucija 10,77 Hz. Kako nas kod instrumenata zanima i frekvencijski spektar i vremenski tok signala, tj. tona, neophodno je napraviti nekoliko FFT-analiza s različitim "prozorima", kako bi se došlo do svih relevantnih podataka.

A sada nekoliko riječi o prvim rezultatima za flautu. 


Na slici se vidi analiza spektara za prozor od 8k-samplova (vremenska rezolucija 186 ms, frekvencijska rezolucija 5,38 Hz). Gornji dijagram pokazuje ukupnu jačinu signala (korijen sume kvadrata amplituda svih frekvencija) i amplitude 10 najvećih signala, dok donji dijagram pokazuje frekvencije tih 10 najjačih pojedinačnih signala). Za detaljnu analizu pripremio sam još nekoliko isječaka iz gornjeg dijagrama.

Ovaj isječak je s početka dijagrama i na donjem se dijelu lijepo vidi kako se među 10 najjačih signala nalaze frekvencije oko osnovnog tona (oko 165-te frekvencije, tj. 165 x 5.38 Hz = 880 Hz, ton A5), te prvi harmonik (tj. dvostruka frekvencija osnovnog tona), što je tipična pojava za većinu muzičkih instrumenata. 










Ovaj drugi isječak je uzet nešto kasnije (samplovi 17 - 23) i tu vidimo da je svih 10 najjačih pojedinačnih amplituda smješteno oko osnovne frekvencije, dok su viši harmonici puno manji. Isto tako, ukoliko ovaj dio pogledamo na prvom, velikom dijagramu, vidjećemo da je signal ovdje najjači po apsolutnoj amplitudi, pa možemo zaključiti da se s jačanjem zvuka širi i frekvencijski pojas osnovnog tona, što će biti bitan detalj kasnije kod sinteze zvuka instrumenta. Kao potvrdu te tendencije, može se navesti i slijedeći isječak iz dijagrama:






Ovaj je isječak sa samog kraja dijagrama i na njemu možemo vidjeti da se među 10 najvećih pojedinačnih amplituda nalazi nekoliko tonova oko osnovne frekvencije, ali i prvi i drugi harmonik. Intenzitet samog signala na tom je dijelu dosta nizak i to nam govori da je frekvencijska širina osnovnog signala u ovom slučaju manja, te da ona općenito ovisi o jačini signala (tj. što je jači signal, to je širi njegov frekvencijski pojas).

Ovaj dijagram je napravljen u Excel-u, na osnovu rezultata (tj. kompletnih spektara) ispisanih u MATLAB-u.