Skaitmeninio garso technologija

Kaip muzika tapo nuliais ir vienetais

Prisimenu, kaip vaikystėje klausydavausi kasetės grotuve – reikėjo atsargiai įkišti kasetę, užsukti pieštuku, kad juosta nesusiveltų, o garsas kartais tekšėdavo ir virpdavo. Dabar tiesiog spaudžiu mygtuką telefone ir groja bet kokia daina iš milijonų pasirinkimų. Tarp šių dviejų pasaulių – didžiulė technologinė revoliucija, kuri vadinasi skaitmeninio garso technologija.

Skaitmeninis garsas iš esmės yra būdas paversti garso bangas, kurias girdime ore, į skaičių seką, kurią gali saugoti ir apdoroti kompiuteriai. Skamba paprasta, bet už šio proceso slypi fascinuojanti fizikos, matematikos ir inžinerijos kombinacija. Kai mikrofonas užfiksuoja jūsų balsą ar muzikos instrumentą, jis paverčia garso bangas elektriniais signalais. Čia prasideda magija – šie analoginiai signalai turi būti “išversti” į skaitmeninę kalbą.

Analoginio pasaulio vertimas į skaitmeninį

Pagrindinis skaitmeninio garso kūrimo procesas vadinasi analoginiu-skaitmeniniu keitikliu (ADC – Analog-to-Digital Converter). Šis įrenginys atlieka du pagrindinius veiksmus: ėmimą (sampling) ir kvantavimą (quantization). Skamba sudėtingai, bet iš tikrųjų principas gana paprastas.

Įsivaizduokite, kad filmuojate judantį objektą fotoaparatu. Jei darytumėte nuotrauką kas sekundę, gautumėte šiokį tokį judėjimo įspūdį, bet labai trūkčiojantį. Jei fotografuotumėte 24 kartus per sekundę (kaip kine), judėjimas atrodytų sklandus. Tas pats principas taikomas garsui – tik čia reikia daug dažniau “fotografuoti”.

Standartinis CD kokybės garsas “fotografuojamas” 44 100 kartų per sekundę. Tai vadinama ėmimo dažniu (sample rate). Kodėl būtent tiek? Ogi todėl, kad žmogaus ausis girdi dažnius iki maždaug 20 000 Hz, o pagal Nyquist-Shannon teoremą, norint tiksliai užfiksuoti signalą, reikia jį “fotografuoti” bent du kartus dažniau nei aukščiausias dažnis. Taigi 44 100 Hz su kaupu užtikrina, kad užfiksuosime visus mums girdimus garsus.

Kiekvieno tokio “kadro” metu įrenginys išmatuoja garso bangos amplitudę – kitaip tariant, koks stiprus yra garsas tuo konkrečiu momentu. Šis matavimas paverčiamas skaičiumi. CD atveju naudojami 16 bitų skaičiai, o tai reiškia, kad kiekvienas matavimas gali turėti vieną iš 65 536 skirtingų reikšmių. Kuo daugiau bitų, tuo tiksliau galima užfiksuoti garso stiprumo niuansus.

Kaip skaitmeninis garsas grįžta į mūsų ausis

Turėti garsą kaip skaičių seką yra puiku kompiuteriui, bet mūsų ausys neskirtos klausytis nulių ir vienetų. Čia į pagalbą ateina skaitmeninis-analoginis keitiklis (DAC – Digital-to-Analog Converter), kuris atlieka atvirkštinį procesą. Jis paima tuos skaičius ir vėl paverčia elektriniais signalais, kurie galiausiai juda į garsiakalbius ar ausines.

Moderniuose įrenginiuose šis procesas vyksta neįtikėtinu tikslumu. Jūsų telefone, kompiuteryje ar muzikos grotuve yra specialūs lustai, kurie milijonus kartų per sekundę konvertuoja skaitmeninius duomenis į analoginius signalus. Ir nors teoriškai kiekvienas tokios konversijos etapas gali pridėti iškraipymų, šiuolaikinė technologija yra tokia pažengusi, kad dauguma žmonių negali atskirti originalaus garso nuo skaitmeniškai užfiksuoto ir atkurto.

Suspaudimo menas ir mokslas

Viena didžiausių skaitmeninio garso problemų – failų dydis. Jei apskaičiuotume, kiek vietos užima viena CD kokybės daina, gautume maždaug 30-50 megabaitų. Dabar įsivaizduokite savo muzikos biblioteką su tūkstančiais dainų – greitai pritrūktų vietos. Čia į žaidimą įsijungia garso suspaudimo algoritmai.

Yra du pagrindiniai suspaudimo tipai: be nuostolių (lossless) ir su nuostoliais (lossy). Pirmasis, kaip FLAC ar ALAC formatai, sumažina failo dydį nenumesdamas nė vieno garso duomenų bito. Jie veikia panašiai kaip ZIP archyvai – randa pasikartojančius duomenų šablonus ir juos užkoduoja efektyviau. Paprastai tokiu būdu galima sutaupyti apie 50-60% vietos.

Įdomesni yra lossy formatai, tokie kaip MP3, AAC ar OGG. Jie naudoja psichoakustikos principus – mokslo šaką, kuri tiria, kaip žmonės girdi garsus. Pasirodo, mūsų ausys ir smegenys nėra tobuli – kai kuriuos garsus girdime geriau, kitus blogiau, o kai kurie garsai tiesiog “užgožia” kitus. MP3 algoritmas išmeta tuos garso komponentus, kurių mes vis tiek negirdėtume arba vos vos pastebėtume. Rezultatas – failas 10-12 kartų mažesnis, bet daugumoje situacijų skirtumas nuo originalo vos pastebimas.

Žinoma, audiofiliams tai skamba kaip erezija. Jie teisingai nurodo, kad kažkas vis tiek praranda, net jei to nesąmoningai negirdime. Todėl dabar, kai saugojimo vietos problema tapo mažiau aktuali (dėkui, pigiai atminčiai), vis populiaresni tampa lossless formatai. Spotify, Apple Music ir kiti srautinio perdavimo servisai jau siūlo “Hi-Fi” ar “Lossless” parinktis.

Nuo vinilo iki streaming – evoliucijos kelias

Skaitmeninio garso istorija prasidėjo dar 1960-aisiais, kai pirmieji eksperimentai su garso skaitmenimu buvo atliekami didelėse kompiuterių sistemose. Bet tikroji revoliucija prasidėjo 1982 metais, kai Sony ir Philips pristatė kompaktinį diską (CD). Tai buvo pirmasis masinis skaitmeninio garso formatas eiliniams vartotojams.

CD buvo stebuklas savo laikais. Nereikėjo jaudintis dėl subraižytos plokštelės, nereikėjo persukti juostos, o garsas buvo vienodai geras ir pirmą, ir šimtą kartų klausantis. Žmonės pradėjo perkelti savo vinilo kolekcijas į CD, nors kai kurie audiofilijai iki šiol tvirtina, kad analoginis vinilas skamba “šilčiau” ir “natūraliau”.

Paskui atėjo 1990-ieji ir MP3 formatas. Pradžioje jis buvo naudojamas daugiausiai techninėms reikmėms, bet greitai žmonės suprato, kad gali dalintis muzika internetu. Napster, LimeWire ir kiti failų dalijimosi tinklai pakeitė muzikos industriją amžiams. Staiga galėjai turėti tūkstančius dainų savo kompiuteryje, nors ir ne visada legaliai.

iPod, pristatytas 2001 metais, padarė nešiojamą skaitmeninę muziką madinę ir patogią. “1000 dainų tavo kišenėje” – šis šūkis tikrai atspindėjo revoliuciją. O dabar? Dabar net nereikia nieko saugoti savo įrenginyje – tiesiog srautiname milijonus dainų iš debesų.

Kaip veikia streaming platformos

Kai spaudžiate “play” mygtuką Spotify ar kitoje platformoje, vyksta daug daugiau, nei galėtumėte pagalvoti. Pirma, sistema turi nustatyti, kokios kokybės srautą jums siųsti – tai priklauso nuo jūsų interneto greičio ir pasirinkto kokybės nustatymo. Dažniausiai naudojamas adaptyvus srautinis perdavimas, kuris automatiškai keičia kokybę priklausomai nuo tinklo sąlygų.

Muzikos failas yra suskaidytas į mažus gabalėlius – paprastai po keletą sekundžių. Jūsų įrenginys pradeda atsisiųsti pirmąjį gabalėlį ir iš karto jį groja, tuo pačiu metu fone atsisiunčiant kitus. Tai vadinama buferizavimu. Jei internetas sulėtėja, įrenginys gali groti jau atsisiųstą dalį, kol laukia kitos. Jei viskas visiškai sustoja – išgirstate tą nemalonų tylos momentą.

Įdomu tai, kad platformos naudoja įvairius triukus, kad sumažintų duomenų naudojimą ir pagerintų patirtį. Pavyzdžiui, jos gali iš anksto atspėti, kokią dainą greičiausiai klausysite toliau (pagal jūsų istoriją ir kitų vartotojų elgesį) ir pradėti ją atsisiųsti dar prieš jums paspaudus “play”. Taip pat jos saugo populiariausias dainas serveriuose, kurie yra geografiškai arčiau jūsų, kad sumažintų vėlavimą.

Garso redagavimas ir kūryba skaitmeniniame amžiuje

Skaitmeninio garso technologija ne tik pakeitė, kaip klausome muzikos, bet ir kaip ją kuriame. Šiuolaikinė muzikos studija gali būti tiesiog nešiojamas kompiuteris su ausinėmis. DAW (Digital Audio Workstation) programos, tokios kaip Ableton, Logic Pro ar FL Studio, suteikia galimybes, apie kurias analoginių technologijų laikais galėjo tik svajoti.

Galite įrašyti neribotą kiekį takelių, redaguoti kiekvieną garso fragmentą iki miliosekundės tikslumo, pridėti efektų, kurie anksčiau reikalavo brangios aparatūros. Padarėte klaidą? Nesvarbu – tiesiog atšaukite ir įrašykite iš naujo. Norite, kad būgnai skambėtų stipriau? Tiesiog pakelkite jų takelį. Norite pridėti reverberaciją, tarsi grotumėte katedroje? Yra tam pluginas.

Bet čia yra ir tam tikras paradoksas. Turėdami beribės galimybes, kartais sunku priimti sprendimus. Kai galite tobulinti kiekvieną notą, kiekvieną garsą iki begalybės, kada sustoti? Kai kurie muzikantai sako, kad analoginių technologijų apribojimai iš tikrųjų skatino kūrybiškumą – turėjai dirbti su tuo, ką turėjai, ir dažnai būtent “netobulumai” suteikdavo muzikai charakterio.

Praktiniai patarimai dirbantiems su skaitmeniniu garsu

Jei įrašinėjate muziką ar podcastus, yra keletas dalykų, kuriuos verta žinoti. Pirma, visada įrašinėkite aukštesne kokybe nei galutinis rezultatas. Jei planuojate publikuoti MP3, vis tiek įrašykite WAV ar FLAC formatu su 48 kHz ar net 96 kHz ėmimo dažniu. Visada galite sumažinti kokybę vėliau, bet negalite jos padidinti.

Antra, stebėkite savo įrašo lygius. Skaitmeniniame pasaulyje yra griežta riba – 0 dBFS (decibels Full Scale). Jei signalas viršija šią ribą, gaunate iškraipymą, vadinamą clipping, kurio negalima ištaisyti. Geriausia praktika – laikyti piko lygius apie -6 dB ar žemiau įrašymo metu, palikdami sau “galvos erdvę” (headroom) vėlesniam apdorojimui.

Trečia, investuokite į padorų garso sąsają (audio interface). Jūsų kompiuterio integruota garso kortelė greičiausiai nėra labai gera – ji sukurta kaštų efektyvumui, o ne kokybei. Net nebrangus garso sąsaja už 100-200 eurų turės gerokai geresnius ADC/DAC keitiklius ir mažiau triukšmo.

Ketvirta, nepamirškite akustikos. Net geriausias įrašymo įrenginys negali kompensuoti blogos kambario akustikos. Jei įrašinėjate tuščiame kambaryje su kietomis sienomis, garsas atsispindės ir sukurs aidas. Paprastos putplasčio plokštės ar net antklodės ant sienų gali labai pagerinti situaciją.

Ateities garsai – kur link judame

Skaitmeninio garso technologija ir toliau sparčiai vystosi. Viena įdomiausių krypčių – erdvinis garsas (spatial audio). Dolby Atmos, Sony 360 Reality Audio ir panašios technologijos kuria trimačią garso erdvę, kur garsai gali ateiti iš bet kurios krypties, net iš viršaus ar apačios. Tai jau nebėra tik kino teatrų privilegija – dabar tai galite patirti net su paprastomis ausinėmis.

Dirbtinis intelektas taip pat keičia žaidimo taisykles. AI algoritmai jau dabar gali atskirti atskirus instrumentus iš pilno mikso, pašalinti triukšmą iš įrašų, net atkurti sugadintą ar žemos kokybės garsą. Yra programų, kurios gali paimti seną, prastos kokybės įrašą ir “atspėti”, kaip jis turėjo skambėti, užpildant trūkstamą informaciją.

Kitas įdomus dalykas – haptinis grįžtamasis ryšys. Tai technologija, kuri leidžia ne tik girdėti, bet ir jausti muziką per vibraciją. Kai kurie gamintojai jau eksperimentuoja su drabužiais ir aksesuarais, kurie verčia garso bangas į fizines vibraciją, suteikdamos visiškai naują muzikos patyrimo dimensiją.

Ir žinoma, kokybė toliau auga. Jau dabar galite srautiškai klausytis 24-bit/192 kHz kokybės muzikos, kuri teoriškai viršija žmogaus klausos galimybes. Ar tai reikalinga? Gal ir ne, bet technologija leidžia, tai kodėl gi ne.

Skaitmeninio garso kelionė nuo pirmųjų eksperimentų iki šių dienų streaming platformų rodo, kaip technologija gali fundamentaliai pakeisti mūsų santykį su muzika ir garsu apskritai. Tai, kas kadaise reikalavo didelių studijų ir brangios įrangos, dabar tilpsta mūsų kišenėse. O svarbiausia – muzika tapo prieinamesnė nei bet kada istorijoje. Nesvarbu, ar esate kūrėjas, ar klausytojas, skaitmeninis garsas atvėrė duris į galimybes, kurias sunku net įsivaizduoti. Ir tai tik pradžia.