Kiekvieną kartą, kai atrakiname telefoną žvilgtelėjimu ar praeinama pro oro uosto saugumo patikrą, susiduriame su viena iš šiuolaikinių technologijų, kuri dar prieš keliasdešimt metų atrodė kaip mokslinės fantastikos filmo elementas. Veido atpažinimo technologija šiandien tapo kasdienybės dalimi, nors daugelis žmonių net nesusimąsto, kaip ji veikia ir kokius sudėtingus procesus slepia už akimirksniu atliekamo veiksmo.
Ši technologija gali atrodyti paprasta – juk mes patys kasdien atpažįstame šimtus veidų gatvėje, parduotuvėse ar socialiniuose tinkluose. Tačiau kompiuteriui išmokyti daryti tai, kas žmogui atrodo natūralu, prireikė dešimtmečių tyrimų ir technologinių proveržių.
Kaip kompiuteris „mato” veidą
Pradėkime nuo pagrindų – kaip kompiuteris iš viso gali „pamatyti” veidą? Skirtingai nei žmogus, kuris iš karto suvokia veidą kaip visumą, kompiuteris mato tik pikselių rinkinį – tūkstančius mažų spalvotų taškų. Veido atpažinimo sistema turi sugebėti šiame chaose rasti prasmę ir išskirti tai, kas daro kiekvieną veidą unikalų.
Pirmasis žingsnis – veido aptikimas paveikslėlyje ar vaizdo sraute. Sistema ieško tam tikrų šablonų: akių, nosies, burnos išsidėstymo, veido kontūrų. Šiuolaikinės sistemos naudoja dirbtinio intelekto algoritmus, kurie buvo „išmokyti” analizuojant milijonus veidų nuotraukų. Jie išmoko atpažinti, kad akys paprastai yra tam tikru atstumu viena nuo kitos, nosis yra per vidurį, o burna – žemiau.
Kai sistema aptinka veidą, ji pradeda analizuoti jo geometriją. Matuojamas atstumas tarp akių, nosies ilgis ir plotis, skruostikaulių išsikišimas, smakro forma. Šie matavimai sudaro unikalų kiekvieno žmogaus „veido atspaudą” – skaičių rinkinį, kuris apibūdina veido bruožus.
Nuo paprastų algoritmų iki dirbtinio intelekto
Veido atpažinimo technologijos istorija prasidėjo dar 1960-aisiais, kai mokslininkas Woodrow Bledsoe sukūrė pirmąją sistemą, kuri galėjo klasifikuoti veidus pagal tam tikrus parametrus. Tačiau tai buvo labai primityvus metodas – reikėjo rankiniu būdu pažymėti veido taškus, o sistema galėjo dirbti tik su idealiomis sąlygomis.
Tikrasis proveržis įvyko 1990-aisiais, kai buvo sukurti pirmieji automatiniai veido atpažinimo algoritmai. Jie naudojo matematines formules, kurios analizavo veido tekstūrą ir geometriją. Vienas populiariausių metodų buvo sistema, kuri veido bruožus užkoduodavo kaip matematinių funkcijų kombinaciją.
2000-ųjų pradžioje atsirado pažangesni metodai, kurie galėjo dirbti su skirtingais apšvietimo kampais ir veido pozicijomis. Tačiau tikroji revoliucija prasidėjo maždaug 2010-aisiais, kai pradėti naudoti gilieji neuronų tinklai. Šie algoritmai, įkvėpti žmogaus smegenų veikimo, galėjo „išmokti” atpažinti veidus analizuodami milžiniškas duomenų bazes.
Šiuolaikinių sistemų veikimo principai
Dabartinės veido atpažinimo sistemos veikia keliais etapais, kurie vyksta per sekundes dalis. Pirmiausia sistema naudoja specialius algoritmus, vadinamus neuronų tinklais, kurie skenuoja paveikslėlį ieškodami veido požymių. Šie algoritmai veikia panašiai kaip žmogaus regėjimo sistema – pradeda nuo paprastų linijų ir formų atpažinimo, palaipsniui sudarydami sudėtingesnį vaizdą.
Kai veidas aptinkamas, sistema išskiria raktinių taškų koordinates. Šiuolaikinės sistemos gali identifikuoti 60-80 tokių taškų – nuo akių kampučių iki lūpų kontūrų. Šie taškai sudaro unikalų kiekvieno žmogaus „veido žemėlapį”.
Toliau vyksta normalizacijos procesas – veidas sulyginamas pagal standartinę poziciją, koreguojamas apšvietimas, pašalinami triukšmai. Tai leidžia sistemai palyginti veidus nepriklausomai nuo to, kokiomis sąlygomis buvo padaryta nuotrauka.
Galiausiai sukuriamas veido „kodas” – unikalus skaičių rinkinys, kuris apibūdina visus svarbius veido bruožus. Šis kodas yra gerokai mažesnis už originalų paveikslėlį, bet išsaugo visą reikalingą informaciją atpažinimui.
Kur ir kaip naudojama šiandien
Veido atpažinimo technologija šiandien naudojama daug plačiau, nei daugelis žmonių įsivaizduoja. Akivaizdžiausi pavyzdžiai – išmanieji telefonai ir kompiuteriai. Apple Face ID sistema naudoja infraraudonųjų spindulių projektorių, kuris ant veido projektuoja daugiau nei 30 000 nematomas taškų, sukurdamas tikslų 3D veido žemėlapį.
Oro uostuose ir pasienio kontrolės punktuose šios sistemos padeda greitai identifikuoti keleivius ir aptikti ieškomas personas. Kai kuriose šalyse, pavyzdžiui, Kinijoje, veido atpažinimas naudojamas net mokėjimams atlikti – užtenka pažvelgti į kamerą, ir suma nuskaičiuojama nuo banko sąskaitos.
Prekybos centruose ir parduotuvėse ši technologija padeda kovoti su vagystėmis – sistema gali automatiškai aptikti žmones, kurie anksčiau buvo pagauti vagiant. Socialiniuose tinkluose, kaip Facebook ar Google Photos, veido atpažinimas automatiškai pažymi draugus nuotraukose.
Medicinos srityje technologija naudojama genetinių ligų diagnostikai – daugelis retų sindromų paveiks veido bruožus, ir specialios sistemos gali padėti gydytojams greičiau nustatyti diagnozę.
Technologijos apribojimai ir iššūkiai
Nors veido atpažinimo technologija padarė milžinišką pažangą, ji vis dar susiduria su nemažai iššūkių. Vienas didžiausių – tikslumas skirtingoms demografinėms grupėms. Tyrimai parodė, kad daugelis sistemų geriau atpažįsta šviesios odos vyrus nei tamsios odos moteris. Tai atsitinka todėl, kad sistemos dažnai buvo „treniruojamos” naudojant nesubalansuotas duomenų bazes.
Apšvietimo sąlygos taip pat daro didelį poveikį sistemos tikslumui. Silpnas apšvietimas, stiprūs šešėliai ar per ryškus šviesimas gali ženkliai sumažinti atpažinimo tikslumą. Veido pozicija ir kampas taip pat svarbūs – sistemos geriausia veikia, kai veidas nukreiptas tiesiai į kamerą.
Amžius kelia papildomų sunkumų. Vaikų veidai keičiasi labai greitai, todėl sistema, kuri šiandien tiksliai atpažįsta 5-metį, po metų gali jo neatpažinti. Panašiai senstantis žmogus gali palaipsniui tapti neatpažįstamas savo jaunesnėms nuotraukoms.
Dvyniai sudaro ypatingą iššūkį – jų veido bruožai gali būti tiek panašūs, kad net pažangiausios sistemos kartais juos supainioja. Nors tikslumas nuolat gerėja, šis klausimas išlieka aktualus.
Privatumo klausimai ir etinės dilemos
Su veido atpažinimo technologijos plitimu kyla vis daugiau klausimų dėl privatumo ir etikos. Skirtingai nuo kitų biometrinių duomenų, veidą praktiškai neįmanoma paslėpti – jis visada matomas viešose erdvėse. Tai reiškia, kad žmonės gali būti sekami ir identifikuojami net nesuvokdami to.
Kai kurios šalys ir miestai jau įvedė apribojimus ar visiškai uždraudė veido atpažinimo technologijos naudojimą viešose erdvėse. San Franciskas 2019 metais tapo pirmuoju didžiuoju miestu, uždraudusiu policijai ir kitoms miesto tarnyboms naudoti šią technologiją.
Kyla klausimų ir dėl duomenų saugojimo. Veido „kodai” yra jautrūs biometriniai duomenys, kurie, patekę į neteisėtas rankas, gali būti naudojami žalingiems tikslams. Skirtingai nuo slaptažodžio, kuris gali būti pakeistas, veido duomenys išlieka tie patys visą gyvenimą.
Yra ir psichologinis aspektas – nuolatinis stebėjimas gali keisti žmonių elgesį viešose erdvėse. Žinojimas, kad esi nuolat identifikuojamas ir sekamas, gali paveikti laisvės jausmą ir saviraišką.
Ateities perspektyvos ir technologiniai sprendimai
Veido atpažinimo technologija toliau sparčiai tobulėja. Vienas perspektyviausių krypčių – 3D veido modeliavimas. Vietoj plokščių nuotraukų analizės, sistemos vis dažniau naudoja erdvinius duomenis, kuriuos suteikia specialūs jutikliai ar stereo kameros. Tai leidžia tiksliau atpažinti veidus nepriklausomai nuo apšvietimo ar pozicijos.
Dirbtinio intelekto algoritmai taip pat nuolat tobulinami. Naujos architektūros, kaip „attention mechanisms” ar „transformer” tinklai, leidžia sistemoms geriau suprasti, kurie veido elementai yra svarbiausi atpažinimui. Tai padeda sumažinti klaidų skaičių ir padidinti tikslumą.
Atsiranda ir naujos technologijos, kurios bando išspręsti privatumo problemas. Pavyzdžiui, „federated learning” metodas leidžia tobulinti algoritmus nesidalijant jautriais duomenimis. Sistemos gali „mokytis” iš duomenų, bet patys duomenys lieka vietiniuose įrenginiuose.
Kuriamos ir „privatumo saugančios” technologijos, kurios gali atlikti veido atpažinimą neišsaugodamos tikrųjų biometrinių duomenų. Vietoj to naudojami užšifruoti kodai, kurie leidžia atlikti palyginimą, bet negali būti atkurti į originalų veido vaizdą.
Technologijos, keičiančios mūsų kasdienybę
Veido atpažinimo technologija puikiai iliustruoja, kaip sudėtingi matematiniai algoritmai ir dirbtinio intelekto sprendimai gali tapti kasdienybės dalimi. Tai, kas dar neseniai atrodė kaip fantastika, šiandien padeda mums atrakinėti telefonus, rasti nuotraukas ir net apsipirkti.
Tačiau kartu su galimybėmis ateina ir atsakomybė. Svarbu suprasti, kaip ši technologija veikia, kokius duomenis ji renka ir kaip juos naudoja. Tik taip galėsime priimti informuotus sprendimus apie jos naudojimą savo gyvenime ir reikalauti atsakingo požiūrio iš technologijų kūrėjų.
Ateityje veido atpažinimas tikriausiai taps dar labiau integruotas į mūsų kasdienybę, bet kartu tikimasi, kad bus rasti sprendimai, kurie leistų mėgautis technologijos teikiamais privalumais neprarandant privatumo ir saugumo. Galiausiai, geriausia technologija yra ta, kuri tarnauja žmonėms, o ne atvirkščiai.

