Kas ta Alexa ir kodėl ji mums atsakinėja
Turbūt daugelis esate girdėję apie Amazon Alexa arba net matę tuos keistus cilindrinius garsiakalbius, kurie stovi draugų namuose ir į kuriuos žmonės kreipiasi tarsi į gyvą būtybę. Kai pirmą kartą pamačiau, kaip kažkas sako “Alexa, koks oras šiandien?” ir gauna atsakymą iš plastikinio daikto, pagalvojau – na, ateitis tikrai atėjo. Bet kas gi slypi už šios technologijos?
Alexa yra Amazon sukurtas virtualus asistentas, kuris veikia naudodamas dirbtinį intelektą ir balso atpažinimo technologijas. Tai ne tik programinė įranga – tai sudėtinga sistema, kuri jungia debesų kompiuteriją, mašininį mokymąsi ir natūralios kalbos apdorojimą. Paprasčiau tariant, tai kompiuteris, kuris išmoko suprasti, ką mes sakome, ir reaguoti į tai prasmingai.
Pirmasis Alexa įrenginys – Amazon Echo – pasirodė 2014 metų lapkritį, nors iš pradžių jis buvo prieinamas tik ribotam vartotojų ratui. Amazon nebuvo pirmieji, kurie bandė sukurti balso asistentą – Apple jau turėjo Siri, o Google dirbo prie savo sprendimo. Tačiau Amazon padarė kažką kitaip: jie sukūrė ne tik programėlę telefone, bet ir atskirą įrenginį, kuris visada įjungtas, visada klauso ir visada pasiruošęs padėti.
Kaip Alexa išgirsta ir supranta mus
Technologija, kuri leidžia Alexa mus išgirsti, yra gana įdomi. Echo įrenginiuose įmontuoti keli mikrofonai – paprastai septyni ar daugiau, išdėstyti ratu aplink įrenginį. Kodėl tiek daug? Nes tai leidžia naudoti vadinamąją “beamforming” technologiją – mikrofono masyvai dirba kartu, kad nustatytų, iš kurios krypties sklinda garsas, ir sutelktų dėmesį būtent į tą kryptį, ignoruodami foninį triukšmą.
Kai pasakote “Alexa” (arba kitą pabudimo žodį, kurį galite pasirinkti), įrenginys aktyvuojasi. Įdomu tai, kad pats įrenginys neatlieka sudėtingo kalbos apdorojimo – jis tik atpažįsta pabudimo žodį lokaliai, naudodamas nedidelį procesorių. Kai tik išgirsta tą žodį, pradeda įrašinėti jūsų komandą ir siunčia ją į Amazon serverius debesyje.
Štai čia ir prasideda tikroji magija. Amazon serveriuose veikia galingos dirbtinio intelekto sistemos, kurios analizuoja jūsų balso įrašą. Pirmiausia jis konvertuojamas į tekstą naudojant automatinio kalbos atpažinimo (ASR) sistemas. Šios sistemos buvo treniruotos milijonais valandų įvairių akcentų, kalbėjimo stilių ir aplinkų įrašų.
Bet paversti garsą į tekstą – tai tik pusė darbo. Toliau įsijungia natūralios kalbos supratimo (NLU) sistema, kuri bando suprasti, ko jūs iš tikrųjų norite. Jei pasakote “Alexa, kokia temperatūra lauke?”, sistema turi suprasti, kad jūs klausiате apie orą, apie išorinę temperatūrą, ir kad jus domina dabartinė situacija, o ne prognozė.
Įgūdžiai ir ekosistema, kuri auga kaip grybai po lietaus
Vienas iš genialių Amazon sprendimų buvo padaryti Alexa atvirą platformą. Tai reiškia, kad bet kuris programuotojas gali sukurti vadinamuosius “skills” – įgūdžius, kurie išplečia Alexa galimybes. Panašiai kaip telefone įsidiegiate programėles, taip ir Alexa galite pridėti naujų funkcijų.
Šiuo metu Alexa turi dešimtis tūkstančių įgūdžių. Galite užsakyti picos iš Domino’s, klausytis vadovaujamų meditacijų, žaisti viktorinas, valdyti išmaniuosius namų įrenginius, sekti siuntas, klausytis naujienų iš konkrečių šaltinių – sąrašas beveik begalinis. Kai kurie įgūdžiai yra tikrai naudingi, kiti… na, sakykim, labiau pramoginio pobūdžio.
Kūrėjams Amazon suteikė įrankius, kurie palengvina įgūdžių kūrimą. Alexa Skills Kit (ASK) yra nemokama kūrėjų platforma su dokumentacija, pavyzdžiais ir simuliatoriais. Net ir žmonės be didelės programavimo patirties gali sukurti paprastus įgūdžius. Sudėtingesniems projektams reikia daugiau žinių, bet bendruomenė yra aktyvi ir nori padėti.
Įdomu tai, kad Amazon mokėjo pinigus kūrėjams už populiarius įgūdžius – tai paskatino daugelį eksperimentuoti ir kurti. Nors šios programos laikui bėgant keitėsi, jos padėjo sukurti gyvybingą ekosistemą, kuri dabar gyvuoja savo gyvenimą.
Išmanieji namai ir Alexa kaip centrinė valdymo sistema
Jei klaustumėte manęs, kur Alexa tikrai spindi, atsakyčiau – išmaniųjų namų valdyme. Tai viena iš sričių, kur balso valdymas iš tikrųjų turi prasmę. Kai jūsų rankos užimtos arba tiesiog tingite ieškoti telefono, galimybė pasakyti “Alexa, išjunk svetainės šviesą” yra neįtikėtinai patogu.
Alexa palaiko tūkstančius skirtingų išmaniųjų įrenginių – nuo lempučių ir termostatų iki durų spynų ir saugumo kamerų. Dauguma gamintojų dabar siekia užtikrinti suderinamumą su Alexa, nes tai tapo savotiška rinkos norma. Philips Hue lemputės, Nest termostatai, Ring durų skambučiai, Samsung televizoriai – visi jie gali būti valdomi per Alexa.
Bet tikrasis galingumas atsiskleidžia, kai pradedate kurti rutinas. Rutinos leidžia sujungti kelis veiksmus į vieną komandą. Pavyzdžiui, galite sukurti ryto rutiną: pasakius “Alexa, labas rytas”, ji gali įjungti šviesas, papasakoti oro prognozę, perskaityti naujienų santrauką ir įjungti kavos aparatą (jei jis išmanus). Vakare – “Alexa, labanakt” gali išjungti visas šviesas, užrakinti duris ir įjungti signalizaciją.
Yra ir sudėtingesnių scenarijų. Galite nustatyti, kad šviesų spalva pasikeistų priklausomai nuo oro (mėlyna, kai saulėta, pilka, kai apsiniaukę), arba kad Alexa įspėtų jus, kai skalbimo mašina baigia darbą, arba kad automatiškai sumažintų šildymą, kai išeinate iš namų.
Privatumas ir tos nepatogios akimirkos
Dabar palieskime dramblį kambaryje – privatumą. Turėti įrenginį, kuris visada klauso, daugeliui žmonių kelia nerimą. Ir tiesą sakant, tam yra priežasčių. Amazon ne kartą pateko į skandalus, susijusius su tuo, kaip tvarkomi Alexa įrašai.
Paaiškėjo, kad Amazon samdo žmones, kurie klausosi kai kurių Alexa įrašų siekdami pagerinti sistemą. Nors įrašai turėtų būti anonimiški, kai kuriuose jų buvo girdimi jautrūs pokalbiai, net asmeninė informacija. Amazon teigia, kad tai būtina mašininio mokymosi procesui, bet daugelis vartotojų apie tai nežinojo.
Yra ir kitų incidentų. Kartais Alexa aktyvuojasi netyčia, išgirdusi kažką panašaus į pabudimo žodį. Buvo atvejų, kai ji netgi išsiuntė privačius pokalbius kitiems žmonėms kontaktų sąraše – labai nemaloni situacija. Nors tokie atvejai reti, jie rodo, kad technologija nėra tobula.
Ką galite padaryti, jei norite naudoti Alexa, bet rūpinatės privatumu? Pirma, galite išjungti mikrofono mygtuką, kai nenorite, kad įrenginys klausytųsi. Antra, galite reguliariai ištrinti savo balso įrašų istoriją per Alexa programėlę. Trečia, galite atsisakyti, kad jūsų įrašai būtų naudojami tobulinimui. Ketvirta, galite nustatyti, kad įrašai būtų automatiškai trinami po tam tikro laikotarpio.
Ar tai reiškia, kad turėtumėte vengti Alexa? Ne būtinai. Bet svarbu suprasti rizikas ir priimti informuotą sprendimą. Asmeniškai manau, kad daugeliui žmonių patogumas nusveria rizikas, bet kiekvienas turi nuspręsti pats.
Kaip Alexa mokosi ir tampa protingesnė
Vienas įdomiausių Alexa aspektų yra tai, kaip ji nuolat mokosi. Kiekvieną kartą, kai kas nors visame pasaulyje bendrauja su Alexa, sistema renka duomenis, kurie padeda jai tobulėti. Tai vadinamas mašininiu mokymusi – procesas, kai algoritmai mokosi iš patirties.
Pavyzdžiui, jei daug žmonių paklausia “Alexa, kas yra Bitcoin?”, o paskui perklausia arba išreiškia nepasitenkinimą atsakymu, sistema tai užfiksuoja. Inžinieriai gali pamatyti, kad atsakymas nėra pakankamai geras, ir jį patobulinti. Arba, jei sistema pastebi, kad žmonės dažnai klausia to paties dalyko skirtingais būdais, ji išmoksta atpažinti visas tas variacijų.
Alexa taip pat mokosi iš konteksto. Jei paklausite “Kas yra Barackas Obama?”, o paskui “Kiek jam metų?”, Alexa supranta, kad “jam” reiškia Baraką Obamą. Tai vadinama kontekstinio supratimo gebėjimu, ir jis nuolat gerėja.
Įdomu tai, kad Alexa gali mokytis ir iš jūsų asmeninių įpročių. Ji pamena, kokią muziką mėgstate, kokius klausimus dažnai užduodate, kokius įrenginius valdote. Tai leidžia jai suasmeninti patirtį – pavyzdžiui, jei dažnai klausiate oro prognozės ryte, ji gali pradėti siūlyti šią informaciją savaime.
Bet čia vėl susiduria technologija ir privatumas. Kuo daugiau Alexa apie jus žino, tuo naudingesnė ji gali būti, bet tuo daugiau jūsų duomenų saugoma Amazon serveriuose. Tai amžinas kompromisas tarp patogumo ir privatumo.
Alexa už Echo ribų
Nors daugelis žmonių Alexa asocijuoja su Echo garsiakalbiais, iš tikrųjų ji dabar yra daug plačiau paplitusi. Amazon sudarė partnerystes su daugybe gamintojų, kad Alexa būtų integruota į įvairiausius įrenginius.
Galite rasti Alexa automobiliuose – Ford, BMW, Toyota ir kiti gamintojai integruoja ją į savo informacijos-pramogų sistemas. Tai leidžia vairuotojams valdyti muziką, navigaciją, net išmaniuosius namų įrenginius iš automobilio, nenukrypstant dėmesio nuo kelio.
Alexa yra ir ausinėse. Amazon Echo Buds ir kiti gamintojai siūlo ausines su integruota Alexa, leidžiančias naudotis asistentu kelyje. Tai ypač patogu sportuojant ar keliaujant viešuoju transportu.
Yra net Alexa mikrobangų krosnelėse, šaldytuvuose, veidrodžiuose, laikrodžiuose. Kai kurie iš šių produktų yra tikrai naudingi, kiti atrodo kaip sprendimas ieškantis problemos. Ar tikrai reikia, kad jūsų veidrodis galėtų papasakoti oro prognozę? Galbūt ne, bet technologija leidžia, tai kodėl gi ne.
Amazon taip pat sukūrė įrenginių liniją su ekranais – Echo Show serija. Tai keičia žaidimą, nes dabar Alexa gali ne tik pasakyti, bet ir parodyti informaciją. Galite matyti receptus, vaizdo skambučius, saugumo kamerų vaizdą, YouTube vaizdo įrašus. Tai daro Alexa daug universalesnę.
Ateitis jau čia, bet vis dar tobulėja
Nors Alexa nuėjo ilgą kelią nuo 2014 metų, ji vis dar nėra tobula. Kartais ji nesupras jūsų akcento, kartais neteisingai išgirs komandą, kartais tiesiog atsakys “Atsiprašau, nežinau to”. Bet kiekvienais metais ji tampa geresnė.
Amazon investuoja milijardus į dirbtinio intelekto tyrimus. Jie dirba su natūralesnio skambančiu balsu – naujausios versijos skamba daug mažiau robotiškai nei pirmosios. Jie tobulina kontekstinį supratimą, kad pokalbiai su Alexa būtų natūralesni. Jie plečia kalbų palaikymą – nors lietuvių kalbos dar nėra, Alexa jau kalba dešimtimis kalbų.
Viena įdomesnių naujovių yra vadinamasis “Alexa Conversations” – funkcija, kuri leidžia natūralesnius, daugiažingsnius pokalbius. Vietoj to, kad turėtumėte tiksliai formuluoti komandas, galite tiesiog kalbėti, o Alexa bandys suprasti jūsų tikslą ir užduoti patikslinančius klausimus, jei reikia.
Kita kryptis – emocinis intelektas. Amazon eksperimentuoja su technologija, kuri leistų Alexa atpažinti jūsų nuotaiką iš balso tono ir atitinkamai reaguoti. Jei skambate liūdnai, ji galėtų pasiūlyti palinksminti muziką. Jei stresui, galbūt pasiūlyti kvėpavimo pratimus. Ar tai nuostabu, ar šiek tiek bauginanti? Turbūt abu.
Taip pat matome, kaip Alexa tampa proaktyvesnė. Vietoj to, kad tik lauktų komandų, ji pradeda siūlyti informaciją ir veiksmus. “Beje, jūsų mėgstama komanda žaidžia šį vakarą” arba “Pastebėjau, kad jūsų pieno atsargos gali baigtis – ar norite užsakyti daugiau?”. Tai gali būti naudinga arba erzinanti, priklausomai nuo jūsų požiūrio.
Technologijos, kurios keitė mūsų bendravimą su mašinomis, vis dar rašo savo istoriją. Alexa buvo viena iš pirmųjų, kuri padarė balso asistentas kasdienybe milijonams žmonių. Ji parodė, kad technologija gali būti ne tik funkcionalus įrankis, bet ir kažkas, su kuo mes natūraliai bendraujame balsu. Ar ji tobula? Tikrai ne. Ar ji naudinga? Daugeliui žmonių – taip. Ar ji kelia klausimų apie privatumą ir technologijų vaidmenį mūsų gyvenime? Be abejo. Bet būtent šie klausimai ir daro šią technologiją tokią įdomią stebėti ir naudoti.

