ZNANOST: hrvatski znanstveni portal

Pričama robote učimo ljudskim vrijednostima

Sve brži razvoj umjetne inteligencije jača strah od neetičkog ponašanja robota i mogućnosti da naude ljudima. Neki pozivaju na zabranu istraživanja o robotima, a drugi pozivaju na još više istraživanja kako bi se razumjelo kako bi se umjetna inteligencija mogla ograničiti. Ali, kako robote možemo naučiti etičkom ponašanja ako nema „uputa za uporabu“ kako biti čovjek?

Istraživači Mark Riedl i Brent Harrison iz Škole za interaktivno računanje Tehnološkog instituta u Georgiji vjeruju da odgovor leži u tehnici „Quixote“, o kojoj se raspravljalo na konferenciji AAAI-16 u Phoenixu, u Arizoni, koja se održala od 12. 2. do 17. 2. 2016.

Quixote robote uči „svrstavanju vrijednosti“ obučavajući ih da čitaju priče, uče prihvatljive nizove događaja i razumiju uspješne načine ponašanja ljudskog društva.

„Zbirka priča iz raznih kultura djecu uči kako se ponašati na društveno prihvatljiv način, uz primjere prikladnog i neprikladnog ponašanja u basnama, romanima i ostalim vrstama književnosti“, kaže Riedl. „Vjerujemo da shvaćanje priče kod robota može otkloniti psihotične pojave u ponašanju i učvrstiti izbore kojima neće nauditi ljudima, a i dalje ostvaruju svoju svrhu.“

Quixote je tehnika koja ciljeve umjetne inteligencije izjednačava s ljudskim vrijednostima nagrađivanjem društveno prihvatljivog ponašanja. Zasnovana je na Riedlovom prethodnom istraživanju – sustavu Scheherzada – koji je prikazao kako umjetna inteligencija može vršiti točan niz djela prikupljanjem priča s Interneta.

Scheherzada uči što je normalan ili „točan“ graf priče. Zatim podatke prosljeđuje Quixotu, koji ih prebacuje u „nagrađujući signal“ koji jača određeno ponašanje i kažnjava različito ponašanje tijekom pokusnog razdoblja i učenja na greškama. U osnovi Quixote uči da će biti nagrađen kad god se ponaša kao glavni lik iz priče, umjesto da se ponaša kako želi ili kao njegova suprotnost.

Na primjer, ako od robota tražite da iz ljekarne što prije donese recept za čovjeka, on bi mogao a) opljačkati ljekarnu, uzeti lijek i pobjeći; b) ljubazno razgovarati s ljekarnikom, ili c) čekati u redu. Bez svrstavanja vrijednosti i njihovog pozitivnog jačanja, robot bi naučio da je pljačka najbrži i najjeftiniji način za obavljanje zadatka. Izjednačavanjem vrijednosti iz Quixota, robota biste nagradili jer je strpljivo čekao u redu i platio za recept.

Riedl i Harrison u svom istraživanju prikazuju kako se signal za nagrađivanje na osnovu svrstavanja vrijednosti može proizvesti kako bi otkrio sve moguće korake u datoj radnji, razgranao ih po radnjama, te bi ga robot zatim koristio kako bi dobio „moguće radnje“ i dobio nagradu ili kaznu na osnovu svog izbora.

Tehnika Quixote najbolja je za robote koji imaju ograničenu svrhu, ali trebaju doći u kontakt s ljudima kako bi je ostvarili, i primitivan je prvi korak ka općem moralnom razumu umjetne inteligencije, kaže Riedl.

„Vjerujemo da umjetnu inteligenciju treba prilagoditi vrijednostima određenog društva, i time će roboti težiti izbjegavanju neprihvatljivog ponašanja“, dodaje. „Davanje sposobnosti čitanja i razumijevanja naših priča robotima mogao bi biti praktičan, ali nemoralan čin kada uopće nemamo upute za život kao čovjek.“

Istraživanje koje su znanstvenici proveli samo je prvi korak ka razumijevanju i ispravnoj uporabi umjetne inteligencije, koju još uvijek razumijevamo i trudimo se njome upravljati. Dalja istraživanja pokazat će koliko još možemo saznati i hoće li podaci koje dobijemo biti dovoljni kako bismo umjetnu inteligenciju prilagodili čovjeku i koristili za moralne i etičke radnje.

Izvor: Science Daily

Podijeli.