Jedna od lepših ideja savremene tehnologije jeste da ne služi samo brzini i zabavi, nego i stvarnoj samostalnosti ljudi. Upravo zato je jučerašnja priča TechXplorea o alatima zasnovanim na veštačkoj inteligenciji za slepe i slabovide korisnike toliko zanimljiva. U fokusu je studija Kornel Teka, u kojoj je 20 učesnika koristilo aplikaciju zasnovanu na multimodalnim velikim jezičkim modelima kako bi tumačili prizore oko sebe. Rezultat je bio i ohrabrujući i trezven: za jednostavna pitanja tipa „šta je ovo?” sistem funkcioniše dobro, ali kod složenijih zadataka i finijih opisa i dalje zapinje.
TechXplore navodi da su istraživači na osnovu iskustava učesnika izdvojili devet „veština” koje bi takvi modeli trebalo dodatno da razviju kako bi zaista bili korisni u svakodnevnom životu. To je važna nijansa. Dobar opis fotografije nije isto što i pomoć pri tumačenju umetničkog dela, rasporeda predmeta, prostora ili detalja koji su osobi potrebni da bi osetila tuđu perspektivu. Jedan od učesnika, kako se navodi u tekstu, pitao je sistem da mu deo po deo objasni njegovu glinenu skulpturu, kako bi razumeo kako bi je video neko ko vidi. U tom trenutku AI više nije samo alat za identifikaciju, nego most između iskustava.
Baš zato je važno što autori studije nisu ostali na oduševljenju. Tehnologija, kako kaže profesorka Širi Azenkot, jeste daleko dogurala u tumačenju vizuelnog sveta, ali je jednako važno jasno videti gde su joj rupe. To je zrela vrsta tehnološkog optimizma: ne prodavati čudo, nego precizno meriti koliko ono zaista pomaže. U vremenu u kom se AI često reklamira kao skoro gotov odgovor na sve, ovakav pristup deluje gotovo osvežavajuće.
Možda upravo zato ova vest ostavlja dobar utisak. Ne zato što tvrdi da je problem rešen, nego zato što pokazuje kako rešenje zaista nastaje — kroz stvarna iskustva korisnika, kroz priznanje ograničenja i kroz pokušaj da se pomoć učini konkretnijom i finijom. AI za slepe i slabovide osobe već sada može biti dragocen, ali još nije do kraja naučio ono što ljudi intuitivno rade: da razumeju kontekst, nijansu i nameru pitanja. A kad to jednog dana bude umeo bolje, njegova korisnost neće biti samo tehnička. Biće duboko ljudska.
S.B.
















