Grupa inovatora sa Univerziteta u Vašingtonu, predvođena profesorom Šajamom Golakotom, osmislila je slušalice sa kamerama pod nazivom VueBuds.
Oni su kamere veličine zrna pirinča integrisali u standardne bežične Sony slušalice.
Takođe su u njih ugradili vizuelno-jezički model (VLM), vrstu veštačke inteligencije koja može istovremeno da razume i obrađuje slike i tekst. Na taj način korisnici slušalica mogu glasovno postavljati pitanja i dobijati odgovore o onome što vide.
Slušalice u fazi razvoja
Golakota je za medije izjavio da su VueBuds slušalice vrlo brze i troše samo 5 milivata (mW). Ipak, opremljene su crno-belim kamerama niske rezolucije. Naglasio je da su još u fazi razvoja, ali da su na testiranjima pokazale zavidnu tačnost. U testu sa 16 učesnika, VueBuds su bili tačni u oko 83% slučajeva pri identifikaciji objekata i prevođenju, a čak 93% pri prepoznavanju naslova knjiga i autora.
– To znači da ćemo uskoro moći da čitamo i prevodimo natpise sa kineskog ili drugih jezika, a uređaj predstavlja snažnu platformu za vizuelnu inteligenciju sa naprednim VLM mogućnostima u slušalicama, uređajima koje ljudi širom sveta nose – rekao je Golakota.
Logično pitanje je kako funkcionišu na oba uha, ali istraživači objašnjavaju da zahvaljujući stereoskopskom vidu veštačka inteligencija VueBuds spaja dve odvojene slike kamera u jednu.
Postoji jedno ograničenje
Ipak, inovacija ima ograničenja. Monohromatske kamere znače da VueBuds ne mogu da odgovore na pitanja o bojama, pa se radi na uvođenju kamera više rezolucije. Takođe, trenutna baterija ne može da podrži dugotrajno strimovanje velike količine podataka.
VueBuds slušalice, koje odgovaraju na glasovna pitanja o onome što vidite, čitaju tekstove i prevode ih, trenutno su u fazi naučnog prototipa i očekuje se da se na tržištu pojave tek 2027. godine, piše washington.edu.
Komentari (0)