Home Notizie recenti La tecnologia progettata per aiutare i non vedenti potrebbe trarre vantaggio dalla...

La tecnologia progettata per aiutare i non vedenti potrebbe trarre vantaggio dalla collaborazione uomo-IA

138
0

Credito: Pixabay/CC0 di dominio pubblico

La tecnologia di assistenza alla vista remota (RSA), che connette persone ipovedenti con agenti umani attraverso una videochiamata dal vivo sui loro smartphone, aiuta le persone ipovedenti o assenti a navigare in attività che richiedono la vista. Ma cosa succede quando la tecnologia di visione artificiale esistente non supporta completamente un agente nel soddisfare determinate richieste, come leggere le istruzioni su un flacone di medicinali o riconoscere le informazioni di volo sullo schermo digitale di un aeroporto?

Secondo i ricercatori del Penn State College of Information Sciences and Technology, ci sono alcune sfide che non possono essere risolte con le tecniche di visione artificiale esistenti. Invece, i ricercatori ipotizzano che sarebbero affrontati meglio dagli esseri umani e dall’IA che lavorano insieme per migliorare la tecnologia e migliorare l’esperienza sia per gli utenti ipovedenti che per gli agenti che li supportano.

In un recente studio presentato alla 27a Conferenza internazionale sulle interfacce utente intelligenti (IUI) a marzo, i ricercatori hanno evidenziato cinque problemi emergenti con RSA che, secondo loro, giustificano un nuovo sviluppo nella collaborazione uomo-IA. Affrontare questi problemi potrebbe far avanzare la ricerca sulla visione artificiale e avviare la prossima generazione di servizi RSA, secondo John M. Carroll, illustre professore di scienze e tecnologia dell’informazione.

“Siamo interessati a sviluppare questo particolare paradigma perché è un’attività collaborativa che coinvolge persone vedenti e non vedenti, nonché capacità di visione artificiale”, ha affermato Carroll. “L’abbiamo inquadrato in un modo molto ricco in cui ci sono molte questioni interessanti dell’interazione uomo-uomo, dell’interazione uomo-tecnologia e dell’innovazione tecnologica”.

La tecnologia di assistenza per i vedenti a distanza è attualmente disponibile attraverso applicazioni gratuite che connettono utenti ipovedenti con volontari vedenti o come servizio a pagamento che li collega ad agenti vedenti. La tecnologia viene implementata quando una persona ipovedente ha bisogno di aiuto per un’attività quotidiana che richiede la vista, come trovare un tavolo vuoto in un ristorante, leggere l’etichetta di una confezione di cibo o identificare il colore di un oggetto, e chiama un agente utilizzando un video dal vivo funzione sul proprio dispositivo mobile. L’agente quindi vede il mondo dell’utente attraverso quella lente, fungendo da occhi per aiutarlo a navigare nella sua richiesta.

Ma secondo Syed Billah, assistente professore di IST e coautore dell’articolo, il supporto che gli agenti forniscono non è facile.

“Ad esempio, creare una visione del mondo guardando attraverso la telecamera è mentalmente impegnativo per gli agenti”, ha affermato Billah. “La buona notizia è che parte di questa attività può essere scaricata su computer che eseguono un algoritmo di ricostruzione 3D”.

Tuttavia, parte del supporto fornito dagli agenti, come aiutare un utente ipovedente a navigare in un parcheggio o leggere un’etichetta su un flacone di farmaci, ha una posta in gioco più alta.

“Per affrontare questi problemi, c’è spazio per miglioramenti con l’attuale tecnologia di visione artificiale”, ha affermato Billah.

Nel loro studio, i ricercatori hanno esaminato le tecnologie RSA esistenti e intervistato gli utenti per comprendere le sfide tecniche e di navigazione che devono affrontare quando utilizzano il servizio. Hanno quindi identificato un sottoinsieme di sfide che potrebbero essere affrontate con le tecnologie di visione artificiale esistenti e hanno proposto idee progettuali per affrontarle. Hanno anche identificato cinque problemi emergenti che, a causa della loro complessità, non possono essere affrontati dalle attuali tecniche di visione artificiale.

I ricercatori ritengono che questi problemi potrebbero portare a nuove opportunità per migliorare il design e l’esperienza RSA:

  • Riconoscere che gli oggetti comunemente identificati come ostacoli dalle fotocamere degli smartphone potrebbero non essere considerati ostacoli da persone ipovedenti, ma sono invece strumenti utili. Ad esempio, un muro che delimita un marciapiede può essere visualizzato come un ostacolo nelle comuni app di navigazione, ma una persona ipovedente che cammina con un bastone può fare affidamento su di esso per muovere i propri passi.
  • Aiutare gli utenti a navigare nel loro ambiente quando un feed live della telecamera potrebbe andare perso durante la larghezza di banda cellulare ridotta, che si verifica spesso in ambienti interni.
  • Riconoscere i contenuti sui display LCD digitali, come le informazioni sui voli in un aeroporto o i pannelli di controllo della temperatura in una camera d’albergo.
  • Riconoscere testi su superfici irregolari. Spesso le informazioni importanti vengono stampate in modi che rendono difficile la lettura per gli agenti umani che assistono le persone ipovedenti; ad esempio, istruzioni per i farmaci su un flacone di pillole ricurvo o un elenco di ingredienti su un sacchetto di patatine.
  • Prevedere come si muoveranno le persone o gli oggetti fuori dall’inquadratura. Gli agenti devono essere in grado di comunicare rapidamente informazioni ambientali nell’ambiente pubblico di un utente, ad esempio altri pedoni o un’auto in movimento, per aiutare l’utente a evitare collisioni e mantenere l’utente al sicuro. Tuttavia, i ricercatori hanno scoperto che attualmente è difficile per gli agenti rintracciare queste altre persone e oggetti e quasi impossibile prevederne le traiettorie.

I ricercatori sperano che il loro studio migliorerà l’esperienza sia per gli utenti che per gli agenti ipovedenti.

“In futuro immaginiamo di poter utilizzare la visione artificiale per offrire all’agente un’esperienza molto coinvolgente e fornire loro la tecnologia della realtà mista”, ha affermato Rui Yu, dottorando dell’IST “E saremo in grado di aiutare direttamente gli utenti a ottenere alcune informazioni di base sul loro ambiente basate sulla tecnologia di visione artificiale.”

Allo studio hanno collaborato anche Sooyeon Lee, ex dottoranda al College of IST e attuale ricercatore post-dottorato al Rochester Institute of Technology, e Jingyi Xie, dottoranda in informatica, che è stato sostenuto dal National Institutes of Health e dalla National Library degli Stati Uniti di Medicina.


Articolo precedenteJapan FM e il segretario al Tesoro statunitense Yellen confermano gli accordi forex esistenti
Articolo successivoIndyCar, 500 Miglia di Indianapolis annuncia l’intenzione di diventare verde