Home Notizie recenti Semplice, accurato ed efficiente: migliorare il modo in cui i computer riconoscono...

Semplice, accurato ed efficiente: migliorare il modo in cui i computer riconoscono i gesti delle mani

96
0
Semplice, accurato ed efficiente: migliorare il modo in cui i computer riconoscono i gesti delle mani

Immagini dei nove gesti delle mani interattivi nello studio. Credito: Zhang et al., Doi: 10.1117 / 1.JEI.30.6.063026.

Nel film di fantascienza del 2002 “Minority Report”, il personaggio di Tom Cruise, John Anderton, usa le mani, inguainate in guanti speciali, per interfacciarsi con lo schermo del computer trasparente grande quanto una parete. Il computer riconosce i suoi gesti per ingrandire, ingrandire e scorrere via. Sebbene questa visione futuristica per l’interazione uomo-computer abbia ormai 20 anni, gli esseri umani di oggi si interfacciano ancora con i computer utilizzando un mouse, una tastiera, un telecomando o un piccolo touch screen. Tuttavia, i ricercatori hanno dedicato molti sforzi per sbloccare forme di comunicazione più naturali senza richiedere il contatto tra l’utente e il dispositivo. I comandi vocali sono un esempio importante che ha trovato la sua strada nei moderni smartphone e assistenti virtuali, permettendoci di interagire e controllare i dispositivi attraverso la voce.

I gesti delle mani costituiscono un’altra importante modalità di comunicazione umana che potrebbe essere adottata per le interazioni uomo-computer. I recenti progressi nei sistemi di fotocamere, nell’analisi delle immagini e nell’apprendimento automatico hanno reso il riconoscimento gestuale basato sull’ottica un’opzione più attraente nella maggior parte dei contesti rispetto agli approcci basati su sensori indossabili o guanti per dati, come utilizzato da Anderton in “Minority Report”. Tuttavia, i metodi attuali sono ostacolati da una serie di limitazioni, tra cui un’elevata complessità computazionale, bassa velocità, scarsa precisione o un basso numero di gesti riconoscibili. Per affrontare questi problemi, un team guidato da Zhiyi Yu della Sun Yat-sen University, in Cina, ha recentemente sviluppato un nuovo algoritmo di riconoscimento dei gesti delle mani che trova un buon equilibrio tra complessità, accuratezza e applicabilità. Come dettagliato nel loro articolo, che è stato pubblicato nel Journal of Electronic Imaging, il team ha adottato strategie innovative per superare le sfide chiave e realizzare un algoritmo che può essere facilmente applicato nei dispositivi di livello consumer.

Una delle caratteristiche principali dell’algoritmo è l’adattabilità a diversi tipi di mano. L’algoritmo cerca innanzitutto di classificare il tipo di mano dell’utente come sottile, normale o larga sulla base di tre misurazioni che tengono conto delle relazioni tra larghezza del palmo, lunghezza del palmo e lunghezza delle dita. Se questa classificazione ha esito positivo, i passaggi successivi nel processo di riconoscimento del gesto della mano confrontano solo il gesto di input con i campioni memorizzati dello stesso tipo di mano. “Gli algoritmi semplici tradizionali tendono a soffrire di bassi tassi di riconoscimento perché non possono far fronte a diversi tipi di mano. Classificando prima il gesto di input per tipo di mano e quindi utilizzando librerie di campioni che corrispondono a questo tipo, possiamo migliorare il tasso di riconoscimento complessivo con risorse quasi trascurabili consumo”, spiega Yu.

Un altro aspetto chiave del metodo del team è l’uso di una “funzione di scelta rapida” per eseguire una fase di prericonoscimento. Sebbene l’algoritmo di riconoscimento sia in grado di identificare un gesto di input su nove possibili gesti, confrontare tutte le caratteristiche del gesto di input con quelle dei campioni archiviati per tutti i possibili gesti richiederebbe molto tempo. Per risolvere questo problema, il passaggio di prericonoscimento calcola un rapporto dell’area della mano per selezionare i tre gesti più probabili dei possibili nove. Questa semplice funzionalità è sufficiente per restringere il numero di gesti candidati a tre, di cui il gesto finale viene deciso utilizzando un’estrazione di funzionalità molto più complessa e di alta precisione basata sui “momenti invarianti di Hu”. Yu afferma: “La fase di prericonoscimento dei gesti non solo riduce il numero di calcoli e le risorse hardware necessarie, ma migliora anche la velocità di riconoscimento senza compromettere la precisione”.

Il team ha testato il proprio algoritmo sia in un processore per PC commerciale che in una piattaforma FPGA utilizzando una fotocamera USB. Avevano 40 volontari che eseguivano i nove gesti delle mani più volte per costruire la libreria di campioni e altri 40 volontari per determinare l’accuratezza del sistema. Nel complesso, i risultati hanno mostrato che l’approccio proposto è in grado di riconoscere i gesti delle mani in tempo reale con una precisione superiore al 93%, anche se le immagini dei gesti di input sono state ruotate, tradotte o ridimensionate. Secondo i ricercatori, il lavoro futuro si concentrerà sul miglioramento delle prestazioni dell’algoritmo in condizioni di scarsa illuminazione e sull’aumento del numero di gesti possibili.

Il riconoscimento dei gesti ha molti campi di applicazione promettenti e potrebbe aprire la strada a nuovi modi di controllare i dispositivi elettronici. Una rivoluzione nell’interazione uomo-computer potrebbe essere a portata di mano!


Articolo precedenteMeccanismo neuroprotettivo alterato dai geni di rischio della malattia di Alzheimer
Articolo successivoL’algoritmo guida in modo sicuro ed efficiente gli aghi chirurgici curvi all’interno del corpo