Un nuovo quadro che potrebbe semplificare l'apprendimento per imitazione nella robotica

Figura che mostra le due “metà” del metodo dei ricercatori, con l’apprendimento della rappresentazione a sinistra e l’imitazione del comportamento attraverso i vicini più vicini a destra. Credito: Parigi et al.

Negli ultimi decenni, gli informatici hanno cercato di addestrare i robot ad affrontare una varietà di compiti, comprese le faccende domestiche e i processi di produzione. Una delle strategie più rinomate utilizzate per addestrare i robot alle attività manuali è l’apprendimento dell’imitazione.

Come suggerisce il nome, l’apprendimento dell’imitazione implica insegnare a un robot come fare qualcosa usando dimostrazioni umane. Sebbene in alcuni studi questa strategia di formazione abbia ottenuto risultati molto promettenti, spesso richiede set di dati ampi e annotati contenenti centinaia di video in cui gli esseri umani completano un determinato compito.

I ricercatori della New York University hanno recentemente sviluppato VINN, un framework alternativo per l’apprendimento dell’imitazione che non richiede necessariamente grandi set di dati di addestramento. Questo nuovo approccio, presentato in un documento pre-pubblicato su arXiv, funziona disaccoppiando due diversi aspetti dell’apprendimento per imitazione, vale a dire l’apprendimento delle rappresentazioni visive di un compito e delle azioni associate.

“Ero interessato a vedere come possiamo semplificare l’apprendimento dell’imitazione”, ha detto a TechXplore Jyo Pari, uno dei ricercatori che hanno condotto lo studio. “L’apprendimento dell’imitazione richiede due componenti fondamentali: uno è imparare ciò che è rilevante nella scena e l’altro è come puoi prendere le caratteristiche rilevanti per eseguire un’attività. Volevamo disaccoppiare questi componenti, che sono tradizionalmente accoppiati in un unico sistema, e capire il ruolo e l’importanza di ciascuno di essi”.

La maggior parte dei metodi di apprendimento per imitazione esistenti combinano la rappresentazione e l’apprendimento del comportamento in un unico sistema. La nuova tecnica creata da Pari e dai suoi colleghi, d’altra parte, si concentra sull’apprendimento della rappresentazione, il processo attraverso il quale agenti e robot di intelligenza artificiale imparano a identificare le caratteristiche rilevanti per l’attività in una scena.

“Abbiamo utilizzato i metodi esistenti nell’apprendimento della rappresentazione autocontrollato, che è un’area popolare nella comunità della visione”, ha spiegato Pari. “Questi metodi possono prendere una raccolta di immagini senza etichette ed estrarne le caratteristiche rilevanti. L’applicazione di questi metodi all’imitazione è efficace perché possiamo identificare quale immagine nel set di dati dimostrativo è più simile a quella che il robot vede attualmente attraverso una semplice ricerca del vicino più vicino su le rappresentazioni. Pertanto, possiamo semplicemente fare in modo che il robot copi le azioni da immagini dimostrative simili”.

Utilizzando la nuova strategia di apprendimento dell’imitazione che hanno sviluppato, Pari ei suoi colleghi sono stati in grado di migliorare le prestazioni dei modelli di imitazione visiva in ambienti simulati. Hanno anche testato il loro approccio su un robot reale, insegnandogli in modo efficiente come aprire una porta guardando immagini dimostrative simili.

“Sento che il nostro lavoro è una base per lavori futuri che possono utilizzare l’apprendimento della rappresentazione per migliorare i modelli di apprendimento dell’imitazione”, ha affermato Pari. “Tuttavia, anche se i nostri metodi sono stati in grado di svolgere un semplice compito vicino più vicino, hanno comunque alcuni inconvenienti”.

In futuro, il nuovo quadro potrebbe aiutare a semplificare i processi di imitazione di apprendimento nella robotica, facilitandone l’implementazione su larga scala. Finora, Pari e i suoi colleghi hanno utilizzato la loro strategia solo per addestrare i robot a compiti semplici. Nei loro prossimi studi, pianificano quindi di esplorare possibili strategie che consentirebbero loro di implementarlo su compiti più complessi.

“Capire come utilizzare la robustezza del vicino più vicino per compiti più complessi con la capacità dei modelli parametrici è una direzione interessante”, ha aggiunto Pari. “Attualmente stiamo lavorando per aumentare VINN per essere in grado non solo di svolgere un’attività, ma anche di più”.


© 2022 Scienza X Rete

Articolo precedenteJoe Biden ne nomina 3 per il consiglio della Fed, inclusa la prima donna di colore
Articolo successivoQuando finirà questa ondata di COVID? Quattro numeri da tenere d’occhio e perché