Aprendizagem profunda com imagens RGB-D: classificação de objetos e estimativa de pose

Autores

  • Juan Cruz Gassó Loncan Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática, Facultad de Ingeniería de la Universidad Nacional de Entre Ríos, Entre Ríos - Argentina
  • Gerardo Gabriel Gentiletti Facultad de Ingeniería de la Universidad Nacional de Entre Ríos, Entre Ríos - Argentina

DOI:

https://doi.org/10.33414/rtyc.37.146-156.2020

Palavras-chave:

Aprendizagem profunda, visão robótica, RGB-D

Resumo

No âmbito da tese de doutoramento, o objetivo é desenvolver uma Interface Homem-Máquina para controlar um braço de assistência robótica com mais de 6 graus de liberdade. É apresentado o uso de técnicas de aprendizado profundo para reconhecimento de objetos e estimativa de pose para interagir com eles. 3 modelos de redes neurais convolucionais multimodais foram implementados para imagens RGB-D do banco de dados BigBIRD, com três saídas de classificação: 22 objetos - 5 câmeras - 8 rótulos de rotação. Para o melhor dos modelos, foram alcançados valores de precisão de 96% para objetos, 98% para câmera e 56% para rotação.

Downloads

Não há dados estatísticos.

Publicado

2020-10-22

Como Citar

Gassó Loncan, J. C., & Gentiletti, G. G. (2020). Aprendizagem profunda com imagens RGB-D: classificação de objetos e estimativa de pose. Revista De Tecnologia E Ciência, (37), 146–156. https://doi.org/10.33414/rtyc.37.146-156.2020