fbpx

OpenAI AI-powered robot aprendido cómo resolver un cubo de Rubik con una mano

Investigación de la inteligencia Artificial organización OpenAI ha logrado un nuevo hito en su búsqueda para construir de propósito general, de auto-aprendizaje de los robots. El grupo de robótica de la división dice Dactyl, su mano robótica humanoide desarrollado por primera vez el año pasado, ha aprendido a resolver un cubo de Rubik con una mano. OpenAI ve la hazaña como un gran avance tanto para la destreza de robótica apéndices y su propio software de inteligencia artificial, que permite Dúctil para aprender nuevas tareas mediante simulaciones virtuales antes de que sea presentado con un físico, real, reto a superar.

En una demostración en vídeo mostrando Dúctil del nuevo talento, podemos ver la mano robótica a tientas su camino hacia un cubo completo de resolver con torpe pero precisos maniobras. Tarda muchos minutos, pero Dúctil es finalmente capaz de resolver el rompecabezas. Es un poco inquietante para ver en acción, aunque sólo sea porque los movimientos verá notablemente menos líquido que más humanas y, especialmente, inconexos cuando se compara con la asombrosa velocidad y raw destreza en la pantalla cuando un ser humano speedcuber resuelve el cubo en cuestión de segundos.

Pero para OpenAI, Dactyl del logro lleva un paso más cerca de un codiciado objetivo para el conjunto de la AI y las industrias de robótica: un robot que puede aprender a realizar una variedad de tareas de la vida real, sin necesidad de tener que entrenar durante meses a años de real tiempo del mundo y sin necesidad de ser programado específicamente.

Imagen: OpenAI

«Un montón de robots puede resolver cubos de Rubik muy rápido. La diferencia importante entre lo que se hacía allí y lo que estamos haciendo aquí, es que los robots son muy a propósito-construido», dice Pedro Welinder, un científico de investigación y la robótica de plomo en OpenAI. «Obviamente, no hay manera de que usted puede utilizar el mismo robot o el mismo enfoque para realizar otra tarea. El equipo de robótica en OpenAI tienen muy diferentes ambiciones. Estamos tratando de construir un robot. Similar a cómo los seres humanos y cómo nuestras manos pueden hacer un montón de cosas, no sólo una tarea específica, estamos tratando de construir algo que es mucho más general en su ámbito de aplicación.»

Welinder es hacer referencia a una serie de robots en los últimos años, que han llevado el cubo de Rubik de problemas mucho más allá de las limitaciones de las manos del hombre y de la mente. En 2016, el fabricante de semiconductores Infineon desarrollado un robot específicamente para resolver un cubo de Rubik en sobrehumana, velocidad, y el bot logrado hacerlo en menos de un segundo. Que aplastó a la sub-cinco-segundo humanos récord del mundo en el tiempo. Dos años más tarde, una máquina desarrollada por el MIT resuelto un cubo en menos de 0,4 segundos. A finales de 2018, un Japonés canal en YouTube llamado Controlador Humano, incluso desarrollado su propia auto-resolver el cubo de Rubik el uso de un impreso en 3D core adjunta programable servo motores.

En otras palabras, un robot construido para una tarea específica y programada para realizar esa tarea tan eficientemente como sea posible puede típicamente mejor que un humano, y el cubo de Rubik de problemas es algo de software hace mucho ha dominado. Para el desarrollo de un robot para resolver el cubo, incluso un humanoide uno, no es del todo notable por su propia cuenta, y menos en la lenta velocidad de Dactyl opera.

Pero OpenAI del Dactyl robot y el software que los poderes que son muy diferentes en diseño y propósito de un dedicado cubo de problemas de la máquina. Como Welinder dice, OpenAI curso de robótica de trabajo no está enfocado en el logro de resultados superiores en estrecha tareas, ya que sólo requiere desarrollar un mejor robot y el programa en consecuencia. Que se puede hacer sin moderna de la inteligencia artificial.

En su lugar, Dactyl es desarrollado a partir de cero, como un auto-aprendizaje de la mano robótica que se acerca a nuevas tareas parecida a un humano lo haría. Se entrenó con el software que intenta, de manera rudimentaria, en el momento, para replicar los millones de años de evolución que nos ayudan a aprender a utilizar nuestras manos instintivamente como los niños. Que un día, OpenAI esperanzas, ayudar a la humanidad a desarrollar los tipos de robots humanoides sólo sabemos de la ciencia ficción, los robots que pueden operar de forma segura en la sociedad sin poner en peligro a nosotros y realizar una amplia variedad de tareas en entornos tan caóticas como las calles de la ciudad y la fábrica de pisos.

Para saber cómo resolver un cubo de Rubik con una mano, OpenAI no explícitamente programa Dúctil para resolver el juguete de software libre en el internet puede hacer por usted. También optó por no programa individual de los movimientos de la mano para llevar a cabo, ya que lo quería para discernir los movimientos en su cuenta. En su lugar, el equipo de robótica dio la mano del software subyacente de que el objetivo final de resolver un revuelto de cubo y utilizado moderna AI — específicamente una marca de incentivos basados en el aprendizaje profundo llamado aprendizaje por refuerzo — para ayudarle a lo largo del camino hacia calcular hacia fuera en sus el propios. El mismo enfoque a la formación de la IA de los agentes es cómo OpenAI desarrollado de clase mundial de Dota 2 bot.

Pero hasta hace poco, que ha sido mucho más fácil entrenar a un agente de AI que hacer algo prácticamente — jugar a un juego de ordenador, por ejemplo — que para entrenar a realizar una tarea. Eso es porque el software de entrenamiento para hacer algo en un mundo virtual puede ser acelerado, por lo que la IA puede gastar el equivalente a decenas de miles de años de entrenamiento en los meses justos de tiempo reales, gracias a miles de procesadores de gama alta y ultra-potente Gpu trabajando en paralelo.

Haciendo el mismo nivel de formación, la realización de una tarea física con un robot físico no es factible. Es por eso que OpenAI está tratando de ser pioneros en nuevos métodos de entrenamiento robótico utilizando entornos simulados en el lugar del mundo real, algo que la industria de la robótica tiene apenas experimentado. De esa manera, el software puede practicar ampliamente a un ritmo acelerado a través de muchos diferentes equipos a la vez, con la esperanza de que conserva ese conocimiento cuando se inicia el control de un robot real.

Debido a la formación de la limitación y la evidente preocupación de seguridad, los robots utilizados comercialmente hoy en día no se utilizan ni AI y en su lugar están programados con instrucciones muy específicas. «La forma en que se ha abordado en el pasado, es la que uso muy de algoritmos especializados para resolver las tareas, donde se tiene un modelo preciso de ambos, el robot y el entorno en el que está operando,» Welinder, dice. «Para una fábrica de robots, tenemos modelos precisos de aquellos y de saber exactamente el entorno en el que estás trabajando. Usted sabe exactamente cómo se va a recoger la parte en particular.»

Esta es también la razón por la actual robots son mucho menos versátil que el de los humanos. Requiere grandes cantidades de tiempo, esfuerzo y dinero para volver a programar un robot que ensambla, digamos, una parte específica de un automóvil o de un componente del ordenador para hacer algo más. Presentar un robot que no ha sido debidamente entrenado, incluso con una simple tarea que implica cualquier nivel de destreza o de procesamiento visual y fracasaría miserablemente. Con las modernas técnicas de inteligencia artificial, sin embargo, los robots puedan ser modelados como los seres humanos, de modo que puedan utilizar la misma comprensión intuitiva del mundo para hacer de todo, desde la apertura de puertas para freír un huevo. Al menos, ese es el sueño.

Estamos todavía a décadas de distancia a partir de ese nivel de sofisticación, y los saltos a la IA de la comunidad ha hecho en el lado del software — como auto-conducción de coches, máquina de traducción, y de reconocimiento de imagen — no exactamente traducido a la próxima generación de robots. Ahora, OpenAI está tratando de imitar la complejidad de un humano, parte del cuerpo y para conseguir que la robótica analógico para operar de forma más natural.

Es por eso que Dactyl 24 de articulación de la mano robótica modelado después de una mano humana, en lugar de la garra pinza de estilo pinzas robóticas que ves en las fábricas. Y para el software que poderes Dúctil para aprender a utilizar todas las articulaciones de una manera un humano sería, OpenAI poner a través de miles de años de entrenamiento en la simulación antes de intentar la física cubo de resolver.

Imagen: OpenAI

«Si usted está entrenando cosas en el mundo real robot, obviamente lo que estamos aprendiendo es trabajar en lo que realmente se quiere implementar el algoritmo. De esa manera, es mucho más simple. Pero los algoritmos de hoy en día necesitan una gran cantidad de datos. Para entrenar a un mundo real robot, para hacer algo complejo, se necesitan muchos años de experiencia,» Welinder, dice. «Incluso para un ser humano, que lleva un par de años, y los seres humanos tienen millones de años de evolución para tener la capacidad de aprendizaje para operar una mano».

En una simulación, sin embargo, Welinder dice que la formación puede ser acelerado, al igual que con los juegos y otras tareas popular como AI puntos de referencia. «Esto hace que en el orden de miles de años para entrenar el algoritmo. Pero esto sólo toma un par de días, ya que puede paralelizar la formación. Usted también no tiene que preocuparse acerca de los robots de ruptura o de lastimar a alguien como usted es la formación de estos algoritmos,» él agrega. Sin embargo, los investigadores en el pasado ha tenido bastantes problemas tratando de conseguir la formación virtual para el trabajo físico de los robots. OpenAI dice que es entre las primeras organizaciones para ver realmente el progreso en este sentido.

Cuando fue dado un cubo real, Dactyl poner su capacitación para el uso y la resolvió en su propio, y lo hicieron bajo una variedad de condiciones que nunca había sido explícitamente capacitado. Que incluye resolver el cubo de una mano con un guante, con dos de sus dedos de las manos pegadas con cinta adhesiva, y mientras OpenAI miembros constantemente interferido con él tocando con otros objetos y ducharse con burbujas y piezas de confeti-como el papel.

«Hemos encontrado que en todas esas perturbaciones, el robot todavía era capaz de girar el cubo de Rubik. Pero no ir a través de que en el entrenamiento», dice Matthias Plappert, Welinder los compañeros de OpenAI del equipo de robótica de plomo. «La solidez con la que nos encontramos cuando tratamos de esto en el robot físico fue sorprendente para nosotros.»

Es por eso que OpenAI ve Dactyl las habilidades recién adquiridas como igualmente importante tanto para el avance de la robótica de hardware y IA formación. Incluso los robots más avanzados en el mundo del derecho, como el humanoide y el perro como el de los robots desarrollados por la industria líder de Boston Dynamics, no puede funcionar de forma autónoma, y ellos requieren la tarea específica de la programación y de la frecuente intervención humana para llevar a cabo incluso las acciones básicas.

OpenAI dice Dúctil es un pequeño pero importante paso hacia el tipo de robots que algún día podría realizar el trabajo manual o las tareas domésticas y trabajar junto con los seres humanos, en lugar de en cerrado-fuera de los ambientes, sin ningún explícito de programación que rigen sus acciones.

En esa visión para el futuro, la capacidad de los robots para aprender nuevas tareas y adaptarse a los entornos cambiantes, será como mucho acerca de la flexibilidad de la IA como es acerca de la robustez de la máquina física. «Estos métodos son realmente comenzando a demostrar que estas son las soluciones para el manejo de toda la complicación inherente y el desorden del mundo físico en que vivimos,» Plappert dice.

Deja un comentario

A %d blogueros les gusta esto: