
Google Gemini es bueno en muchas cosas que suceden dentro de una pantalla, como generar texto e imágenes. Sin embargo, el modelo más reciente, Google Robotics, es un modelo de visión, lenguaje y acción que lleva la inteligencia artificial generativa al mundo físico y podría acelerar significativamente la carrera de la revolución de los robots humanoides.
Gemini Robotics, presentado por DeepMind de Google el miércoles, mejora las habilidades de Gemini en tres áreas clave: destreza, interactividad y generalización. Cada uno de estos aspectos tiene un impacto importante en el éxito de los robots en el trabajo y en entornos desconocidos.

La generalización permite que un robot tome el vasto conocimiento de Gemini sobre el mundo y las cosas, lo aplique a nuevas situaciones y realice tareas para las que no ha sido entrenado. En un video, los investigadores muestran un par de brazos robóticos controlados por Gemini Robotics jugando un partido de baloncesto de mesa y le piden que “haga un mate con la pelota”. Aunque el robot no había visto el juego antes, tomó la pequeña pelota naranja y la metió en la red de plástico.
Gemini Robotics también hace que los robots sean más interactivos y capaces de responder no solo a instrucciones verbales cambiantes, sino también a condiciones impredecibles. En otro video, los investigadores le pidieron al robot que pusiera uvas en un tazón con plátanos, pero luego movieron el tazón mientras el brazo robótico se ajustaba y aún así logró poner las uvas en el tazón.
Google también demostró las habilidades de destreza del robot, que le permiten hacer cosas como jugar tres en raya en un tablero de madera, borrar una pizarra y doblar papel para hacer origami. En lugar de horas de entrenamiento para cada tarea, los robots responden a instrucciones en lenguaje natural casi constantes y realizan las tareas sin guía. Es impresionante de ver.
Claro, agregar inteligencia artificial a la robótica no es algo nuevo. El año pasado, OpenAI se asoció con Figure AI para desarrollar un robot humanoide que pueda realizar tareas basadas en instrucciones verbales. Al igual que con Gemini Robotics, el modelo de lenguaje visual de Figure 01 trabaja con el modelo de voz de OpenAI para mantener conversaciones sobre tareas y prioridades cambiantes.
En la demostración, el robot humanoide está frente a platos y un escurridor. Se le pregunta qué ve, y lo enumera, pero luego el interlocutor cambia la tarea y le pide algo para comer. Sin perder el ritmo, el robot toma una manzana y se la entrega.

Aunque gran parte de lo que Google mostró en los videos eran brazos y manos robóticas realizando una amplia gama de tareas físicas, hay planes más ambiciosos. Google se está asociando con Apptroniks para agregar el nuevo modelo a su robot humanoide Apollo.
Google conectará los puntos con programación adicional, un nuevo modelo avanzado de lenguaje visual llamado Gemini Robotics-ER (razonamiento encarnado). Gemini Robotics-ER mejorará el razonamiento espacial de los robots y debería ayudar a los desarrolladores a conectar los modelos a los controladores existentes.
Esto debería mejorar el razonamiento en tiempo real y permitir que los robots descubran rápidamente cómo agarrar y usar objetos desconocidos. Google llama a Gemini Robotics ER una solución integral y afirma que “puede realizar todos los pasos necesarios para controlar un robot directamente, incluyendo percepción, estimación de estado, comprensión espacial, planificación y generación de código”.
Google está proporcionando el modelo Gemini Robotics-ER a varias empresas y centros de investigación enfocados en robótica, incluyendo Boston Dynamics (creadores de Atlas), Agile Robots y Agility Robots.
En general, es una gran oportunidad para los desarrolladores de robots humanoides. Sin embargo, como la mayoría de estos robots están diseñados para fábricas o aún están en laboratorios, puede que pase un tiempo antes de que tengas un robot mejorado con Gemini en tu hogar.
Vía | Gemini just got physical and you should prepare for a robot revolution | TechRadar

This post is absolutely packed with value! I feel like I just got the equivalent of a paid course for free. Your generosity in sharing such detailed information and your own hard-won insights is truly appreciated. The examples you provided were particularly helpful in showing how to actually apply these concepts in real-world situations. I’m excited to start implementing what I’ve learned here. Thank you for putting in the time and effort to create something this useful!
escort
istanbul escort
Rainx Drive is the Best Cloud Storage Platform
Really well-researched and written. 👉 Watch Live Tv online in HD. Stream breaking news, sports, and top shows anytime, anywhere with fast and reliable live streaming.
I do not even understand how I ended up here, but I assumed this publish used to be great
Araç arızalarında en çok tercih edilen Bafra çekici hizmetidir. Bafra oto yol yardım, yakıt bitmesi, lastik patlaması veya motor arızalarında devreye girer. Bafra oto kurtarma, araç taşımasında güven sağlar. Bafra oto yol yardım, müşterilerine kesintisiz hizmet verir.
very informative articles or reviews at this time.
I highly recommend exploring massage therapy. It’s an investment in your health.
This destination is actually close to my city, I’ll visit soon.
스트레스로 불면증에 시달렸는데 마사지 받고 꿀잠 잤어요. 몸의 피로가 싹 풀려서 개운합니다,
GTA VI Beta: Get Started https://gta2026.pythonanywhere.com
GTA VI Beta: 100% Free – Download Today! https://gta2026.netlify.app
GTA VI Beta: Tell Us What You Think https://gta2026.netlify.app
I truly appreciate your distinct style of writing. The way you organize your thoughts and elaborate on concepts makes it incredibly easy to follow and absorb. I’ve already added your site to my bookmarks and plan to recommend it widely.
I like the efforts you have put in this, regards for all the great content.
Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
naturally like your web site however you need to take a look at the spelling on several of your posts. A number of them are rife with spelling problems and I find it very bothersome to tell the truth on the other hand I will surely come again again.
This is the kind of content the internet needs more of.
I really like reading through a post that can make men and women think. Also, thank you for allowing me to comment!
Engaging and informative. What more could you ask for?
The intersection of estate planning and Medicaid qualification requires professional expertise. Ohio Medicaid specialists provide integrated solutions.
Tech dae naturally like your web site however you need to take a look at the spelling on several of your posts. A number of them are rife with spelling problems and I find it very bothersome to tell the truth on the other hand I will surely come again again.