Nueva IA Gemini de Google: Fusionando Texto y Gráficos en una Potente Herramienta

agosto 18, 2023

| Tags: análisis de gráficos, control de software, creación de imágenes, desarrollo de software, Gemini, generación de texto, Google, Google Bard, Google Cloud, GPT-4, IA conversacional, Inteligencia Artificial

Los esfuerzos de Google en el ámbito de la inteligencia artificial han ido más o menos hacia donde esperábamos: el nuevo buscador, añadidos en sus principales aplicaciones y servicios, y Google Bard como asistente personal, entre otras muchas novedades.

Pero el gigante del buscador no quiere detenerse en este punto, y ya prepara su futura inteligencia artificial. Según leemos en el medio especializado Neowin, Gemini es el nuevo foco de la compañía, y con él pretenden alcanzar a la competencia, con productos tales como GPT-4.

Más potencia para Google Bard

De acuerdo a la información de The Information, recogida en el portal especializado Neowin, Google ya se apresura para lanzar su nuevo proyecto de inteligencia artificial. Se llama Gemini, y llegará este mismo otoño para combatir de tú a tú frente a rivales como GPT-4, el modelo de lenguaje de OpenAI.

El informe presentado nos cuenta cómo se comporta Gemini. Esta inteligencia artificial combina la habilidad de generación de texto, similar a lo que vemos en ChatGPT o Bard, con la capacidad para crear imágenes a partir de descripciones. En realidad, esto permitiría a Google tener un producto de IA conversacional capaz de analizar gráficos, crearlos e incluso controlar software con comandos del lenguaje natural.

Todo comenzó a principios de este año, cuando Google fusionó dos equipos que trabajaban con inteligencia artificial. Con esta unión, la empresa de Mountain View buscaba acelerar el desarrollo de grandes modelos de lenguaje como Gemini. ¿Por qué tanta prisa? Pues principalmente porque GPT-4 y DALL-E de OpenAI ya han demostrado sus posibilidades, cosechando éxito.

La intención de Google es potenciar sus servicios gracias a Gemini, al menos así lo han trasladado los empleados de la empresa. Estos hablan de Gemini para un uso relacionado con el análisis de tablas, creación de gráficos a través de descripciones o el control de apps mediante texto o comandos de voz.

Todas estas funciones llegarían a Google Bard, además de a otros productos más dedicados al sector empresarial. Por su parte, la compañía espera que mejore Google Cloud, dando a los desarrolladores acceso a los modelos de lenguaje. Este movimiento se asemeja a lo que hemos visto en Microsoft con su servicio Azure, que proporciona capacidades IA a los desarrolladores de software.

Google tiene prisa, y piensa que el momento adecuado para Gemini es este mismo otoño, además de forma crítica. La firma americana se enfrenta a la presión de un mercado que se mueve muy rápido, con avances en IA cada poco tiempo. En el Google I/O 2023 que tuvo lugar el pasado mes de mayo, Google afirmó que Gemini estaba entrenando, y que cuando estuviera lista, llegaría en “varios tamaños y capacidades”.

Las interesantes y demostradas funciones que tienen los modelos modernos como GPT-4 han removido el sector, y en esta noticia vemos un ejemplo más. Google enfoca sus esfuerzos en Gemini, y seguramente no tardemos demasiado en verla en acción.

Vía | Google se prepara para hacer frente a GPT-4 con su arma secreta de inteligencia artificial: así es Gemini (xatakandroid.com)

Más potencia para Google Bard

Deja un comentario Cancelar la respuesta