Gemini de Google: El Último Avance de IA generativa
imagen diseñada con DALL-E

Gemini de Google: El Último Avance de IA generativa

Campaña de Marketing o es realmente superior a Chat GPT?

Alphabet, la empresa matriz de Google, presentó su modelo de inteligencia artificial, al parecer, el más avanzado hasta la fecha, llamado Gemini. Este lanzamiento tuvo lugar el 6 de diciembre, señala una nueva era en el campo en rápida evolución de la inteligencia artificial.

Gemini es un modelo de lenguaje diseñado para integrarse sin problemas en varios productos de Google, incluyendo búsqueda, celulares, anuncios y el buscador Google Bard . Se espera que este nuevo modelo supere las capacidades de las tecnologías de IA existentes en términos de potencia y funcionalidades.

Su capacidad de procesar grandes cantidades de texto es superior a la de Open AI y en los benchmarks o pruebas que se realizaron vs Chat GPT es superior, sin embargo, no es un gap abismal. Pienso que esto va a acelerar la competencia, y no me sorprendería nuevas noticias de Open AI pronto en 2024.

Creo que lo que más me ha llamado la atención de toda la campaña de Google es cómo nos muestran la capacidad multimodal de la nueva herramienta que lo hace más humano, que reconoce texto, video, audio, imágenes, códigos y conversa como un humano, aunque ya han surgido voces críticas diciendo que los videos son orquestados y no una prueba real como se sugiere, pero nada ha sido comprobado.

Se le puede dar un input, por ejemplo, de una hoja escrita a mano y Gemini podrá leerlo y opinar sobre el mismo. Por ahora esta disponible la versión Pro únicamente con texto a través de Bard en idioma inglés. Gemini vendrá en 3 modalidades: Nano, Pro y Ultra (este último disponible desde enero 2024).

En Marketing, me puedo imaginar el uso de esta capacidad Multimodal creando contenidos que integren texto, imágenes y video, todos coherentes con la voz y tono de la marca.

Sin embargo una nota de precaución, Google ha hecho "mucho trabajo para mejorar la objetividad en Gemini", dijo Eli Collins, vicepresidente de producto de Google Deepmind, pero los grandes modelos de lenguaje "todavía son capaces de alucinar", es un término que los investigadores de IA utilizan cuando los sistemas de IA inventan hechos con una gran confianza, pero resultan ser falsos o errores.

A medida que presenciamos el desarrollo de este nuevo capítulo en la inteligencia artificial, es importante mantenerse informado y aprovechar los cambios que trae y como se puede adaptar a nuestra industria o lugar de trabajo. Gemini no es solo un avance tecnológico; es un presagio del futuro de la IA y su papel en nuestras vidas digitales. Ya se viene hablando del siguiente paso que sería llevar esta capacidad al mundo físico de la robótica, agregando la capacidad de tocar y sentir de este modelo.


Inicia sesión para ver o añadir un comentario.

Otros usuarios han visto

Ver temas