Google lanzó su esperada herramienta de inteligencia artificial llamada Gemini, descrita como una solución más potente que cualquier otra disponible en el mercado, incluso por encima del popular ChatGPT, desarrollado por OpenAI y Microsoft.
La compañía resaltó la "multimodalidad" de su nueva plataforma, ya que puede "razonar fluidamente a través de textos, imágenes, video, audio y código" mediante el modelo MMLU, que representa la "comprensión masiva de lenguaje multitareas" en inglés.
Durante la presentación general brindada por la compañía, se detalló que Gemini será ofrecido en tres versiones:
- Nano (la más básica, en forma de aplicación para teléfonos celulares)
- Pro (versión intermedia)
- Ultra (la versión más potente diseñada para abordar tareas de gran complejidad)
Google presentó Gemini, su nueva inteligencia artificial
Gemini tiene la capacidad de recibir todo tipo de información, ya sea visual o auditiva, como notas musicales, imágenes o palabras, para luego producir contenido propio en forma de texto, audio o imágenes.
En la presentación, Gemini demostró su habilidad para identificar errores en problemas matemáticos complejos, proporcionar la respuesta correcta y explicar los pasos necesarios para llegar a ella.
A su vez, mostró su capacidad para ofrecer información detallada sobre animales (en la presentación se pidió que describiera a un pato), a partir de un simple dibujo, incluso proporcionando la traducción de "pato" a cinco idiomas diferentes.
Gemini recibirá información ya sea visual o auditiva, como notas musicales, imágenes o palabras, para luego generar contenido en forma de texto, audio o imágenes
Además, la herramienta es capaz de participar en desafíos populares con los usuarios, como el clásico "piedra, papel o tijera", o en el juego de los tres cubiletes.
Gemini opera con los lenguajes de programación más comunes, entre ellos:
Aunque aún es susceptible a cometer errores, Google indicó que puede fácilmente corregirlos cuando se le notifiquen, logrando una resolución del 90% de los casos.
El potencial de Gemini se integrará en su otra IA existente, Bard, que ya está operativo en varios idiomas desde hace varios meses
En cuanto a la monetización de esta nueva herramienta, la compañía no dio detalles claros en este momento. Únicamente se limitó a anunciar que estará disponible a partir del 13 de diciembre.
Gemini: sus principales diferencias con Bard
Gemini y Bard, la nueva pareja de hermanos generativa de Google, cuentan con varias diferencias en sus funciones y aplicaciones.
Gemini contará con tres versiones: Nano, Pro y Ultra.
Gemini opera como un sistema de gestión de datos que automatiza la clasificación, organización y análisis de la información.
Utiliza la nueva familia de modelos de lenguaje de inteligencia artificial PaLM 2, desarrollada por Google, que otorga mayor precisión y fluidez en comparación con otros sistemas semejantes.
Su enfoque está centrado en ayudar a empresas y organizaciones a extraer valor de sus datos mediante técnicas de procesamiento de lenguaje natural, aprendizaje automático y visión por computadora.
Gemini es capaz de reconocer tipos, formatos y contenidos de datos, asignarles etiquetas, categorías y metadatos, así como generar resúmenes, gráficos y tablas para facilitar la comprensión y visualización de la información.
Por su parte, Bard es una plataforma de chat por inteligencia artificial diseñada estrictamente para el usuario final.
Su objetivo es brindar una experiencia conversacional natural, divertida y educativa, mediante técnicas de generación de texto, comprensión del contexto y personalización.
Bard, el chatbot de inteligencia artificial de Google.
Bard es capaz de responder preguntas, contar historias, hacer bromas, crear imágenes y más.
Además, tiene la capacidad de adaptarse al estilo, tono y humor del usuario, incluso aprendiendo sus preferencias y gustos.
Ambos sistemas, Gemini y Bard, aprovechan la avanzada tecnología de PaLM 2 para ofrecer soluciones más precisas y fluidas en sus respectivos ámbitos.
Con la implementación de Gemini, Google busca posicionarse fuerte en el sector de la IA, y ser un referente con sus nuevos lanzamientos