Xataka – Google Gemini ya está aquí: así es el modelo de IA más avanzado hasta la fecha que promete ser mejor que GPT-4

Google por fin muestra su gran arma contra ChatGPT. Gemini ya es oficial. El nuevo modelo de lenguaje (LLM) de Google ya se puede probar y promete ser la IA más avanzada hasta la fecha. Al contrario de lo que se pensaba, Google ha decidido lanzar ya su nuevo modelo de IA. Lo hará eso sí en tres tamaños diferentes: nano, Pro y Ultra. La mala noticia es que en su versión más potente, Gemini Ultra, no llegará hasta principios del año que viene.

Gemini, un modelo de IA que supera a todos sus rivales en los principales tests. Gemini es un modelo multimodal, lo que significa que puede entender información de varias fuentes, desde texto hasta imágenes, pasando por vídeo, audio o código. Según explican desde Google, se trata de su «modelo más flexible hasta la fecha».

Según explica Google, los resultados de Gemini en su versión Ultra son los mejores de una IA en 30 de las 32 pruebas académicas de uso generalizado, superando ligeramente los porcentajes obtenidos por GPT-4, el modelo de OpenAI.

Google explica que con una puntuación del 90,04% en MMLU (comprensión masiva del lenguaje multitarea), es el primer modelo que supera a los expertos humanos en un test que combina 57 materias como física, historia, medicina o ética, junto a la capacidad de resolución de problemas. 

Un modo de razonar diferente. Google he diseñado Gemini desde cero y el enfoque de enfrentarse a los problemas es distinto.  Es multimodal de forma nativa, lo que significa que está preentrenado desde el principio para combinar distintas modalidades. En un vídeo de demostración se ensaña como Gemini es capaz de interpretar en tiempo real dibujos, relacionar objetos y sugerir canciones a medida que le damos indicaciones.

Gemini es «excepcionalmente hábil para extraer conocimientos difíciles de identificar entre ingentes cantidades de datos», apunta Google.

Con AlphaCode 2. Gemini introduce un nuevo sistema de generación de código, AlphaCode2. Según describe Google, el nuevo sistema se desempeña bien en las matemáticas complejas y la comprensión teórica de la ciencia de la computación. Según los datos, AlphaCode 2 rinde mejor que el 85% de los participantes. Como referencia, AlphaCode 1 era mejor que el 50%.

Un salto en eficiencia. Hay un dato que Google no ha compartido oficialmente: el número de parámetros. Sí explica que Gemini Ultra es el modelo más eficiente jamás creado, lo que implica que consume una menor cantidad de energía para lo que es capaz de ofrecer.

Uno de los motivos es que Gemini Ultra llega junto al sistema TPU v5p, la unidad de procesamiento tensorial más potente, eficiente y escalable hasta la fecha. Además de con TPUs, Gemini también ha sido entrenado y utiliza GPUs externas, previsiblemente las populares Nvidia H100.

Gemini llega ya a Google Bard (pero en distintas fases). A partir de hoy, Google Bard recibe la mayor actualización de su historia con el paso a Gemini Pro. El chatbot de Google empezará a utilizar la versión mediana de Gemini. Estará disponible en inglés en más de 180 países y en Europa en los próximos meses.

A partir del año que viene, Google lanzará Bard Advanced. Una nueva versión de su IA que integrará Gemini Ultra. Por el momento no se ha lanzado la mejor versión de Gemini, ya que según Google se «están llevando a cabo comprobaciones exhaustivas de confianza y seguridad».

Y al Google Pixel 8 Pro. Además de en Bard, Gemini estará disponible en servicios como el buscador, Ads, Chrome y Duet AI. A partir del 13 de diciembre, los desarrolladores podrán acceder a Gemini Pro a través de la API en Google AI Studio o Vertex AI.

Finalmente Gemini también estará disponible en los Google Pixel 8 Pro. AICore es un nuevo servicio donde los creadores de aplicaciones podrán aprovechar las posibilidades que genera la IA, en este caso con Gemini Nano, su versión más ligera.

Según apuntan desde Google, esta posibilidad también llegará en un futuro a otros dispositivos con Android 14. Sin especificar más detalles.

Google quiere volver a ser protagonista en el campo de la inteligencia artificial. Además de sus capacidades, Gemini promete ser el modelo de IA con las evaluaciones de seguridad más exhaustivas. Por ello, desde Google explican que en la búsqueda de puntos ciegos han trabajado con expertos externos. Al tiempo que han aplicado clasificadores de seguridad específicos para identificar contenidos que impliquen violencia o estereotipos negativos. 

«Es el comienzo de una nueva era para nosotros», explica Sundar Pichai, CEO de Google. Gemini se ha hecho de rogar pero ya ha llegado y el año que viene también se espera GPT-5. Nuevos avances para un campo, el de la IA, donde parece que cada mes hay importantes novedades. 

En Xataka | Estamos más cerca de lo que parece de llegar a la inteligencia artificial general. Al menos según el CEO de DeepMind


La noticia

Google Gemini ya está aquí: así es el modelo de IA más avanzado hasta la fecha que promete ser mejor que GPT-4

fue publicada originalmente en

Xataka

por
Enrique Pérez

.