Aclarando el lío de Google con la IA: de Bard a Gemini y ahora llega Gemma

Aclarando el lío de Google con la IA: de Bard a Gemini y ahora llega Gemma

La Inteligencia Artificial de Google suma un nuevo integrante: Gemma es el nombre de su nueva IA abierta, competencia directa de Llama 2 de Meta

1 comentario Facebook Twitter Flipboard E-mail
Gemma Portada

Google tiene una nueva IA generativa con un nombre que a partir de ahora va a sonar en todas partes: Gemma. Con una base similar a Gemini, el sustituto de Google Bard, todo parece tan liado que resulta muy difícil seguirle la pista. Y nos hemos propuesto arrojar luz a la oscuridad, a lo Carles Porta.

La Inteligencia Artificial es el nuevo motor de las empresas tecnológicas, todas han de pasar por el aro de los modelos generativos si quieren mantener el interés de sus inversores y usuarios. Y Google es una de las empresas que más al extremo está llevando esta estrategia: si hace nada conocimos a Gemini, hoy debemos decirle hola a Gemma. Parece que Google no escarmienta con la multiplicidad de productos y de nombres, por más que Gemma y Gemini tengan orientaciones distintas.

"No me llames Bard. Ni Gemini: llámame Gemma"

Gemma Benchmarks Benchmarks IA de Gemma frente a su principal contrincante: Llama 2 de Meta. Imagen de Google

Google ha presentado su nuevo modelo abierto de Inteligencia Artificial para así dar respuesta a aquellos desarrolladores que necesiten moldear sus aplicaciones y servicios sin tener que entrenar su propia herramienta de Inteligencia Artificial. Gemma  puede descargarse directamente desde Google para así compilarlo en un ordenador compatible o, por ejemplo, en la nube gracias a servicios como Google Collab o Hugging Faces. De hecho, ya se puede probar: hay una demo cargada.

La idea de Gemma es ofrecer a la comunidad un modelo preentrenado con el que desarrolladores y empresas puedan experimentar para crear sus propios productos. Aplicaciones médicas, apps para móvil con chatbots a lo ChatGPT, investigaciones científicas... Gemma puede utilizarse de manera libre y tiene licencia comercial. Incluso sirve para ejecutarse a nivel de dispositivo: es perfecta para ordenadores y para smartphones que dispongan de las capacidades para ejecutar las instrucciones y manejar los tokens con soltura. De hecho, serviría a modo de benchmark para procesadores.

Una nueva IA de Google y un nuevo nombre, todo para diferenciarse de otros productos de la empresa que no son abiertos. Pero ¿por qué tanto lío cuando Google debería facilitar el entendimiento de su portafolio de productos? Si todos los modelos de lenguaje de Open AI se basan en el acrónimo GPT (Generative Pre-trained Transformer o transformador generativo preentrenado), y esto hizo mucho más sencillo crear marca y hacer que se conociera dicha marca, ¿por qué en Google van al contrario?

Hagamos un ejercicio de los productos relacionados con la IA generativa que Google ha lanzado en el último año.

  • Google Bard. La respuesta directa a ChatGPT, un chatbot de libre acceso que fue basándose en distintos modelos de Google. Primero LaMDA, después PaLM y por último...
  • Gemini. Evolución de los LLM (modelos largos de lenguaje o Large Language Models) de Google que primero se incluyó en Google Bard para después dar nombre a la propia herramienta final del usuario. Gemini es un modelo multimodal que también es chatbot; al contrario que ChatGPT, que es el chatbot de los modelos GPT de Open AI (actualmente el más avanzado es GPT-4 Turbo).
  • Gemma. No hay que confundir con Gemini por más que forme parte de las herramientas de IA generativa: Gemma es un modelo de lenguaje abierto y que permite ser modificado por cualquier persona que así lo desee.

Gemma mantiene las mismas bases de entrenamiento de Gemini, pero es un producto completamente distinto; lo cual dificulta aún más entender la gama de productos de Google. Sobre todo porque cada uno de los actuales modelos se divide en varias versiones. Vamos, Google en estado puro.

  • Gemini: tres modelos diferentes. Nano, Pro y Ultra. Que, a su vez, dan dos herramientas de chatbot accesibles por el usuario: Google Gemini (modelo Gemini Pro) y Gemini Advanced (modelo Gemini Ultra).
  • Gemma: dos modelos diferentes. Google ha segmentado a Gemma en dos versiones para así adaptar el modelo a las necesidades de cada proyecto: Gemma 2B y Gemma 7B. Por los benchmarks mostrados por Google, Gemma 7B es un 50 % más potente que Gemma 2B.

Fácil, ¿eh? Como usuarios lo más sensato es quedarnos con el nombre de Gemini, ya que es la herramienta que vamos a utilizar en Android y en la web. Gemma va dirigida a desarrolladores y empresas, en sí no es una solución final para el usuario. Con esta IA Google apunta directamente a Llama 2, de Meta, el modelo abierto más utilizado en los proyectos actuales.

Gemma es una IA generativa destinada a desarrolladores y Gemini ofrece herramientas dirigidas al usuario final

¿Acabará Google unificando herramientas y denominaciones para así seguir perfilando su catálogo? Seguro: dado que actualmente va por detrás en un terreno donde siempre había dominado, nos esperan cambios de rumbo en un intento de volverse a colocar como referencia. Y, como Open AI ha demostrado estar claramente por delante del resto en IA generativa, con un Sora que nos dejó deslumbrados (y algo preocupados), a Google no le va a quedar más remedio que arriesgar. Veremos lo que duran Gemini y Gemma.

Imagen de portada | Google

En Xataka Móvil | No esperaba que ChatGPT pudiera sorprenderme más, hasta que probé a conversar con él. Rompió la barrera de la realidad

Inicio