El nuevo modelo Gemini 1.5 Flash de Google es de otro mundo 😲.

33 veces más barato que GPT-4o pero tiene un contexto un 700% mayor: 1 millón de tokens.

¿Qué es 1 millón de fichas en el mundo real? Aproximadamente:

Más de 1 hora de vídeo
Más de 30.000 líneas de código
Más de 700.000 palabras

❌GPT-4o coste:

Entrada: 2,50 dólares por millón de fichas
Salida: 10 dólares por millón de fichas
Entrada en caché: 1,25 $ por millón de tokens

✅ Géminis 1.5 Coste Flash:

Entrada: 0,075 dólares por millón de fichas.
Salida: 0,30 dólares por millón de tokens
Entrada en caché: 0,01875 dólares por millón de tokens.

Y luego está la versión mini Flash-8B para tareas rentables: 66 veces más barata que la GPT-4o:

Y lo mejor es la multimodalidad: puede razonar con texto, archivos, imágenes y audio de forma integrada y compleja.

Y 1.5 Flash tiene casi todas las capacidades de Pro pero mucho más rápido. Y como desarrollador puedes empezar a usarlas ahora.

Gemini 1.5 Pro fue probado con una película muda de 44 minutos y, sorprendentemente, analizó fácilmente la película en varios puntos de la trama y eventos. Incluso señaló pequeños detalles que la mayoría de nosotros pasaríamos por alto a primera vista.

Por su parte, la API GPT-4o sólo permite trabajar con texto e imágenes.

Puedes crear, probar y perfeccionar indicaciones fácilmente en AI Studio de Google, totalmente gratis.

No cuenta en tu facturación como en OpenAI playground.

No hay más que ver el poder de Google AI Studio: crear una receta de comida a partir de una imagen:

He subido este delicioso pan de gettyimages:

Ahora

¿Y si quiero que la respuesta tenga un formato especializado para mi API o algo así?

Entonces sólo tienes que activar el modo JSON y especificar el esquema de respuesta:

OpenAI playground también tiene esto, pero no es tan intuitivo trabajar con él.

Otra mejora que Gemini tiene sobre OpenAI es lo creativo que puede ser.

En Gemini puedes aumentar la temperatura de 0 a 200% para controlar lo aleatorias y creativas que son las respuestas:

Mientras tanto, en OpenAI, si intentas ir mucho más allá del 100%, lo más probable es que obtengas un montón de tonterías.

Y aquí está la mejor parte - cuando haya terminado de crear su solicitud sólo puede utilizar el código Get - fácilmente copiar y pegar el código API repetitivo y avanzar a la velocidad del rayo en su desarrollo.

Funciona en varios lenguajes, incluidos Kotlin, Swift y Dart: flujo de trabajo de IA eficiente en desarrollo móvil.

En OpenAI playground puedes obtener el código para Python y JavaScript.

Reflexiones finales

Gemini 1.5 Flash cambia las reglas del juego al ofrecer capacidades inigualables por una fracción de su coste.

Con su avanzada facilidad de uso multimodal, su generoso precio gratuito y su potencial creativo, establece un nuevo estándar para la IA dejando a GPT-4o en el polvo.

Fuente