He puesto a prueba ambos modelos en una serie de tareas, y aquí estoy para revelarte los resultados. ¿Listo para sumergirte? Vamos allá.
⚠️ Aunque los ejemplos tanto de claude-3.5 como los de GPT-4 están en inglés, tu puedes perfectamente escribirlos en Español, ya que es indistinto el lenguaje.
Claude-3. 5 contra GPT-4
Esto parece un déjà vu porque hice un experimento similar con GPT-4 y GPT-4o. Esta vez, utilicé las mismas indicaciones para mantener la coherencia.
Esto es lo que probé:
- Recuperación de información
- Escritura con precisión contextual
- Procesamiento del lenguaje
- Narración creativa
1/ Recuperación de información
En primer lugar, pedí a ambos modelos que resumieran un artículo y proporcionaran las principales conclusiones.
Esta es la tarea
Resume el artículo de la URL
GPT-4 gana esta ronda. ¿Por qué? Claude-3,5 no puede navegar por Internet.
Resultado: GPT-4 gana
Razón: Claude no puede acceder a la web
Un comienzo difícil para Claude, pero la competición está lejos de terminar.
2/ Escribir con precisión contextual
A continuación, he puesto a prueba sus habilidades de redacción de anuncios.
He aquí la tarea:
Como redactor comercial directo, escribe un anuncio en Facebook para un [producto: «chocolate vegano»] dirigido a [público objetivo: «madres ocupadas de 30 años»]. Utiliza un [tono: «informal»] y un [lenguaje: «sencillo y sarcástico»] que resuenen con el público. Incluir una llamada a la acción (CTA) humorística.
Ambos modelos consiguieron copias decentes dentro de las limitaciones.
Resultado: Empate
Motivo: Ambos modelos proporcionaron respuestas «suficientemente buenas».
3/ Procesamiento del lenguaje
Para esta tarea, desafié a ambos modelos con un ejercicio peculiar:
Ésta es la tarea:
Sustituye una de cada tres palabras del texto por el sinónimo más cercano. Responde sólo con el nuevo texto.
"Un día, Hulk decidió que estaba cansado de romper cosas y que quería probar algo diferente, así que abrió una pastelería llamada “Hulk's Smash Cakes”. Los pasteles estaban deliciosos, pero hacerlos llegar a los clientes de una pieza era todo un reto, ya que el suave toque de Hulk seguía siendo como un pequeño terremoto».
Ambos modelos realizaron la tarea correctamente.
Resultado: Empate
Motivo: Ambos modelos siguieron las instrucciones con precisión.
4/ Cuento creativo
Por último, pedí a ambos modelos que crearan un cuento para dormir con unas pautas concretas.
Esta es la tarea
Crea un cuento de 10 frases con un héroe masculino y una antagonista femenina. El antagonista gana, la historia tiene un mensaje positivo y un final humorístico, es sencilla, está ambientada en el futuro y está escrita en un nivel de lectura de tercer grado.
Claude-3,5 sobresalió aquí, mientras que GPT-4 no alcanzó la marca de las 10 frases.
Resultado: Claude-3,5 victorias
Motivo: GPT-4 no cumplió el requisito de 10 frases.
El veredicto
De las cuatro pruebas, hemos tenido dos empates, en los que cada modelo ha ganado una tarea.
Ésta es mi opinión: Claude-3.5 brilla en escritura creativa, pero carece de acceso a Internet. A pesar de ello, es un gran rival para GPT-4.
¿Qué opinas? ¿Eres del equipo GPT o del equipo Claude? ¿O estás esperando a que la próxima gran IA entre en el ring?