Canvas & Ratio
Choose your destination platform format
Layout Template
Choose a content structure for your slides
Preset Themes
Typography & Sizing
Brand Kit Customization
AGENCYConfigure brand assets for headers & footers
Outro Slide CTA
Customize your closing call-to-action slide
Background Pattern
Build Your Carousel
Drag and drop any post card below onto a slide, or use the quick buttons to insert content/images instantly!

Para usar el nuevo Claude Opus 4.8, encontré nuevos métodos para ahorrar tokens. Te lo muestro todo aquí ↓ Opus 4.8 salió el 28 de mayo de 2026. La mayoría lo usa exactamente igual que Opus 4.7. Es un error. Anthropic integró 6 mecanismos específicos para controlar tu consumo de tokens desde el lanzamiento. Aún nadie habla de esto.



1️⃣ 𝗘𝗟 𝗖𝗢𝗡𝗧𝗥𝗢𝗟 𝗗𝗘 𝗘𝗦𝗙𝗨𝗘𝗥𝗭𝗢: 𝟱 𝗡𝗜𝗩𝗘𝗟𝗘𝗦, 𝟭 𝗦𝗢𝗟𝗔 𝗗𝗘𝗖𝗜𝗦𝗜𝗢́𝗡 𝗤𝗨𝗘 𝗧𝗢𝗠𝗔𝗥 Opus 4.8 introdujo un sistema explícito de esfuerzo con 5 niveles. Low: respuestas rápidas, menos tokens. Perfecto para clasificación, resúmenes simples y reformulaciones. Medium: equilibrio entre calidad y costo. High: el predeterminado. Para todo lo que requiere reflexión real. Max: solo para tareas complejas. xhigh (Ultra Code): reservado para código avanzado en Claude Code. El problema: Opus 4.8 viene en High por defecto para todo. Si le pides resumir un email, Claude gasta el mismo esfuerzo que para resolver una arquitectura técnica. Cómo configurarlo: en <a target="_blank" href="http://claude.ai" color="blue">claude.ai</a>, mira el selector de esfuerzo al lado del modelo. Vía API, el parámetro se llama `effort`. Elegir Low para tareas simples te ahorra tokens de razonamiento en cada llamada.

2️⃣ 𝗘𝗟 𝗖𝗔𝗖𝗛𝗘́ 𝗗𝗘 𝗣𝗥𝗢𝗠𝗣𝗧𝗦 𝗕𝗔𝗝𝗔 𝗔 𝟭.𝟬𝟮𝟰 𝗧𝗢𝗞𝗘𝗡𝗦 Esta es la novedad técnica más rentable del lanzamiento. El mínimo del caché de prompts pasó de 4.096 a 1.024 tokens. Prompts que eran demasiado cortos para almacenarse en caché en Opus 4.7 ahora pueden crear entradas de caché sin cambiar ni una línea de código. Los tokens leídos desde el caché cuestan una fracción del precio estándar. En llamadas frecuentes con el mismo contexto base, el ahorro puede llegar hasta el 90%. Si tu prompt está apenas por debajo de 1.024 tokens, ampliarlo un poco vale totalmente el costo adicional.

⚠️ Antes de continuar, quería decirte que con @Adamaestr0_ hemos creado una guía completa sobre Claude Code. Es gratis :) El enlace aquí → <a target="_blank" href="https://alejoxadam.beehiiv.com/guia-claude-code" color="blue">alejoxadam.beehiiv.com/guia-claude-co…</a>

3️⃣ 𝗟𝗢𝗦 𝗦𝗬𝗦𝗧𝗘𝗠 𝗠𝗘𝗦𝗦𝗔𝗚𝗘𝗦 𝗔 𝗠𝗜𝗧𝗔𝗗 𝗗𝗘 𝗟𝗔 𝗖𝗢𝗡𝗩𝗘𝗥𝗦𝗔𝗖𝗜𝗢́𝗡 (𝗧𝗢𝗧𝗔𝗟𝗠𝗘𝗡𝗧𝗘 𝗡𝗨𝗘𝗩𝗢 𝗘𝗡 4.8) Es la funcionalidad menos conocida del lanzamiento. Antes de Opus 4.8: si querías modificar las instrucciones del sistema durante una conversación, tenías que empezar todo desde cero. Perdías todos los hits de caché anteriores. Desde el 28 de mayo, la API acepta mensajes con rol "system" directamente dentro del array de mensajes, después de un turno del usuario. Eso significa que puedes añadir instrucciones actualizadas más adelante en conversaciones largas sin reiniciar el prompt del sistema completo, preservando los hits de caché anteriores y reduciendo costos de entrada en loops agénticos. Lo que esto significa en la práctica: Actualizas las instrucciones de Claude sin romper el caché. Ajustas presupuestos de tokens en tiempo real. Inyectas contexto a mitad del proceso. Modificas permisos durante tareas largas. Sin este método, cada actualización obligaba a reiniciar todo.

4️⃣ 𝗔𝗗𝗔𝗣𝗧𝗜𝗩𝗘 𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚: 𝗗𝗘𝗝𝗔 𝗤𝗨𝗘 𝗖𝗟𝗔𝗨𝗗𝗘 𝗗𝗘𝗖𝗜𝗗𝗔 𝗖𝗨𝗔́𝗡𝗗𝗢 𝗣𝗘𝗡𝗦𝗔𝗥 En High y Max, Claude piensa casi siempre, sin importar la complejidad de la pregunta. Muchas veces es innecesario. Con Adaptive Thinking activado en Low o Medium, Claude decide por sí mismo si la pregunta merece una fase de razonamiento. Para tareas simples puede saltársela. Para problemas complejos, la activa automáticamente. Solo usas tokens de razonamiento cuando realmente hacen falta. Vía API: parámetro `thinking` con tipo `"adaptive"`, combinado con un esfuerzo Medium o Low.

5️⃣ 𝗘𝗟 𝗥𝗢𝗨𝗧𝗜𝗡𝗚 𝗗𝗘 𝗠𝗢𝗗𝗘𝗟𝗢𝗦: 𝗟𝗔 𝗠𝗘𝗧𝗢𝗗𝗢𝗟𝗢𝗚𝗜́𝗔 𝗤𝗨𝗘 𝗠𝗔́𝗦 𝗔𝗛𝗢𝗥𝗥𝗔 Opus 4.8 no está hecho para todo. Esto es lo que los equipos que usan Claude a gran escala entendieron desde el lanzamiento: Sonnet 4.6 maneja el 80% de las tareas diarias. Reformulación, extracción, clasificación, redacción estándar. Opus 4.8 entra en el 20% más difícil: razonamiento complejo, arquitectura, decisiones críticas. Resultado: una reducción de costos de hasta 5x en la mayoría de llamadas, sin perder calidad donde realmente importa. En <a target="_blank" href="http://claude.ai" color="blue">claude.ai</a>: eliges el modelo manualmente antes de cada conversación.

6️⃣ 𝗘𝗦𝗣𝗘𝗖𝗜𝗙𝗜𝗖𝗔 𝗦𝗜𝗘𝗠𝗣𝗥𝗘 𝗘𝗟 𝗙𝗢𝗥𝗠𝗔𝗧𝗢 𝗗𝗘 𝗦𝗔𝗟𝗜𝗗𝗔 Opus 4.8 es más completo y preciso que 4.7. Lo que también significa que genera más tokens si no le pones límites. Un prompt sin formato explícito deja que Claude decida la longitud. Especifica un formato de salida conciso cuando no necesites respuestas largas. Usa el parámetro `max_tokens` para cortar la respuesta en el momento adecuado. En vez de: “Resume este documento.” Escribe: “Resúmelo en máximo 5 puntos, 1 frase por punto, sin introducción ni conclusión.” En grandes volúmenes de llamadas, la diferencia en tokens es significativa.

7️⃣ 𝗖𝗨𝗔𝗡𝗗𝗢 𝗖𝗢𝗠𝗕𝗜𝗡𝗔𝗦 𝗘𝗦𝗧𝗢𝗦 6 𝗠𝗘́𝗧𝗢𝗗𝗢𝗦… La mayoría de personas usa Opus 4.8 como si fuera Opus 4.7 con un número diferente. Ahí es donde los tokens se disparan. Cuando combinas control de esfuerzo adaptado a cada tarea, caché activo desde 1.024 tokens, system messages sin romper el caché, Adaptive Thinking, routing entre Opus y Sonnet y formato de salida explícito... El costo real de usar Opus 4.8 se convierte en una fracción de lo que pensabas pagar. Anthropic construyó estos mecanismos precisamente para eso. Pero nadie te obliga a usarlos.

Lo que esto revela sobre la IA en 2026: Los modelos son cada vez más potentes. Y cada vez más caros si no sabes configurarlos. La verdadera habilidad ya no es simplemente “usar IA”. Es saber configurar el esfuerzo, gestionar el caché, enrutar solicitudes y controlar los outputs. Los equipos que dominan esto gastan 5 veces menos por resultados equivalentes. Los que no lo hacen pagan el precio completo en cada llamada.

Gracias por leer hasta aquí 🙏 Opus 4.8 salió hace 3 días. Estos métodos funcionan desde ya. Si aprendiste algo útil, comparte este hilo con alguien que use Claude regularmente. Un RT siempre se agradece ❤️ <a target="_blank" href="https://twitter.com/1682400367856832512/status/2061054598580928800" color="blue">x.com/16824003678568…</a>