Visualize Thread by @AlanDaitch

✨ Visual Editor

palette Canvas & Background

Presets

Custom Colors

Gradient:arrow_forward

Text Color:

Gradient Angle135°

Background Pattern

Grain Texture

Aspect Ratio

style Card Style

Preset

Padding40px

Card Radius16px

Enable Card Shadow

Glassmorphism Effect

Show Watermark AGENCY

Show Timestamps

Show X Logo

text_fields Typography

Font Family

Font Size16px

Alan Daitch

@AlanDaitch

Google acaba de lanzar esta BOMBA atómica de paper, quizás comparable con el que comenzó la revolución de IA.
No exagero: explica por qué ChatGPT, Gemini,etc tienen el mismo problema: no pueden aprender después de su entrenamiento. La solución que proponen es MUY elegante: 🧵

Alan Daitch

@AlanDaitch

El problema: todos los LLMs sufren de “amnesia digital”. Pueden acceder a lo inmediato (tu conversación actual) y al pasado lejano (su pre-entrenamiento). Pero no pueden consolidar nada nuevo en memoria de largo plazo.

Alan Daitch

@AlanDaitch

Los investigadores miraron cómo resuelve esto el cerebro humano y encontraron la clave: el cerebro procesa información en MÚLTIPLES ESCALAS TEMPORALES simultáneamente.
No es solo “profundidad” de capas: es frecuencia de actualización a diferentes velocidades.

Alan Daitch

@AlanDaitch

La revelación que cambia todo: lo que llamamos “deep learning” es solo UNA dimensión (apilar capas).
Existe otra ortogonal que ignorábamos: NIVELES de optimización anidados operando a diferentes velocidades.

El aprendizaje real necesita ambas.

Alan Daitch

@AlanDaitch

Imaginate tu cerebro como un edificio. Hasta ahora en IA solo construíamos edificios MÁS ALTOS (más pisos/capas). Pero resulta que existe otra dimensión: el TIEMPO.
Algunos pisos se renuevan cada día, otros cada mes, otros cada año. Ambas dimensiones son necesarias.

Alan Daitch

@AlanDaitch

Descubrieron algo increíble revisando cómo funcionan las redes neuronales: los “optimizadores” (las herramientas que entrenan los modelos) en realidad SON TAMBIÉN modelos de memoria.

Alan Daitch

@AlanDaitch

Pensalo así: cuando entrenás una IA, creés que estás haciendo UNA cosa. Pero en realidad estás corriendo múltiples procesos de aprendizaje anidados como muñecas rusas, cada uno operando a su propia velocidad.
Simplemente no lo veíamos hasta ahora.

Alan Daitch

@AlanDaitch

Suena complejo, pero explica por qué los LLMs no pueden aprender después del entrenamiento: tienen memoria súper rápida (la conversación) y memoria congelada (lo aprendido en pre-training).

Pero les falta TODO el espectro del medio—las memorias que se consolidan gradualmente.

Alan Daitch

@AlanDaitch

La solución que proponen: “Nested Learning”.
En vez de una memoria rápida y una lenta, creá un ESPECTRO CONTINUO de memorias.
Como el cerebro: recordás lo que desayunaste (rápido), lo que hiciste el mes pasado (medio), tu infancia (lento).
Un gradiente, no un switch.

Alan Daitch

@AlanDaitch

Crearon HOPE: un modelo con este sistema de memoria en espectro. Y la parte más loca: aprende a modificarse a sí mismo mientras funciona.
No solo “recuerda mejor”—aprende cómo debe aprender. Como cuando aprendés a estudiar más eficientemente mientras estudiás.

Alan Daitch

@AlanDaitch

Los resultados son buenos, pero lo revolucionario es la idea: durante décadas construimos IA solo pensando en “más capas, más grande”.

Este paper dice “che, existe otra dimensión completa que ignoramos: el tiempo y las frecuencias de actualización”.

Alan Daitch

@AlanDaitch

Si funciona, esto cambia:
•Modelos que aprenden continuamente de tus conversaciones sin olvidar
•IA que mejora mientras la usás, no solo antes de lanzarla
•Una nueva forma de pensar diseño: no solo tamaño, sino escalas temporales

Al ser Google, creo que VA a funcionar

Alan Daitch

@AlanDaitch

Link a la fuente: abehrouz.github.io/files/NL.pdf

Si te gustó, seguime para seguir aprendiendo sobre IA sin humo 🤓

Alan Daitch

@AlanDaitch

¿Cuán grande es esto según Google? Esto es lo que twiteó uno de los tipos más grosos ayer 😅

View Tweet

Generated by Thread Navigator

100%

view_carousel Carousel Studio NEW

Press ⌘ + S to quick-export