✨ Visual Editor

close

palette Canvas & Background

Gradient:arrow_forward
Text Color:
135°

style Card Style

40px
16px

text_fields Typography

16px
Guillermo Casaus
@_guillecasaus
🚨 Google acaba de cargarse la industria de la extracción de documentos.

Ha lanzado LangExtract, una librería que convierte texto desordenado en datos estructurados y verificables, incluso en documentos enormes.

Es gratis y open-source 👇
Thread image
Guillermo Casaus
@_guillecasaus
1/ ¿Qué hace exactamente LangExtract?

- Extrae datos estructurados desde texto desordenado
- Mapea cada entidad a su posición exacta en el documento
- Funciona con documentos de 100+ páginas sin perder precisión
- Genera HTML interactivo para verificar los resultados
- Compatible con Gemini, Ollama y modelos locales
Guillermo Casaus
@_guillecasaus
2/ Lo interesante es todo lo que reemplaza

- Regex frágiles
- Pipelines NER hechos a mano
- APIs carísimas de extracción
- Entrada manual de datos

Defines la tarea con unos pocos ejemplos, apuntas a cualquier documento y obtienes resultados estructurados y verificables.
Guillermo Casaus
@_guillecasaus
Guillermo Casaus
@_guillecasaus
BONUS🪙

Obtén las últimas noticias sobre inteligencia artificial y marketing digital. Tips, guías prácticas y mucho más.

Únete ahora👇
gdnagency.com/newsletter-gpt/
Generated by Thread Navigator
100%
view_carousel Carousel Studio NEW
Press + S to quick-export