@ecommartinez: 10 repositorios de GitHub para...
@ecommartinez
8 views
Jun 30, 2026
Advertisement
2
1. github.com/RVC-Boss/GPT-S…
Le das 5 segundos de audio y ya clona la voz. Con 1 minuto entrenas un modelo que pasa por persona real. Funciona en español, inglés, japonés, coreano y chino. 59 mil estrellas y licencia MIT. El favorito de la comunidad para clonar con poquísimo material.
Le das 5 segundos de audio y ya clona la voz. Con 1 minuto entrenas un modelo que pasa por persona real. Funciona en español, inglés, japonés, coreano y chino. 59 mil estrellas y licencia MIT. El favorito de la comunidad para clonar con poquísimo material.
3
2. github.com/CorentinJ/Real…
El que empezó todo. Copia una voz en 5 segundos y genera habla en tiempo real. Lo montó un investigador belga para su tesis y reventó GitHub. 59 mil estrellas. El punto de partida de medio sector del audio con IA.
El que empezó todo. Copia una voz en 5 segundos y genera habla en tiempo real. Lo montó un investigador belga para su tesis y reventó GitHub. 59 mil estrellas. El punto de partida de medio sector del audio con IA.
4
3. github.com/coqui-ai/TTS
Copia una voz con 6 segundos de muestra y la hace hablar 17 idiomas con el acento de cada uno. La clonas en español y esa misma voz habla francés o japonés sin que la grabes en ese idioma. Lo mantiene la comunidad después de que la empresa cerró. Gratis para proyectos personales e investigación.
Copia una voz con 6 segundos de muestra y la hace hablar 17 idiomas con el acento de cada uno. La clonas en español y esa misma voz habla francés o japonés sin que la grabes en ese idioma. Lo mantiene la comunidad después de que la empresa cerró. Gratis para proyectos personales e investigación.
5
4. github.com/myshell-ai/Ope…
Clonación instantánea hecha por el MIT y MyShell. Copia el tono exacto y controla emoción, ritmo y pausas. La V2 habla español, francés, inglés, chino, japonés y coreano de fábrica. Licencia MIT, libre para uso comercial. Se ha usado decenas de millones de veces.
Clonación instantánea hecha por el MIT y MyShell. Copia el tono exacto y controla emoción, ritmo y pausas. La V2 habla español, francés, inglés, chino, japonés y coreano de fábrica. Licencia MIT, libre para uso comercial. Se ha usado decenas de millones de veces.
6
5. github.com/suno-ai/bark
Genera voz con emoción de verdad: risas, suspiros, tono que sube y baja. Mantiene la música y el ruido de fondo del audio que le pasas. Va fino para narración y personajes. Licencia MIT, libre para producto comercial.
Genera voz con emoción de verdad: risas, suspiros, tono que sube y baja. Mantiene la música y el ruido de fondo del audio que le pasas. Va fino para narración y personajes. Licencia MIT, libre para producto comercial.
7
6. github.com/RVC-Project/Re…
Entrena un modelo de voz decente con menos de 10 minutos de audio. Convierte tu voz en otra en tiempo real, el motor detrás de medio TikTok de covers con voz de famosos. Licencia MIT.
Entrena un modelo de voz decente con menos de 10 minutos de audio. Convierte tu voz en otra en tiempo real, el motor detrás de medio TikTok de covers con voz de famosos. Licencia MIT.
8
7. github.com/fishaudio/fish…
Modelo multilingüe de primer nivel para clonar voz y pasar texto a voz. Calidad que compite con las APIs de pago, corriendo en tu propia máquina. Más de 20 mil estrellas.
Modelo multilingüe de primer nivel para clonar voz y pasar texto a voz. Calidad que compite con las APIs de pago, corriendo en tu propia máquina. Más de 20 mil estrellas.
9
8. github.com/resemble-ai/ch…
El estado del arte de 2025 en código abierto. Voz expresiva, en tiempo real y con control de emoción. La alternativa directa a ElevenLabs, montada por Resemble AI. Licencia MIT.
El estado del arte de 2025 en código abierto. Voz expresiva, en tiempo real y con control de emoción. La alternativa directa a ElevenLabs, montada por Resemble AI. Licencia MIT.
10
9. github.com/SWivid/F5-TTS
Clona una voz a partir de un clip corto y genera audio rápido y fluido. Arquitectura nueva de flow matching que suena natural sin tanto ajuste manual. Licencia MIT.
Clona una voz a partir de un clip corto y genera audio rápido y fluido. Arquitectura nueva de flow matching que suena natural sin tanto ajuste manual. Licencia MIT.
11
10. github.com/index-tts/inde…
Sistema zero-shot de nivel industrial. Le pasas una muestra y reproduce la voz sin entrenar nada. 21 mil estrellas. Pensado para producción de verdad.
Sistema zero-shot de nivel industrial. Le pasas una muestra y reproduce la voz sin entrenar nada. 21 mil estrellas. Pensado para producción de verdad.
12
Gracias por llegar hasta aquí 🙏
Espero que este hilo te haya sido útil.
Si quieres que haga más contenido como este, házmelo saber con un ❤️ o un RT
Espero que este hilo te haya sido útil.
Si quieres que haga más contenido como este, házmelo saber con un ❤️ o un RT
View Tweet













