El canal de YouTube 30 Hertz utiliza una IA para crear canciones nuevas de artistas de rap fallecidos o colaboraciones muy locas entre artistas actuales. Hay desde canciones nuevas de Biggie hasta un tema de Tupac, Biggie y Big L.
La herramienta que usa para crear este tipo de canciones de "Tacotron 2", con el cual puede variar la sintetización de la voz y creando una instrumental puede crear un sin fin de canciones nuevas del artista que él desee. Básicamente, el autor está trabajando como productor de una IA, una locura propia del siglo XXI.
Temas muy locos de todo tipo de artistas
En cada vídeo 30 Hertz ya nos avisa de que todas las voces son generadas de manera sintetizada por una IA y que las canciones que vamos a escuchar no son "reales" aunque el término correcto sería que no están interpretadas por una persona.
El autor de las canciones no solo le gustan los temas más "clásicos" del rap, sino que hace verdaderas marcianadas. Tenemos por ejemplo una canción de Biggie sobre Dragon Ball o un beef entre Eminem y el creador de Facebook, Mark Zuckerberg. Además de todo esto, también tenemos unas colaboraciones increíbles como un tema con Biggie, Big L y Tupac o un beef de Kanye West contra el mismo.
La verdad es que imaginación no le falta al dueño del canal, porque aunque sea el modelo de inteligencia artificial el que canta recordamos que él tiene que escribir todas las letras aparte de hacer las instrumentales, así que curro le echa a todo esto.
Por supuesto esto generará la controversia de muchas personas por si es realmente ético realizar canciones con la voz de artistas fallecidos. Vivimos en un mundo que está poniendo al límite las reglas de privacidad, pues dentro de poco las IA serán capaces de hacerse pasar perfectamente por una persona.
Esto no ocurre solo en la voz, pues ya se ha visto otros modelos basados en deep learning que pueden sustituir la imagen de una persona en vídeos. Técnicas como Deep Fake (que es la unión entre deep leaning y fake "falso"), se han utilizado en diferentes películas para traer a la vida actores fallecidos o crear una versión rejuvenecida de los mismos.
Pero, de la misma manera estas técnicas se han usado de manera fraudulenta para crear vídeos de contenido sexual falsos o buscar sustituir la identidad de una persona. Como siempre la tecnología nos brinda un montón de oportunidades, pero no todo el mundo las usa de manera ética.
¿Cómo funciona exactamente?
Tacotron 2 es una herramienta de deep learning, es decir inteligencia artificial basada en modelos de redes neuronales. Más concretamente esta herramienta está desarrollada en Pytorch, el framework de Facebook para este tipo de implementaciones basadas en tensores.
Según el manuscrito en el que fue publicado Tacotron que lleva como título "Natural TTS Synthesis by conditioning wavenet on mel spectrogram", la herramienta puede crear un modelo que es capaz de predecir los diferentes niveles del espectrograma de la voz. Esto lo utiliza usando diferentes arquitecturas basadas en redes neuronales de memoria a corto plazo (LSTM) con atención.
Teniendo un conjunto de datos amplio se puede entrenar el modelo con diferentes audios de la voz del artista al que se desea imitar. Con esto posteriormente, se puede reproducir cualquier sonido de ese espectro de voz. Posteriormente, solo quedaría introducir cualquier texto de entrada y podrá ser reproducido en el espectro deseado. De esta manera puede imitar la voz incluso cantando de cualquier persona de la que se tengan suficientes grabaciones.
Como podéis ver es una herramienta con infinidad de posibilidades que se podría usar incluso de manera más profesional para poder terminar canciones de artistas fallecidos. O incluso, poder interpretar aquellas canciones que quedaron escritas, pero nunca fueron rapeadas por las grandes leyendas.