La Inteligencia Artificial es muy buena herramienta para automatizar procesos y tomar decisiones. Pero es muy, muy mala en creatividad. O eso solemos pensar. Junto con Capture Intelligence, agencia de Samy Alliance especializada en Data y Research, nos dimos cuenta de que hay muchas creaciones con poca originalidad. Un buen ejemplo de ello son los villancicos, que no son precisamente creativos. Así que nos preguntamos, ¿por qué no podría una IA llevar a cabo un proceso similar al creativo con las pautas adecuadas? Entrenémosla para que escriba letras navideñas y veamos qué es capaz de idear por nosotros.
Los datos
El primer paso consistió en recopilar los datos con los que entrenamos a nuestro algoritmo de Inteligencia Artificial. Teníamos dos opciones: utilizar las letras de los números 1 de Navidad de los últimos años para crear una canción destinada a entrar directa al primer puesto del Top 10 o utilizar las letras de las canciones más navideñas para crear una canción que capte mejor el espíritu de la Navidad. Nos decantamos por la segunda opción después de ver el elenco de números 1 de Navidad de los últimos años, plagado de ganadores del Factor X y cantantes como Cardi B o Ariana Grande, bastante alejados de lo que cualquiera de nosotros relacionaría con una la idea que todos tenemos en la cabeza de la Navidad.
Una vez resuelto esto, el siguiente paso consistió en decidir qué canciones debíamos incorporar. Queríamos incluir también números 1 americanos para maximizar el potencial viral de nuestra obra maestra, y encontramos tres listas de reproducción. La Lista de los 40 Principales a la americana, Billboard Hot 100 y dos de Spotify: “Christmas Hits” y “Christmas Songs Holiday Music 2021”. Una vez que tuvimos el mix perfecto de canciones, el trabajo final consistió en extraer las letras de las canciones y crear un conjunto de datos, para lo cual resultó muy útil el paquete «geniusr», que nos permitió acceder a la API de Genius y obtener las 318 letras de canciones navideñas únicas, listas para pasarlas por un algoritmo de aprendizaje automático.
El algoritmo
Ahora teníamos que centrar nuestra atención en la propia IA. Hay un montón de algoritmos potenciales de IA entre los que elegir, cada uno con sus propios puntos fuertes y débiles. No hay una implementación que se adapte a todas las soluciones, así que, como nota, si alguna vez hablas con un proveedor que dice tener una «solución/herramienta de Inteligencia Artificial», pregunta siempre qué algoritmo utiliza. Es una buena forma de comprobar si saben de lo que habla o si sólo es palabrería.
En nuestro caso, hay algunas características de nuestros datos y nuestro objetivo que destacan a la hora de seleccionar un método. En primer lugar, no tenemos una variable dependiente con la que juzgar la precisión. No estamos intentando predecir un valor o automatizar una toma de decisiones que luego podamos verificar, sino que tendremos que leer lo que sale y comprobar si es bueno o no. En segundo lugar, la única variable independiente que tenemos es el propio lenguaje de la letra. La IA no entiende realmente el significado semántico de las palabras, sino que se basa en las probabilidades y en la frecuencia con la que las palabras coinciden para poder estructurarlas correctamente.
Teniendo en cuenta todo esto, el mejor método sería utilizar una cadena de Markov. Sin entrar en demasiados detalles técnicos, una de sus características principales es que, en lugar de simular a partir de muestras independientes, pueden simular a lo largo de todo un proceso en el que cada probabilidad depende del último paso de la cadena. La razón por la que esto es muy útil para nosotros es que capta algunas de las características del lenguaje humano. Cuando escribimos y componemos frases (o, en este caso, letras de canciones), cada palabra de su vocabulario no tiene la misma probabilidad de ser seleccionada y esas probabilidades cambian en función de la palabra que se haya seleccionado previamente. Por ejemplo, si la primera palabra que elegimos fue «coles», la siguiente palabra que tendría una probabilidad mucho mayor de ser seleccionada sería «bruselas».
El modelo
Ahora que hemos elegido una cadena de Markov, tenemos que construir nuestro modelo. Si simplemente lo entrenáramos con las letras de las canciones, el algoritmo buscaría la probabilidad de que cada palabra siga a todas las demás en el conjunto de datos, creando una enorme matriz de probabilidad relativa. Esta es la información básica que necesitamos, pero necesitamos una forma de hacer que esa información sea accesible y nos proporcione palabras en una estructura similar a la de una canción. Para ello, empleamos nuestra propia función, que puede ayudar al usuario a establecer las “reglas creativas” típicas de una composición.
El resultado final es una función en la que podemos seleccionar una palabra inicial y el modelo nos devuelve el top n de términos que podrían seguirla basándose en probabilidades. El usuario puede elegir en base a esta lista para asegurarse de que hay cierto grado de coherencia en la letra. Como verás, en nuestra canción todavía hay algunas letras algo extravagantes que delatan que han sido escritas por una máquina («Momma’s gonna have some pumpkin», algo así como “Mamá va a tener algo de calabaza”), pero en general, la canción que hemos obtenido es bastante navideña.
La canción
Lo único que quedaba era poner la letra en manos del talento humano. Recurrimos a nuestros amigos de Groove Machine Ltd, que produjeron Share Happiness (at Christmas) y superaron con creces nuestras expectativas de cómo podrían sonar las palabras generadas por nuestra IA.
Así que ya lo tenemos: hemos creado una Inteligencia Artificial capaz de producir una canción navideña tras otra. En el futuro, estamos pensando en crear una interfaz de usuario sencilla para la función de selección de palabras, de modo que cualquiera pueda utilizarla para escribir su propia obra maestra navideña.
Por ahora, sin embargo, aquí está nuestra propia canción navideña basada en datos: Share Happiness (at Christmas), creada por Groove Machine Ltd.
Data Science y Negocio
Tanto Data Science como la Inteligencia Artificial están presentes en nuestro día a día. Cuando empleamos asistentes de voz o cuando Google o las plataformas de Streaming nos ofrecen sus recomendaciones. Enfocado a la marca, estas herramientas nos permiten tomar decisiones estratégicas y crear modelos de previsión altamente rentables.
La cadena de Markov, por ejemplo, tiene una función muy útil a la hora de hacer previsiones de negocio a largo plazo al ser capaz de hacer combinaciones probables de los datos en base al recorrido de la marca. Muchas veces, resulta difícil determinar la evolución de ciertos aspectos de la propia marca que dependen de factores que varían constantemente. La cadena de Markov ayuda a la planificación y es un gran aliado para un manager con visión estratégica.
En definitiva, con estas herramientas podemos tomar decisiones de negocio más inteligentes. Mejores segmentaciones de audiencia, análisis de sentimiento para conocer qué se está diciendo sobre la marca o la percepción de los consumidores sobre nuestra última campaña lanzada en redes sociales, predecir tendencias y detectar nuevos nichos; así como adelantarnos al mercado innovando en productos que cubrirán las necesidades reales de los consumidores, lo que se traduce en un aumento directo del retorno de la inversión.