Spotify se ha convertido en la mejor plataforma de streaming para ofrecernos  acceso a una gran variedad de canciones y es aquí donde entra en juego el algortimo de Spotify. Las mejoras en Spotify más comentadas en los últimos tiempos tienen que ver con los avances en el algoritmo de la aplicación, que es una de las cuestiones más valoradas por los usuarios.

Seguro que has recibido las recomendaciones personalizadas como son el descubrimiento semanal ( Discovery week) o el radar de novedades (Release radar), las cuales son playlist que están basadas en el algoritmo de Spotify.

¿Qué es el algoritmo de Spotify?

Los algoritmos por lo general, se definen como aquellos conjuntos de reglas, con el fin de ordenar y procesar datos de una manera mucho más automatizada. En este aspecto, el algoritmo de Spotify tiene en cuenta todas las características de lo que escuchan, comparten, guardan y hasta desechan las personas en relación a sus playlist.

La plataforma cuenta con un departamento llamado Misión de Datos, en el que hay psicólogos sociales, físicos de partículas y neurocientíficos computacionales, y cuya labor es psicoanalizar a los usuarios a partir de su uso de la plataforma. Luego, venden esa información a anunciantes porque es mucho más interesante para las empresas acercarse a sus potenciales clientes a través de su estado de ánimo que de los estilos y cantantes más escuchados.

¿Cuánta información procesa el algoritmo de Spotify para conocer mis gustos?

Alrededor de 600GB de datos diarios. La compañía tiene unos 28 Petabytes de datos distribuidos en cuatro centros de datos y su recomendación semanal es el ejemplo perfecto de ese procesamiento de información.

algoritmo spotify

¿Cómo funcionan el algoritmo de Spotify?¿Cuáles son las playlist algorítmicas?

Es común tener la sensación de que Spotify conoce nuestros gustos musicales, incluso mejor que nosotros mismos. Por ello, nos sugiere canciones que nunca antes habíamos escuchado y que coinciden perfectamente con nuestros gustos.

Hay dos playlist que funcionan con el algoritmo de Spotify, una de ellas es descubrimiento semanal o Discover Weekly,  formado por 30 canciones que no has escuchado con anterioridad, pero que seguramente te van a gustar. Debido a que las recomendaciones se basan en el historial de reproducción previa.

Mientras que, en Radar de novedades o Release Radarse recomiendan todos los lanzamientos recientes que hayan realizado tus artistas favoritos, y se genera de manera automática todos los viernes de cada semana, dependiendo de los artistas que sigas, o que escuches de manera habitual.

Los tres modelos de Recomendación utilizados por el algoritmo de Spotify

Spotify cuenta con tres mecanismos para realizar las recomendaciones:

  • El primero se denomina “modelos de filtrado colaborativo”, se centra en el análisis de su comportamiento y el de los demás.
  • El segundo “modelos de procesamiento de lenguaje natural”, se basa en el análisis de texto.
  • El tercero, “modelos de audio sin procesar”, se fundamenta en el análisis de las pistas de audio en bruto.

Primer modelo de Recomendación. Filtrado Colaborativo.

La primera compañía en utilizar este modelo fue Netflix.

Analiza el comportamiento de los distintos usuarios respecto a sus productos. Básicamente consiste en “los usuarios interesados en X también están interesados en Y y en Z”. Es decir, los usuarios que escucharon X canción, también es probable que escuchasen Y y Z.

Pondré un ejemplo más gráfico:

  • Escucha las canciones X,V y Z
  • Escucha las canciones V, W y Z.
  • Spotify recomienda a A escuchar la canción W
  • Spotify recomienda a B escuchar la canción X

Segundo modelo de Recomendación. Procesamiento del Lenguaje Natural.

El segundo mecanismo detrás de las recomendaciones de Spotify es el del procesamiento en lenguaje natural. Se trata de un modelo que se nutre de las palabras habituales utilizadas en artículos de noticias, en páginas de internet, en blogs, entre otros textos.

Es un enfoque clásico que combina componentes batch Big Data para el análisis masivo de los recomendadores con una capa de tiempo real usando NoSql (concretamente Cassandra) para realizar las recomendaciones cuando el usuario utiliza el servicio. Es decir el programa rastrea adjetivos, o cualquier tipo de lenguaje particular que se utilice para hacer referencia a determinados artistas y canciones. También busca en los artículos cuáles son aquellos artistas y canciones que se mencionan junto con otros.

Tercer modelo de Recomendación. Audio sin procesar.

Es un modelo basado en el audio en bruto.  Este  modelo de audio es aquel que se concentra en las características de las canciones. Para ello mide distintas cuestiones como el tiempo estimado de duración, la clave, el modo, el tempo y el volumen.

Estas mediciones le permiten a Spotify trazar similitudes entre canciones y así ver para qué usuarios son apropiadas en función de su propio historial de escucha. La ventaja de este último modelo es que permite a la aplicación sugerir nuevos artistas que no son registrados, en general, por los otros dos mecanismos.

Básicamente consiste en analizar la información sobre las características del audio mediante un tipo de red neuronal conocida como convolutional neural network. Las redes neuronales convolucionales son la misma tecnología utilizada en el software de reconocimiento facial. En el caso de Spotify, se han modificado para su uso en datos de audio en lugar de píxeles.  Este algoritmo es muy usado también en ámbitos como el análisis de imágenes o de video, ya que permite hacer una extracción automática de las características del objeto analizado.

Usar este recomendador en este caso concreto es muy interesante, ya que con él sí puede evaluar una nueva canción aunque no tenga histórico, porque la descompone en sus características musicales y esas sí las puede comparar contra el histórico del usuario.