Técnicas como a PLN, Processamento de Língua Natural podem ajudar na avaliação de similaridade entre músicas.
Nós já analisamos dados musicais buscando entender como as músicas e gêneros musicais estão relacionados.
E para isso utilizamos informações obtidas de metadados que compõem um conjunto de dados formado a partir de dados do portal musical brasileiro Vagalume.
Ao utilizar metadados, nós ignoramos informações que poderiam ser obtidas através do conteúdo da música, como áudio e letras.
Neste post, nós vamos utilizar duas técnicas de PLN para processar as letras das músicas, construir representações e analisar como são os relacionamentos entre músicas e artistas com esse tipo de representação.
Sobre o Processamento de Língua Natural, PLN
Antes de iniciar, vamos fazer um breve resumo da área de Processamento de Língua Natural.
PLN é uma área que engloba diversos desafios de interpretação e geração de língua natural, sendo necessário fazer a modelagem da tarefa e, em função das necessidades, utilizar técnicas variadas de áreas diversas, como Linguística e Computação.
Sumarização automática, Análise do Discurso, Tradução, Compreensão da língua natural, Marcação de classe gramatical e Reconhecimento de fala são exemplos de tarefas com ampla exploração.
E essas tarefas podem ser estendidas a muitas aplicações como Filtros de e-mail, Chamadas telefônicas digitais, Assistentes virtuais inteligentes e Tradução de idiomas.
A partir dos anos 2000, houve o fortalecimento do uso das técnicas de aprendizado de máquina em função da maior quantidade de dados disponíveis e também do aumento do poder computacional.
Desde então, o aprendizado de máquina passou a ter grande relevância, principalmente com o advento dos modelos de aprendizado profundo.
PLN é uma área super atual e com muitas oportunidades para exploração.
Vamos utilizar, ao longo desse conteúdo, duas técnicas diferentes para representar letras das músicas de forma que possamos avaliar a similaridade entre outras músicas.
Bidirectional Encoder Representations from Transformers – BERT
Esta é uma técnica muito atual e poderosa para representação textual.
É um modelo baseado em redes neurais profundas desenvolvido pela Google que possibilita gerar representações para textos considerando seu contexto.
Bag of Words – BoW
Esta é uma das técnicas mais simples de representação textual.
Nela, o texto é representado como um conjunto de palavras, desconsiderando a estrutura gramatical e qualquer ordenação.
A representação de uma frase é dada pelo vetor que indica a presença (frequência) de uma palavra e ausência das demais.
Exemplo de representação de frase usando bag of words
Analisando a Similaridade entre as músicas com as técnicas de PLN
Vamos comparar como as duas técnicas mensuram a similaridade entre músicas e artistas.
Iniciando por artistas, também usaremos Maroon 5 para comparação, como no post de análise de dados musicais.
Podemos notar que utilizando o BERT, conseguimos encontrar mais artistas similares e que apenas o artista Sam Smith foi apontado como similar em ambas técnicas.
Artistas similares ao artista Maroon 5 – BERT / Artistas similares ao artista Maroon 5 – BoW
Quando acrescentamos os gêneros dos artistas, notamos que Maroon 5 pode ter muitas influências de estilos diferentes.
Voltando à escolha do line-up para o Rock In Rio, aqui temos recursos para escolher os artistas e o quão plural o festival será.
Gêneros e artistas similares ao artista Maroon 5 – BERT / Gêneros e artistas similares ao artista Maroon 5 – BoW
Ao buscar por músicas similares, encontramos um cenário com poucas diferenças quanto aos gêneros, porém os artistas e as músicas relacionadas à “Que se chama amor” são bem distintos.
Gêneros, artistas e músicas similares à música “Que se chama amor” – BERT
Gêneros, artistas e músicas similares à música “Que se chama amor” – BoW
Concluindo a Análise
Nesse post nós utilizamos a informação da letra de músicas para representá-las e construímos redes de relacionamentos bem diferentes das redes que vimos na análise de dados musicais.
Pudemos notar diferentes redes, ao considerar diferentes estratégias para representar as letras musicais.
Em PLN, existem diversas técnicas para representar informação textual, a técnica ideal deve ser adotada de acordo com a tarefa explorada.
Em posts futuros, nós iremos repetir o processo de criação de redes com músicas similares, porém usaremos informações do áudio da música.
Será apresentado técnicas de Processamento de Áudio e comparado às redes construídas nos artigos anteriores para discutirmos novamente sobre a grande diversidade de consumo musical que temos no Brasil.
Que tal ouvir as playlists da Accurate no Spotify?
Tecnologias de Análises para a Construção de Projetos é na Accurate
A PLN é uma das inúmeras técnicas e tecnologias utilizadas na Accurate para análises e estudos na construção de projetos.
Saiba mais sobre nossos projetos e o que utilizamos acessando o site e também acompanhando o Blog.
Não deixe também de compartilhar esse conteúdo e nos acompanhar nas Redes Sociais: Facebook, Instagram, Twitter, Linkedin e YouTube.
Ah, e se você é um profissional de T.I ou áreas similares, acesse a nossa página de carreiras, veja as vagas em aberto e cadastre-se.
Autor
- Doutorando em Ciências da Computação no ICMC/USP, está sempre ouvindo alguma música e, às vezes, atuando como cientista de dados e pesquisador tentando descobrir padrões nos dados musicais. Gosta de esportes, viajar, aprender novas tecnologias e de receber o link de playlists. Mande a sua também!