Tecnologia

Avaliando Similaridade entre Músicas Utilizando Técnicas de PLN

Técnicas como a PLN, Processamento de Língua Natural podem ajudar na avaliação de similaridade entre músicas.

Nós já analisamos dados musicais buscando entender como as músicas e gêneros musicais estão relacionados.

E para isso utilizamos informações obtidas de metadados que compõem um conjunto de dados formado a partir de dados do portal musical brasileiro Vagalume. 

Ao utilizar metadados, nós ignoramos informações que poderiam ser obtidas através do conteúdo da música, como áudio e letras. 

Neste post, nós vamos utilizar duas técnicas de PLN para processar as letras das músicas, construir representações e analisar como são os relacionamentos entre músicas e artistas com esse tipo de representação.

Sobre o Processamento de Língua Natural, PLN

Antes de iniciar, vamos fazer um breve resumo da área de Processamento de Língua Natural. 

PLN é uma área que engloba diversos desafios de interpretação e geração de língua natural, sendo necessário fazer a modelagem da tarefa e, em função das necessidades, utilizar técnicas variadas de áreas diversas, como Linguística e Computação.

Sumarização automática, Análise do Discurso, Tradução, Compreensão da língua natural, Marcação de classe gramatical e Reconhecimento de fala são exemplos de tarefas com ampla exploração.

E essas tarefas podem ser estendidas a muitas aplicações como Filtros de e-mail, Chamadas telefônicas digitais, Assistentes virtuais inteligentes e Tradução de idiomas. 

A partir dos anos 2000, houve o fortalecimento do uso das técnicas de aprendizado de máquina em função da maior quantidade de dados disponíveis e também do aumento do poder computacional. 

Desde então, o aprendizado de máquina passou a ter grande relevância, principalmente com o advento dos modelos de aprendizado profundo.

PLN é uma área super atual e com muitas oportunidades para exploração.

Vamos utilizar, ao longo desse conteúdo, duas técnicas diferentes para representar letras das músicas de forma que possamos avaliar a similaridade entre outras músicas.

Bidirectional Encoder Representations from Transformers – BERT

Esta é uma técnica muito atual e poderosa para representação textual. 

É um modelo baseado em redes neurais profundas desenvolvido pela Google que possibilita gerar representações para textos considerando seu contexto.

Bag of Words – BoW

Esta é uma das técnicas mais simples de representação textual. 

Nela, o texto é representado como um conjunto de palavras, desconsiderando a estrutura gramatical e qualquer ordenação. 

A representação de uma frase é dada pelo vetor que indica a presença (frequência) de uma palavra e ausência das demais.


Exemplo de representação de frase usando bag of words

Analisando a Similaridade entre as músicas com as técnicas de PLN

Vamos comparar como as duas técnicas mensuram a similaridade entre músicas e artistas.

Iniciando por artistas, também usaremos Maroon 5 para comparação, como no post de análise de dados musicais.

Podemos notar que utilizando o BERT, conseguimos encontrar mais artistas similares e que apenas o artista Sam Smith foi apontado como similar em ambas técnicas.


Artistas similares ao artista Maroon 5 – BERT
  / Artistas similares ao artista Maroon 5 – BoW

Quando acrescentamos os gêneros dos artistas, notamos que Maroon 5 pode ter muitas influências de estilos diferentes.

Voltando à escolha do line-up para o Rock In Rio, aqui temos recursos para escolher os artistas e o quão plural o festival será.


Gêneros e artistas similares ao artista Maroon 5 – BERT   /  Gêneros e artistas similares ao artista Maroon 5 – BoW

Ao buscar por músicas similares, encontramos um cenário com poucas diferenças quanto aos gêneros, porém os artistas e as músicas relacionadas à “Que se chama amor” são bem distintos. 


Gêneros, artistas e músicas similares à música “Que se chama amor” – BERT    


Gêneros, artistas e músicas similares à música “Que se chama amor” – BoW

Concluindo a Análise

Nesse post nós utilizamos a informação da letra de músicas para representá-las e construímos redes de relacionamentos bem diferentes das redes que vimos na análise de dados musicais

Pudemos notar diferentes redes, ao considerar diferentes estratégias para representar as letras musicais. 

Em PLN, existem diversas técnicas para representar informação textual, a técnica ideal deve ser adotada de acordo com a tarefa explorada. 

Em posts futuros, nós iremos repetir o processo de criação de redes com músicas similares, porém usaremos informações do áudio da música. 

Será apresentado técnicas de Processamento de Áudio e comparado às redes construídas nos artigos anteriores para discutirmos novamente sobre a grande diversidade de consumo musical que temos no Brasil. 

Que tal ouvir as playlists da Accurate no Spotify?

Tecnologias de Análises para a Construção de Projetos é na Accurate

A PLN é uma das inúmeras técnicas e tecnologias utilizadas na Accurate para análises e estudos na construção de projetos. 

Saiba mais sobre nossos projetos e o que utilizamos acessando o site e também acompanhando o Blog. 

Não deixe também de compartilhar esse conteúdo e nos acompanhar nas Redes Sociais:  Facebook, Instagram, Twitter, Linkedin e YouTube.

Ah, e se você é um profissional de T.I ou áreas similares, acesse a nossa página de carreiras, veja as vagas em aberto e cadastre-se.

Autor

Aline Martins
Profissional da área de Customer Success, no mercado de trabalho desde 2018. Atuo buscando melhorias na forma de se relacionar com o cliente, garantindo sempre a melhor experiência para todos os clientes e colaboradores envolvidos.
Aline Martins

Profissional da área de Customer Success, no mercado de trabalho desde 2018. Atuo buscando melhorias na forma de se relacionar com o cliente, garantindo sempre a melhor experiência para todos os clientes e colaboradores envolvidos.

Postagens recentes

Processo inovativo em TI: Como implementar e alcançar resultados transformadores em sua Infraestrutura

A transformação digital acelerou a necessidade de inovação em Tecnologia da Informação (TI). No ambiente…

1 semana atrás

Como o desenvolvimento de FAQBots inteligentes pode otimizar Atendimentos e Operações

  O desenvolvimento de FAQBots inteligentes é uma solução que vem ganhando espaço, permitindo que…

2 semanas atrás

Força de Trabalho conectada à IA: Velocidade e eficiência nas operações

  O avanço da Inteligência Artificial (IA) está remodelando a maneira como empresas conduzem suas…

3 semanas atrás

Estratégia multicloud: Reduza custos e otimize investimentos

  Adotar uma estratégia multicloud para redução de custos é essencial para empresas que buscam…

1 mês atrás

Dashboards para indicadores de negócio: A chave para decisões estratégicas inteligentes

No cenário atual, onde a transformação digital não é mais uma opção, mas uma necessidade,…

2 meses atrás

E-commerce 5.0 e IA: O futuro inteligente das compras online

O comércio eletrônico tem evoluído de maneira acelerada nas últimas décadas, e estamos agora às…

2 meses atrás