Notícias | Berlim, 13/04/2020

Machine leaning na BMG

A BMG é sinônimo de artistas mundialmente famosos e emocionantes artistas emergentes, selos conhecidos e mais de 870 colaboradores apaixonados em diversos países que formam a divisão musical da Bertelsmann, fundada em 2008, uma das empresas mais bem-sucedidas do mundo. Mas não é apenas o compromisso e a criatividade da BMG que são de classe mundial, o mesmo pode ser dito para a infraestrutura de TI por trás da companhia. E sem essa TI de alto desempenho, a BMG não seria capaz de fornecer serviços valiosos que tornam a empresa tão popular e vital para os artistas. Entre outras coisas, o time de TI da BMG garante que os músicos recebam seus royalties a que têm direito – de países de todo o mundo e para qualquer uso que tenha sido feito de suas músicas, sejam direitos editoriais, renda com a venda e transmissão de álbuns ou o uso de música em séries ou comerciais de TV. Isso envolve receber, registrar, comparar e avaliar milhões de dados todos os dias. E, para garantir que isso aconteça com mais rapidez, precisão e eficiência, a equipe de TI da BMG está constantemente trabalhando na melhoria dos processos. Uma das maneiras de fazê-lo é uma dependência crescente do aprendizado de máquina, ou seja, processos de machine learning. 

O fato de a BMG desenvolver e operar sua própria infraestrutura de TI é ainda mais notável, já que quase não existem soluções de software existentes para empresas de música. “Nós mesmos construímos o núcleo de TI com o apoio de desenvolvedores externos porque não existem soluções disponíveis no mercado para empresas musicais”, disse Gaurav Mittal, vice-presidente do grupo IT & Systems, cuja equipe internacional é responsável por grande parte desse trabalho. A BMG terceirizou 100% do trabalho de programação e Mittal estima que cerca de 80 a 90 programadores externos trabalham em tempo integral no desenvolvimento dos sistemas de TI da BMG. 

A quantidade de dados cresce significativamente 

Um de seus projetos de machine learning tem o potencial de apoiar os colaboradores do departamento de Royalties da BMG, onde os royalties de um determinado compositor vêm de diversas fontes e são registrados e agrupados. Tais fontes podem incluir, por exemplo, bancos de dados de sociedades de colecionadores de músicas, como o GEMA, na Alemanha, que coletam royalties quando uma música é executada ou tocada publicamente na rádio. Ao longo dos anos, com o crescente número de artistas e músicas gerenciados pela BMG, a quantidade de dados que precisa ser processada pelo departamento de royalties cresceu significativamente. "O maior problema aqui é combinar dados provenientes de muitas fontes diferentes e em diferentes formatos com os nossos dados", disse Beate Steinicke, diretora de projetos da Royalties Data Services & Solutions, da área de Royalties. Desde 2013, o Smart Match é usado para corresponder automaticamente esses dados recebidos aos dados da BMG. Isso significa que mesmo pequenos erros, como variações na ortografia dos títulos das músicas ou nomes de artistas e compositores, podem ser detectados e corrigidos automaticamente usando a comparação de texto. Durante esta etapa, "96% dos dados recebidos já são combinados automaticamente graças ao Smart Match", explicou Mittal. 

Mas mesmo o Smart Match encontra seus limites com 4% dos dados fornecidos, ou seja, com 4% das músicas relatadas ao BMG que estão sujeitas a cobrança. "E estamos falando de cerca de 1,2 milhão de músicas por ano aqui, um número enorme que deve ser verificado manualmente por nossos colegas, música por música", disse Beate Steinicke, matemática que está na BMG há sete anos. Isso exigiu um processo de verificação adicional, no qual os dados manuais são verificados duas vezes. Para automatizar ainda mais esse processo complexo, Gaurav Mittal e Beate Steinicke lançaram um novo projeto no início do ano passado, que, em uma etapa adicional do processo, usa o aprendizado de máquina para atribuir automaticamente músicas que foram processadas manualmente. “Isso só pode ser feito com aprendizado de máquina, ou seja, um sistema de machine learning.

Dados manuais e machine learning

E o aprendizado é exatamente o que o machine learning com seu algoritmo inteligente faz atualmente. Entre março e abril de 2019, Mittal e Steinicke, com o apoio de programadores, testaram um sistema pela primeira vez em um programa piloto para determinar se ele teria o potencial que esperavam. Hoje, o sistema está sendo executado no modo de aprendizado paralelo ao sistema convencional. "Isso significa que executamos os dois processos: correspondência manual e correspondência de aprendizado de máquina em paralelo e depois os comparamos", explicou Mittal. O objetivo é, obviamente, alcançar a maior consistência possível entre os dois processos. "Quando chegarmos a cerca de 97% ou 98% de correspondência, passaremos da manual para a automática". No momento, a taxa de correspondência ainda está abaixo de 90%. "Mas achamos que estaremos lá até o final do segundo trimestre de 2020", comentou Steinicke. O líder do projeto espera que o número de músicas que exigem correspondência manual caia de 1,2 milhão para apenas 24 mil por ano. E então seus colegas do departamento de Royalties terão mais liberdade para se dedicar a outras tarefas de contabilidade de royalties. "Com menos correspondência manual, nossos colegas poderão se concentrar na qualidade e não na quantidade", diz Steinicke. 

Enquanto isso, Gaurav Mittal já está prevendo outros grandes projetos de TI para melhorar o desempenho da BMG, também investindo no aprendizado de máquina. “Gosto desses projetos porque são muito reais e tangíveis e levam diretamente a resultados”, disse o especialista em TI, que estudou ciência da computação e trabalha na BMG há oito anos. Juntamente com sua equipe, ele estuda dez casos de uso para aprendizado de máquina na companhia. Um desses projetos, o próximo da lista, centra-se na questão de como o machine learning pode ser usado para verificar pagamentos recebidos, ou melhor, como os pagamentos ausentes podem ser detectados e revisados automaticamente. "Se, por exemplo, a Netflix pagar pelo uso de uma música da BMG em uma de suas séries, e esses pagamentos pararem repentinamente, o sistema deve reconhecer que algo não está certo", explicou Mittal. O mesmo se aplicaria se os royalties de um hit fossem pagos de todos os países europeus, exceto um. "No futuro, o sistema poderá detectar esses desvios incomuns e sinalizá-los para uma análise mais aprofundada”. 

Descobrindo novos talentos

Outro projeto que ainda é uma visão de futuro é o reconhecimento de talentos, o trabalho tradicional de A&R de uma gravadora. "Aqui, o machine learning pode ajudar a descobrir novos talentos musicais, fazendo com que o sistema os procure sistematicamente na Internet", diz Mittal. Se, por exemplo, uma nova música de um artista desconhecido atraísse a atenção positiva dos usuários de mídia social, espera-se que o aprendizado de máquina ajude a descobri-la rapidamente. "Nossos colegas de A&R poderiam abordar esse artista ainda mais cedo", acredita Mittal. 

Além do aprendizado de máquina, Mittal também vê um grande potencial para a área de TI da BMG no campo da automação de processos robóticos (RPA). "O RPA é sobre vincular e automatizar processos recorrentes e sucessivos", diz o especialista. Recentemente, foi implementado um processo de RPA no qual as contas da plataforma BMG Songs foram vinculadas ao superordenado departamento financeiro da BMG e ao sistema SAP, da Bertelsmann. “O aprendizado de máquina e o RPA nos permitem tornar-nos mais eficientes, flexíveis e precisos”, conclui Mittal. “E isso se tornará ainda mais importante para nossos negócios no futuro”.