Extracção de Informação em Canções (proposal)

From L²F

Proposta de Tese de Mestrado 2007/2008

Orientação

Enquadramento

A extracção de informação de conteúdo musical (MIR - Music Information Retrieval) tem sido alvo de desenvolvimentos significativos e constitui actualmente uma das novas áreas de pesquisa do Laboratório de Sistemas de Língua Falada (L2F). Tendo focado a sua actividade na extracção de informação de documentos falados, o laboratório pretende agora expandir a abrangência da sua actividade para incluir conteúdos musicais.

Objectivos

O objectivo desta actividade é o desenvolvimento de um sistema que permita conciliar várias abordagens para extracção e interpretação de informação obtida de conteúdo musical. Pretende-se maximizar a relevância dos dados extraídos de excertos de música cantada para que possam ser empregues como querys a uma base de dados de música, permitindo a identificação dos excertos.

Descrição

Actualmente, a maioria bases de dados de música existentes utilizam um conjunto reduzido de metadados associados às músicas, constituídos geralmente por título, álbum, autor, data, etc. Tais sistemas não incluem metadados relativos ao conteúdo melódico/harmónico da música. A utilização deste tipo de informação tornaria possível um tipo de pesquisa mais ambicioso, permitindo fazer querys à base de dados a partir de informação extraída de excertos da música ou algumas notas cantadas ao microfone (QBH - Query by Humming). Seria também desejável o alargamento desta pesquisa à letra das canções, implicando a utilização de analisadores que permitam separar a parte instrumental da cantada e a aplicação de técnicas de reconhecimento de fala a esta última. Isto implica a inclusão da letra das canções na base de dados como metainformação. Existem já inúmeras técnicas de análise de conteúdo musical que permitem gerar metadados, como os modelos baseados na pesquisa em texto (utilizando MIDI – Musical Instrument Digital Interface) e os modelos vectoriais, entre outros. Há no entanto margem para um aumento de precisão dos resultados obtidos, sendo que as bases de dados pesquisadas com sucesso por estes métodos são ainda de dimensão relativamente reduzida. O sucesso relativo das estratégias de análise do conteúdo musical desenvolvidas até agora e o facto de estas se focarem em parâmetros distintos das músicas, como é o caso da letra, da melodia e da harmonia, sugere que a combinação dos resultados de várias análises segundo um modelo apropriado possa gerar resultados mais precisos. É na tentativa de combinação cooperativa das estratégias já existentes para a abordagem do problema da extracção de informação de conteúdos musicais que incide o projecto proposto.

Requisitos

Disciplina de Processamento de Fala (1º semestre)

Resultado Esperado

Pretende-se a concepção de uma framework que sirva de base à integração de múltiplos mecanismos de análise, reconhecimento, interpretação e visualização de informação extraída de conteúdo musical.

Observações