Proposta de Trabalho Final de Curso 2005/2006
Pretende-se desenvolver um sistema que permita transcrever automaticamente a fala dos diversos intervenientes numa áudio-conferência.
A utilização do reconhecimento automático de fala para a transcrição de reuniões é relativamente recente, dadas as limitações da tecnologia actual, mas tem um campo potencial de aplicações muito vasto, passando pelas actas de parlamentos, de sessões de áudio/vídeo-conferência, de tribunais, etc. Em áudio-conferências, há problemas acrescidos dada que os intervenientes não têm contacto visual entre eles, o que provoca a interrupção de intervenções simultâneas.
A recolha de material para treino e teste será feita em áudio-conferências montadas sobre um sistema de voz sobre IP em que um dos canais é utilizado somente para a gravação. Estas aúdio-conferências decorrerão em inglês, o que implica "portar" o reconhecedor de fala AUDIMUS, desenvolvido no L2F, para esta língua. Esta será a primeira tarefa que pode ser realizada com base em material de fala e texto em inglês já existente. Para além desta tarefa inicial, o trabalho compreende outras tarefas:
A segmentação/agrupamento do áudio gravado por oradores é feita recorrendo a um módulo já desenvolvido.
Embora não seja essencial, a frequência da disciplina "Processamento de Fala" (1º semestre, LEEC) poderá ajudar na compreensão da tecnologia de reconhecimento de fala.