Este trabalho compreende 3 partes:
As técnicas actuais de detecção de emoções em fala têm o problema de serem treinadas com base em corpora de emoções fingidas por actores em cenários não realistas, e de darem melhores resultados para emoções extremas, pouco representadas no corpus de treino. A maior parte dos sistemas correntes explora pistas prosódicas locais, em vez de pistas de maior alcance que tentaremos explorar neste trabalho.