•  57
    This paper aims at giving an overview of the VALIBEL database as it stands today. In addition, it opens up new perspectives with respect to more recent advances regarding (semi-automatic) annotation, as well as with regard to new corpora created to address societal issues (cf. the Corpage corpus). Particular attention is paid here to the automatic detection of disfluencies in the corpus data (using the DisMo program), with a developmental view on language and aging.
  •  74
    Expériences sur l’analyse morphosyntaxique des corpus oraux avec l’annotateur multi-niveaux DisMo
    with Giulia Barreca
    Corela. Cognition, Représentation, Langage 21 (HS). 2017.
    L’annotation des corpus oraux présente des défis particuliers, liés aux caractéristiques de la langue parlée et sa transcription. Si la méthodologie d’analyse et les outils d’annotation automatique doivent être adaptés à ces défis, il est toutefois souhaitable de garder la possibilité de comparer un corpus oral avec un corpus écrit, sur base d’un « dénominateur commun », et d’enrichir l’annotation avec des couches supplémentaires pour décrire les phénomènes propres à l’oral. Dans cet article nou…Read more