O acervo do NURC-SP Digital é composto por três corpora: Corpus Mínimo, CATNA e Corpus de Áudios, disponíveis sob os termos da licença
Creative Commons CC BY-NC-ND 4.0 license. Cada corpus é composto por inquéritos (gravações de conversas/exposições) realizadas na década de 70 e 80, durante o período de coleta do projeto NURC.
O Corpus Mínimo contém 21 inquéritos. Ganhou este apelido por ser uma partição mínima selecionada para os primeiros trabalhos de transcrição do material do NURC-SP. Foi o primeiro a ser completado e sua transcrição original foi revisada no projeto Tarsila – NURC-SP, gerando a versão .txt para cada inquérito. Foi segmentado automaticamente pelo alinhador forçado aeneas e revisado manualmente pelos bolsistas do projeto Tarsila (cf. Santos et al., 2022, nas publicações).
Material: O material de cada inquérito compreende os seguintes arquivos:
arquivos de áudios (formato mp3 e wave),
arquivo de transcrição (formato txt e/ou pdf)
e arquivo de alinhamento entre a transcrição e o áudio (formato TextGrid). Para acessar os arquivos click no inquérito desejado.
Filtro: Os inquéritos também foram classificados de acordo com as características dos participantes e as condições da gravação.
Você pode filtrar o material desejado com base nestas informações.
Para saber mais detalhes sobre a classificação de cada inquérito e as legendas utilizadas, acesse a página Informações no menu Corpora ou
acesse aqui.
Busca: No menu Busca é possível pesquisar um termo dentro das transcrições.
Digite um termo para selecionar os inquéritos que contenham aquele termo na transcrição.