START Conference Manager    

Large-scale audio-recordings to study infant language acquisition

Camila Scaff, Marvin Lavechin and Alejandrina Cristia


Categories

category:  Poster
Session:  5 December Session P3: South and Central American Languages Poster Session

Additional Fields

 
Abstract:   Studies of individual and socioeconomic variation in North America suggest that infant-directed speech quantities determine children’s language advancement, inspiring interventions to get parents to talk more to their child. In this context, day-long audio-recordings analysed with proprietary software trained on American data are increasingly used to measure children’s input and production, but there is little research on how fair this technique is to other languages and cultures. We present results from 10 Tsimane’ children and their families (>270h audio, ~5h hand-annotated). Identification Error Rates averaged 62% (range 0-100%), inviting further work on open source diarization solutions that are retrainable.

 
Resume:   Numerosos estudios sobre la variación individual y socioeconómica en América del Norte sugieren que las cantidades de habla dirigida a los bebés determinan el avance del lenguaje de los niños, lo cual ha inspirado intervenciones para que los padres hablen más con sus hijos. En este contexto, las grabaciones de audio de día completo analizadas con un software patentado entrenado en datos estadounidenses se utilizan cada vez más para medir la producción de los niños y cuanto se les habla, pero hay poca investigación sobre cuán justa es esta técnica para otros idiomas y culturas. Presentamos resultados de 10 niños Tsimane' y sus familias (> 270h de audio, ~ 5h anotadas a mano). Las tasas de error de identificación promediaron el 62% (rango 0-100%), invitando soluciones de diarización con código abierto y re-entrenable.

File(s)

[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)