Quantitative analysis of culture using millions of digitized books
Nous avons construit un corpus de textes numérisés contenant environ 4% de tous les livres jamais imprimés. L’analyse de ce corpus nous permet d’étudier quantitativement les tendances culturelles. Nous sondons le vaste terrain de « culturomics », en mettant l’accent sur les phénomènes linguistiques et culturels qui ont été reflétées dans la langue anglaise entre 1800 et 2000. Nous montrons comment cette approche peut fournir des indications sur les domaines aussi variés que la lexicographie, l’évolution de la grammaire, de la mémoire collective , l’adoption de la technologie, la recherche de la renommée, la censure et l’épidémiologie historique. Culturomics étend les limites d’enquête quantitative rigoureuse à un large éventail de nouveaux phénomènes couvrant les sciences sociales et humaines. Traduit à l'aide de Google Translate