triploidie


Nombres, faits et tendances façonnant votre monde
Chaque semaine, des dizaines de millions d'Américains écoutent alors que leurs chefs religieux fournissent un enseignement, un confort et des conseils de la chaire. Mais qu'est-ce qu'ils entendent?
Aujourd'hui, le Centre de recherche sur Pew a publié «la chaire numérique», son analyse d'une vaste bande de sermons dispensée dans des églises américaines au cours d'une période de huit semaines en 2019. Des années à faire, le projet emploie des outils avancés - et souvent construits - informatique Identifier, transcrire et analyser près de 50 000 sermons que les Églises américaines vivaient ou partagées sur leurs sites Web.
Nous avons parlé avec Dennis Quinn, le scientifique social informatique de l'équipe de labs de données du Centre qui a dirigé le projet, sur la manière dont elle s'est réunie et les défis particuliers qui surviennent lorsque la religion répond à de grandes données. L'entretien a été édité et condensé pour clarté et concision.
Je m'intéressais aux grandes données lorsque je suis venu travailler au projet de restriction religieuses du Centre. J'ai donc demandé à Alan Cooperman, notre directeur de la recherche religieuse, s'il avait des idées pouvant bénéficier d'une grande approche de données, et il a immédiatement évoqué l'idée d'analyser les sermons.
La question fondamentale était de savoir si cela était même réalisable. Par exemple, existe-t-il un moyen d'obtenir une liste complète d'églises avec leurs sites Web? Cela nous a conduits à Google Maps, que nous développions une base de données d'églises. Était-il une façon pour les ordinateurs d'identifier les sermons sur les sites Web des églises? Cela nous a amenés à développer la technologie d'apprentissage de la machine que nous avions l'habitude d'identifier les pages où les congrégations partagent leurs sermons.

Un projet comme celui-ci couvre tout, de la minutie de la conception de la base de données et du code informatique aux gros problèmes de politique et de direction. Je devais vraiment faire attention à une décision technique que je demandais à un ingénieur de faire en août 2017 ne viendrait pas une conséquence et une conséquence inattendue pour les autres en 2019.
Par exemple, à l'époque, nous avons recherché des congrégations sur Google Maps, nous ne pouvions pas choisir un terme unique inclusif pour tous les types de congrégations, nous avons donc utilisé le terme "église". Il y avait un terme alternatif, «lieu de culte», mais cela n'était plus soutenu dans le programme. C'est un exemple d'une seule ligne de code écrite à l'automne 2017, ce qui a eu d'énormes implications sur la manière dont nous avons décrit nos données à l'automne 2019 lorsque nous écrivions le rapport. L'effet "Papillon" d'un grand projet de données est stupéfiante - les petites décisions techniques que vous faites à l'avant ont des implications colossales pour la direction ultérieure du projet.
Les sermons incluent souvent les moments religieux privés des gens, qu'ils ont connus de manière réelle et souvent profonde. Bien entendu, les églises ont choisi de les partager en ligne. Nous avons donc estimé qu'il était approprié de les collecter et d'analyser, mais nous devions nous assurer que nous faisions l'intentage de ces données de manière respectueuse.
Dans un sens plus technique, il y avait beaucoup de fois qu'un site Web aurait un mot de passe pour se rendre aux sermons ou serait visible mais stocké de manière à être difficile à atteindre, et nous avons décidé que nous n'étions pas va toucher ceux-ci. S'il y a eu des efforts de la part de la congrégation pour éviter toute sorte de collecte automatisée, nous n'avons fait aucun effort pour passer cela. Nous fixons également des limites sur la rapidité avec laquelle le programme de raclage pourrait se déplacer entre les pages, de manière à ce que nous ne puissions pas surcharger les sites Web congrégation. Nous avons également décidé de précaution à la confidentialité ajoutée de ne pas énumérer leur nom ni leurs emplacements de congrégations spécifiques ni faire de l'un des textes de sermon disponibles.
Le grattoir a trouvé des sermons sur environ 6 000 sur environ 38 000 sites Web de congrégation que nous avons examinés. N'oubliez pas que depuis que ces congrégations ont des sites Web sur Google Maps, ils sont déjà plus en ligne que certains. Mais si vous y réfléchissez au point de vue d'un pasteur, un sermon est le fruit de votre travail, il n'est donc pas nécessairement étranger que vous voudriez que cela soit entendu par le monde plus large - ou, à ce sujet, disponible pour les congrégents qui peuvent 'T faire à l'église.
L'effet "Papillon" d'un grand projet de données est stupéfiante - les petites décisions techniques que vous faites à l'avant ont des implications colossales pour la direction ultérieure du projet.

Dennis Quinn
Lorsque nous, au centre, nous décidons de lancer un nouveau projet de recherche, nous nous demandons si cela est quelque chose que nous pouvons le faire de manière significative et rigoureuse qui exploite nos capacités et nos ressources techniques. Bien sûr, les données que nous avons collectées ne sont toujours pas représentatives de tous les Sermons américains - ce sont toujours des sermons que les congrégations avec des sites Web ont choisi de partager en ligne - mais en les collectant de congrégations réelles, nous savons au moins qu'ils peuvent nous parler de ce que La véritable bande de vrais féculiers a vraiment entendu au cours d'une période de huit semaines en 2019. Nous avons estimé que si nous allions essayer de construire une fenêtre limitée mais perspicace dans des services religieux américains, nous allions le faire de la meilleure façon possible. C'était une sorte de «aller ou rentrer à la maison».
La chose que j'étais systématiquement émerveillée, c'était le volume d'informations dont nous travaillions, et pas seulement en mégaoctets. Le sermon médian de l'ensemble de données est d'environ 5 500 mots, ce qui est la longueur d'un article de magazine de bonne taille. J'ai calculé que cela représente environ 80% de plus que le document fédéraliste 10. C'est beaucoup d'informations - nous en avons 50 000 - et il y a des gens là-bas, et il y a des gens là-bas intériorisant cette information sur le monde qui les entoure hebdomadaire. Et, dans un sens technique, le fait que nous travaillions avec l'équivalent de 50 000 caractéristiques de magazine intimidant franchement.
Les lecteurs doivent aborder les résultats avec ces limitations à l'esprit. Les congrégations qui ont partagé ces sermons sont activées par la définition de la technologie. Ils sont également plus grands et plus urbains - et bien sûr, ce sont les sermons qu'ils ont choisi de partager.
Pourtant, vous pouvez voir des parallèles à ce que nous savons sur les sermons américains d'autres sources. Par exemple, il y a beaucoup de raisons conceptuelles auxquelles vous pourriez vous attendre à une discussion sur l'Ancien Testament pour chuter le dimanche de Pâques. Eh bien, c'est exactement ce qui s'est passé dans les données. L'étude des congrégations nationales, qui est une enquête représentative des congrégations religieuses américaines, demande à chaque congrégation combien de temps leur dernier sermon a duré. Ils constatent que la congrégation médiane rend compte 30 minutes. Eh bien, nous constatons que notre sermon médian gère 37 minutes. Considérant que ce sont deux manières entièrement différentes de répondre à la même question, ce n'est pas si loin.
Ce serait génial d'avoir un meilleur sentiment des vrais humains des deux côtés de l'autel - du pasteur et des congrégants. Donc, si nous allions faire cela plus gros et mieux, ce serait une valeur ajoutée d'en savoir plus sur les opinions des pasteurs, le contenu des sermons et la manière dont ils affectent les opinions des congrégants.
Drew Desilver est un écrivain principal au Centre de recherche sur Pew.
Données fraîches livrées samedi matin
À propos du Centre de recherche sur Pew Centre de recherche sur Pew est un réservoir de fait non étagère qui informe le public sur les problèmes, les attitudes et les tendances qui façonnent le monde. Il mène des sondages d'opinion, des recherches démographiques, une analyse de contenu des médias et une autre recherche sur la science sociale empirique. Le Centre de recherche sur Pew ne prend pas de postes de politique. C'est une filiale des fiducies de charité de pew.

https://www.youtube.com/watch?v=3QWA-ToSmWc

Commentaires