Traditionnellement, la notion de corpus est rattachée aux sciences du langage et à la linguistique dite de corpus, comme l’illustre la revue en ligne Corpus. Néanmoins, le recours aux corpus est une méthode fréquente dans de nombreuses disciplines en sciences humaines et sociales (SHS) : études littéraires, histoire, sociologie, science politique, sciences de l’information et de la communication (SIC). Il en va ainsi pour des recherches en SHS qui s’intéressent aux publics.
Corpus et recherches sur les publics
Deux types de corpus méritent d’être distingués parce qu’ils ne font pas appel au même cadre méthodologique, même s’ils peuvent être combinés : les corpus d’entretiens menés par les chercheur·euses et les corpus de discours collectés par les chercheur·euses.
Le premier matériel empirique fait appel à la méthode d’enquête par entretiens. C’est une méthode classique en SHS, au même titre que l’enquête par questionnaire. La méthode des entretiens est fréquemment mobilisée dans les travaux en sociologie, psychologie sociale, démographie… Le volume des corpus d’entretiens et les besoins d’analyse ont d’ailleurs contribué au développement d’outils de statistique textuelle, comme par exemple l’outil Alceste, conçu en 1979 par Max Reinert (ingénieur de recherche du CNRS). La méthode d’enquête par entretiens s’avère utile pour donner la parole à des producteurs·rices de contenus ou à leurs publics afin de recueillir leurs expériences, leurs opinions, leurs pratiques ou leurs ressentis. C’est la méthode qu’a retenue la chercheuse en SIC Anne Cordier dans son travail sur les pratiques informationnelles des enfants, adolescent·es et jeunes adultes. Elle montre que la famille ou l’école sont au cœur de la sociabilité informationnelle de ces publics jeunes et que s’informer est une expérience sensible qui « convoque une palette d’émotions » (Cordier, 2023 : 23). La recherche s’appuie sur une série d’entretiens menés pendant un an auprès de 12 jeunes adultes, série d’entretiens qui a complété plusieurs enquêtes menées de 2015 à 2022 auprès d’enfants et d’adolescent·es dans une perspective longitudinale (ibid. : 12-13).
Le second ensemble de corpus s’adosse à des discours attestés qui sont rassemblés par les chercheur·euses en lien avec leur perspective de recherche et leur cadre théorique. Le terme « discours » met l’accent sur l’importance de leurs conditions de production et de diffusion, que ce soit dans la phase de collecte ou dans celle de l’analyse des corpus. Différentes arènes (voir Wojcik, 2015) de discours peuvent être examinées : arènes politiques, arènes médiatiques, réseaux socionumériques, etc. Il peut s’agir de prêter attention aux stratégies discursives au cœur d’une communication publique (voir Ollivier-Yaniv, 2021) ou bien d’examiner des forums en ligne comme espace de débat public (voir Mercier, 2015). Dans le cas de la presse, selon l’orientation de recherche, l’accent peut porter sur les contenus proposés aux publics, par exemple dans le cas de la presse magazine, sur les représentations et les modèles de l’art d’être femme (Eck, Blandin, 2010) ou bien sur les modalités et les caractéristiques de traitement d’une thématique, comme celle de l’immigration, que ce soit en diachronie (Bonnafous, 1991) ou en synchronie (Barats, 2001), ou bien prêter attention aux routines narratives mobilisées par les journalistes pour traiter des attentats (Garcin-Marrou, Hare, 2019). Ces exemples montrent la diversité des perspectives de recherche et des cadres théoriques.
Ainsi les corpus (corpus d’entretien et/ou corpus de discours) constituent-ils un élément méthodologique pour de nombreuses recherches sur les publics, même si leur place et leurs modalités d’analyse varient selon les disciplines et les perspectives de recherche. Le ou les corpus – en lien avec une question de recherche et un cadre théorique – constituent dès lors un objet empirique qui repose sur des critères explicites de sélection et de collecte des éléments qui le composent. S’il ne donne pas accès à un sens ou à une signification – car le sens n’est en aucun cas immanent ou univoque –, il constitue un ensemble interprétable, c’est-à-dire que l’on peut soumettre à différentes perspectives d’analyse (sémiotiques, discursives, communicationnelles, etc.). Cet ensemble raisonné peut être constitué de textes, images, vidéos, captures d’écran, entretiens d’enquêté·es, inscrits dans un contexte spécifique de production et de diffusion. Le ou les corpus peuvent ainsi éclairer des pratiques sociales tout autant qu’ils contribuent à mettre au jour la dimension langagière de nombreux processus ou faits sociaux en lien avec les publics.
Modalités de constitution des corpus et diversité des approches
Quel que soit l’angle privilégié dans les recherches sur les publics mobilisant un ou des corpus, il s’agit de penser les modalités de constitution des corpus, pour garantir la fiabilité de la démarche. Loin d’une supposée immédiateté, le corpus implique des choix tant au niveau de la collecte que de l’analyse. Il s’élabore en lien avec une problématique et des questions de recherche qui orientent les critères de sélection et de collecte. Le corpus ne pré-existe pas à une recherche, il n’est jamais donné : il est construit selon des critères précis et un protocole de recherche. Dans le cas de corpus de discours, il s’agit de prendre en compte – en amont de la constitution du ou des corpus – les conditions de production et de circulation des discours ainsi que l’hétérogénéité des éléments potentiellement collectables (textes et mises en forme des textes, paratextes, images, graphiques, vidéos…). En parallèle du choix des éléments à collecter et collectables, il s’agit de déterminer des critères qui peuvent se combiner ou s’exclure afin de constituer le ou les corpus : périodes (empans temporels, moments discursifs), énonciateurs (organes de presse, journalistes, représentant·es politiques, comptes Twitter…), thèmes (mot[s] clé[s], mot pivot, hashtag), dispositifs (espaces médiatiques, politiques, numériques etc.). Du temps – et bien souvent une démarche itérative – s’avèrent nécessaires afin de vérifier la validité des critères. Différentes étapes sont parfois indispensables pour confronter des bases de données, vérifier la stabilité des sources archivées, tester des outils de collecte en ligne (web scraping), évaluer leurs limites, les angles morts, etc. Certains contenus, comme les discours haineux (hate speech) peuvent s’avérer difficiles à repérer. En effet, il n’existe pas de définition ou de standard qui permettrait un repérage automatique et exhaustif, grâce à un lexique par exemple, de ce qu’on désigne par discours de haine (voir Monnier, Seoane, 2019). Dans le cas du discours de presse, y compris la presse en ligne, il existe de nombreuses bases de données, proposées par des organisations publiques ou privées, contribuant à la collecte de corpus. Les plus utilisées pour la presse audiovisuelle sont celles de l’Institut national de l’audiovisuel (INA) et pour la presse écrite, celles de la Bibliothèque nationale de France (BnF), de Factiva ou d’Europresse. Cependant, l’exhaustivité des collections dépend de nombreux critères. Dans le cas de Factiva ou d’Europresse, les contrats avec les éditeurs de presse peuvent varier dans le temps et ne garantissent pas une stabilité des collections.
Les recherches sur la presse quotidienne nationale peuvent sembler relativement simples. Cependant, il faut vérifier les dates des archives, en particulier dans une perspective diachronique. Le quotidien Le Monde est archivé dans Europresse depuis le 1er janvier 2001 et depuis le 19 décembre 1944 pour Factiva. Le quotidien Libération est archivé dans Europresse depuis le 2 janvier 1995 et depuis le 1er janvier 1998 pour Factiva. L’Agence France Presse (AFP), centrale dans l’analyse des processus de médiatisation, est archivée dans Europresse depuis le 30 août 2005 et depuis le 9 septembre 1991 dans la base de données Factiva. De plus, de nouvelles sources sont archivées régulièrement, notamment dans le cas de la presse en ligne. Si les dates d’archivage ne sont pas vérifiées, cet ajout régulier de sources pourrait conduire à des erreurs d’interprétation dans le cas de pics de médiatisation. En effet, un pic peut être dû à l’ajout de nouvelles sources qui traitent de la thématique, ce qui ne reflète pas forcément une intensification de traitement puisque les sources n’étaient pas au préalable archivées. Europresse propose les éditions originales des journaux (en l’occurrence au format pdf), ce qui permet d’examiner la dimension sémiologique des corpus collectés. Ces spécificités exigent d’être prises en compte en amont d’une collecte. De plus, la posture du chercheur·euse se doit d’être questionnée, car « étudier du discours de presse, c’est se mettre dans une posture particulière, qui est celle de l’analyste, et non celle du lecteur de journal contemporain de l’événement » (Krieg-Planque, 2000 : 76).
Dans le cas de corpus volumineux dont l’analyse est adossée à des outils de statistique textuelle (Née et al., 2017), le ou les corpus doivent également répondre à des critères de cohérence et d’homogénéité, afin de comparer ce qui est comparable (Pincemin, 2012 ; Mayaffre, 2013). De plus, les outils de statistique textuelle impliquent des étapes de préparation des corpus : vérification de la pertinence des données et de leur représentativité par rapport au phénomène étudié, suppression de doublons, insertion de balises pour introduire des variables (énonciateurs, dates, etc.).
Il peut s’avérer nécessaire de constituer différents corpus afin d’éclairer les caractéristiques de construction d’un problème public (voir Neveu, 2021) ou d’examiner différentes arènes de prises de parole. Tel est le cas pour une recherche qui s’est intéressée à la mise en visibilité du mouvement des gilets jaunes (Souillard et al., 2020) qui a débuté en France en novembre 2018 (voir Mercier, 2020). Dans le cadre de ce travail, les chercheurs et chercheuses ont examiné les dynamiques de mise en visibilité du mouvement, en prêtant attention aux discours sur et des gilets jaunes. Ils ont combiné différents critères afin de comparer des arènes en ligne et hors ligne. Ils et elles ont déterminé une période significative (second week-end de mobilisation en France, le samedi 1er décembre 2018) et ont constitué trois corpus : les posts et commentaires de la page Facebook « La France en colère » (37 251 posts et commentaires), les tweets contenant les suites de caractères « giletsjaunes » et « giletjaune » (plus de 2 millions) et les articles de 10 journaux de presse quotidienne (549 articles). Compte tenu du volume des corpus, ils ont mobilisé des outils de statistique textuelle et ont montré que les discours sur et des gilets jaunes s’avéraient polyphoniques : dans le cas du corpus de presse, le cadrage médiatique indique une ambivalence entre contextualisation socio-politique et dépolitisation et il met l’accent sur les violences attribuées aux gilets jaunes ; la page Facebook contribue quant à elle à la structuration du mouvement et à la mise en visibilité des violences policières dont sont victimes les gilets jaunes ; Twitter participe à la mise en concurrence des récits et cristallise le conflit entre « anti » ou « pro » gilets jaunes. Les discours analysés attestent ainsi d’une dynamique de récits et de contre-récits en interaction.
Selon les perspectives de recherche, les critères de constitution des corpus peuvent être représentatifs ou tendre vers une forme d’exhaustivité. La démarche d’analyse peut être diachronique ou synchronique. Les approches sont nombreuses et contribuent à nourrir les réflexions sur les enjeux méthodologiques liés au recours aux corpus. Cette nécessaire réflexivité de la démarche est renforcée dans le cas de corpus nativement numériques.
Corpus nativement numériques : dispositif socio-technique et techno-discursivité
Avec l’avènement du numérique, les données peuvent sembler facilement accessibles et collectables. Il pourrait sembler aisé de repérer et d’examiner la diffusion de fake news ou de prêter attention aux contenus postés par des communautés en ligne. Les corpus de tweets ou d’expressions en ligne (blogs, forums…) pourraient également être considérés comme une hypothétique alternative au travail des sondeurs et sondeuses d’opinion (voir Touzet, 2022). Ces corpus pourraient saisir une potentielle, voire une artéfactuelle opinion publique (voir Carlino, Mabi, 2018). La pertinence et l’opérationnalité des notions ou des questions de recherche, tout autant que les conditions méthodologiques de collecte de corpus nativement numériques se doivent d’être questionnées.
Les corpus nativement numériques invitent ainsi à prêter attention à la notion de dispositif socio-technique. Cette notion souligne l’interdépendance entre les dimensions technique et sociale et éclaire l’écologie complexe qui contribue à la production de contenus numériques. Dans le prolongement des travaux de Michel Foucault (1926-1984 ; 1977), elle conduit à mettre l’accent sur l’interface, le design, les rapports de force (Bigot et al., 2021) et elle contribue à prendre en compte l’articulation entre des discours composites, des pratiques et des médiations socio-techniques (Monnoyer-Smith, 2016), non dénuées de dimensions stratégiques, comme l’illustre le rôle des algorithmes en contexte numérique.
Les corpus nativement numériques sont composites et hétérogènes, parfois éphémères, constitués de données inscrites par les internautes et aussi de données générées par le dispositif (nombre de like, de retweet, nombre de followers, etc.) dans une logique de quantification. Les données alpha-numériques inscrites par les internautes peuvent s’accompagner de raccourcis orthographiques, de jeux graphiques comme par exemple la répétition de lettres, la présence de majuscules qui contribuent à indiquer et à exprimer l’emphase ou des émotions, et qui participent à la sémantisation des énoncés. Des nouvelles données, comme les émojis (voir Halté, 2023), les gifs, les mèmes, l’horodatage, le nombre de followers, etc. peuvent également être nécessaires en contexte numérique pour éclairer les processus de diffusion ou de viralité (voir Schafer, Pailler, 2022).
En contexte numérique, l’hétérogénéité des données potentiellement collectables induit parfois des choix ou bien le développement de méthodes de collecte et de stockage ad hoc. Si les éléments textuels sont plus facilement collectables, les éléments graphiques, les images, les vidéos sont néanmoins au cœur des corpus numériques. La chercheuse en SIC Virginie Julliard (2016) a observé les débats sur le genre sur Twitter et examiné la façon dont les hashtags façonnent les débats, en particulier autour du hashtag #Theoriedugenre. Avec Thomas Bottini, ils ont développé un outil de collecte adapté au web, en capturant tout autant les textes que les images ou vidéos (Bottini, Julliard, 2017). Différentes investigations ont ainsi été conduites afin d’étudier la circulation des images et leurs effets sur la mobilisation anti-genre. La recherche s’est adossée à un corpus de 107 209 tweets, comportant 15 734 images, collectés entre le 5 octobre 2014 et le 17 juillet 2017 (Julliard, 2022).
Les corpus nativement numériques contribuent à renouveler les réflexions sur la matérialité langagière. En sciences du langage, Marie-Anne Paveau (2015 ; 2017 ; 2019) appréhende les formes langagières numériques dans leur dimension composite et techno-discursive, c’est-à-dire métissées de phénomènes techniques : liens hypertextes, like, hashtag (sur ce mot voir Stassin, 2022), imbrication texte/image/vidéo… De nouveaux cadres d’analyse et de notions se développent afin de saisir la dimension techno-langagière des corpus nativement numériques (Paveau, 2017). En SIC, les travaux sur l’énonciation éditoriale (sur cette notion, voir Siguier, 2021) et les écrits d’écran ont montré l’importance des signes passeurs (liens hypertextes, mots cliquables, etc.) et des architextes qui encadrent les écrits, les régissent et leur permettent d’exister (Jeanneret, Souchier, 1999 ; 2005). Étienne Candel et Gustavo Gomez-Mejia (2016 ; 2021) ont ainsi analysé les différentes facettes du bouton like, popularisé par Facebook. Ils ont privilégié une approche qualitative adossée à une collecte de like au fil de navigations ordinaires sur Facebook, Twitter et Instagram. Ils les ont archivés sous forme de captures d’écran, éclairant les usages et la circulation du like au sein de différents dispositifs. Ces « cas exemplaires, choisis non pour une illusoire représentativité mais pour une certaine saillance discursive » ont permis de mettre au jour les multiples facettes de ce signe passeur, éclairant ce que liker veut dire. D’autres chercheurs ont montré l’importance communicationnelle de certains hashtags dont le rendement conversationnel indique la montée en puissance de débats en ligne, et parfois leur dimension agonistique comme dans le cas de #mariagepourtous (Cervulle, Pailler, 2014).
Si le numérique implique de prendre en compte la dimension techno-langagière des corpus, il invite également à ne pas mésestimer la diversité des situations de réception, autrement dit de penser les différents terminaux de réception (ordinateur, smartphone…) en amont de la constitution des corpus. En effet, selon le terminal de consultation, l’affichage des données à l’écran diffère, ce qui a des conséquences sur la collecte des données et la prise en compte du poids du design. À cela s’ajoutent les logiques algorithmiques des interfaces qui affichent des contenus spécifiques en fonction du profil des internautes et de ses traces d’usage. Contrairement à un journal papier, la page du journal en ligne ne comporte pas les mêmes publicités, qui varient selon le profil de l’internaute. Chaque fil d’actualité d’un réseau social est spécifique à un internaute et il est difficile d’évaluer le volume des contenus supprimés, que ce soit par l’internaute ou par le dispositif et le système de modération. Autant de caractéristiques propres à l’environnement numérique qui affecteront le périmètre des analyses ainsi que les interprétations. Construire un corpus en contexte numérique induit donc une documentation fine et contextualisée des choix effectués et des conditions de collecte des données afin de tenir compte, lors de la phase d’analyse, des limites et angles morts inhérents à tout corpus ou terrain. Il faut ajouter des temporalités enchevêtrées : le temps du numérique, le temps de la collecte et le temps de la recherche.
De plus, la non-stabilité des dispositifs numériques dans le temps – liée aux évolutions rapides des interfaces, de leur design et de leurs fonctionnalités – peut affecter la pérennité de l’archivage des corpus et rendre difficile la lisibilité des résultats sur la moyenne durée (Schafer, Barats, Fickers, 2020). Le numérique comme archive vivante exige une documentation fine du protocole de recherche.
À la question de la pertinence des critères de constitution des corpus, de leur fiabilité, s’ajoutent celle de leur analyse et de la conception du sens, au cœur de l’interprétation, soulignant les enjeux herméneutiques en contexte numérique. Il s’avère nécessaire d’appréhender le dispositif (site, réseau social, messagerie…) comme un dispositif socio-technique qui encadre, contraint et détermine la techno-discursivité (Paveau, 2017) du ou des corpus.
Ne pas réifier la complexité du sens : le corpus comme matrice herméneutique et heuristique
Tout corpus est lié à une problématique et les analyses s’accompagnent souvent d’une dimension heuristique car les éléments inattendus ne manquent pas. Les corpus permettent d’observer et d’analyser des discours pour mettre au jour leurs caractéristiques, les procédés de lissage dans le cas de la communication publique, de la circulation d’événements discursifs (sur cette notion voir Calabrese, 2018), etc. Les approches sont plurielles et un retour au texte dans une perspective qualitative s’impose, y compris dans le cas de corpus volumineux et du recours à des outils de statistique textuelle.
Le linguiste Damon Mayaffre (2011 : 11-12) rappelle qu’un texte « n’a pas de signification mais un sens (ou plutôt des sens) qu’il ne s’agit pas de re-trouver mais de co-construire dans des parcours de lecture contrôlés. […] C’est un lieu construit où s’échafaude le sens, où se scénarise l’interprétation ». Il faut se garder d’une approche positiviste et immanente du corpus mais appréhender le corpus comme une matrice de sens, une matrice herméneutique et heuristique.
La combinaison de méthodes et d’approches peut s’avérer utile, comme par exemple associer l’analyse de corpus de discours à des corpus d’entretiens et/ou à des observations ethnographiques, en particulier en contexte numérique. Ces méthodes dites mixtes éclairent les conditions de production des discours, tout autant que les perspectives d’investigation des corpus et renforcent les pistes interprétatives.
Au regard de la matérialité langagière, deux principales approches caractérisent l’analyse de corpus : l’analyse du discours et l’analyse de contenu. Comme le rappellent les chercheuses en SIC Simone Bonnafous et Alice Krieg-Planque (2014 : 224) :
« L’analyse du discours travaille à partir de l’analyse du matériau linguistique ; elle se distingue en cela […] de l’analyse de contenu, qui est une technique de recherche fondée sur la précatégorisation thématique des données textuelles. Ainsi, par exemple, l’analyse de contenu pourra négliger les différences entre les expressions “travailleurs immigrés”, “immigrés” ou “étrangers”, puisque les personnes ou les situations auxquelles référent ces expressions peuvent être les mêmes ; à l’inverse, c’est justement ce que ces différences de désignation indiquent comme différences d’attitude des locuteurs par rapport à l’objet de leurs discours qui intéresse l’analyse du discours. Cela ne signifie pas que l’analyse thématique ne puisse pas être utilisée parallèlement ou préalablement à l’analyse du discours, mais elle ne peut pas s’y substituer. »
Les outils de statistique textuelle proposent des listes de fréquences lexicales et différents outils pour mettre au jour les traits saillants d’un corpus. Certains outils facilitent l’observation des univers lexicaux d’un corpus (par exemple Iramuteq), les concordances de termes ou les cooccurrences (Iramuteq, TextObserver, Itrameur…). Examiner les fréquences, les régularités, les irrégularités ou les hapax comporte une dimension heuristique éprouvée.
Les outils de traitement peuvent cependant s’apparenter à des boites noires et demandent du temps pour leur prise en main, tout autant qu’une certaine prudence dans l’interprétation des résultats. À la question première du type de données collectées et dans quel but, s’ajoutent celles des modalités de traitement et de leurs principes. Étienne Brunet, linguiste, s’est ainsi intéressé à l’outil proposé par Google pour visualiser des fréquences de termes : Ngram Viewer. Si le graphique de visualisation est attractif, il note néanmoins qu’il est impossible de connaître le périmètre des corpus issus des google books et ainsi d’apprécier la portée des résultats (Brunet, 2012). L’exemple proposé par l’outil illustre la dimension ludique davantage que scientifique de la démarche.
Or, sans lisibilité claire des modalités de constitution des corpus, il est impossible d’interpréter ces variations et comparaisons de fréquence. Des fréquences de termes peuvent ainsi être proposées et les résultats peuvent sembler attrayants mais sans pour autant permettre une interprétation, soulignant la dimension potentiellement artéfactuelle du recours au corpus.
Conclusion : corpus et marketing, le risque de la réification des publics et des opinions
Si le recours aux corpus est central pour de nombreuses recherches en SHS, il n’est cependant pas réservé aux seul·es chercheur·euses. À l’instar du micro-trottoir (voir Laval, 2022), la collecte de tweets vaudrait collecte en temps réel de tendances de l’opinion, négligeant l’audience silencieuse de celles et ceux qui ne s’expriment pas en ligne, comme les lurkers (voir Falgas, 2017). Les acteur·rices de la communication ou du marketing (voir Marti, 2015) s’adossent ainsi à des corpus dans le but de saisir des avis de consommateurs, d’identifier des tendances ou de cerner les opinions (Boullier, Lohard, 2012). Ces pratiques, amplifiées par la place du numérique et la profusion de données (textes, images, vidéos, gifs, mèmes, émojis…), s’inscrivent dans le prolongement des sondages d’opinion et de techniques de marketing qui viseraient à (se) saisir des opinions des internautes, nouvel eldorado d’une opinion publique (voir Frinault, 2021) sans cesse réinventée. Les critiques sont nombreuses quant aux finalités et aux présupposés de telles démarches qui induisent une forme d’immanence du sens et ne contribuent pas à la production de connaissances. Dans le cas d’une démarche scientifique, les modalités de constitution des corpus sont étroitement liées à la problématique de recherche et impliquent une approche itérative et une certaine prudence dans les modalités de collecte et d’analyse des données. C’est à ces conditions que les recherches sur les publics, les débats publics ou l’opinion produisent des connaissances et non des artefacts.
Barats, C., 2001, « Les mots de l’immigration et l’ethnicisation des rapports sociaux. Le cas des débats télévisés français sur l’immigration », Réseaux. Communication, technologie, société, 107, pp. 147-179. Accès : https://www.cairn.info/revue-reseaux1-2001-3-page-147.htm.
Bigot J.-É. et al., 2021, « Les plateformes à l’épreuve des dynamiques de plateformisation », Questions de communication, 40, pp. 9-22. Accès : https://doi.org/10.4000/questionsdecommunication.26584.
Bonnafous S., 1991, L’Immigration prise aux mots, Paris, Éd. Kimé.
Bonnafous S., Krieg-Planque A., 2014, « L’analyse du discours », in : Olivesi S., éd., Sciences de l’information et de la communication, Grenoble, Presses universitaires de Grenoble, pp. 223-238. Accès : https://doi.org/10.3917/pug.olive.2014.01.0223.
Bottini T., Julliard V., 2017, « Entre informatique et sémiotique. Les conditions techno-méthodologiques d’une analyse de controverse sur Twitter », Réseaux. Communication, technologie, société, 204, pp. 35-69.
Boullier D., Lohard A., 2012, Opinion mining et Sentiment analysis, Marseille, OpenEdition Press. Accès : https://books.openedition.org/oep/202.
Brunet E., 2012, « Au fond du GOOFRE, un gisement de 44 milliards de mots », 11e Journées internationales d’analyse statistique des données textuelles, Liège, pp. 7-21. Accès : https://hal.science/hal-01790505/document.
Calabrese L., 2018, « Événement discursif », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/evenement-discursif.
Candel E., Gomez-Mejia G., 2016, « Le bouton like : poétique du clic, vertige des discours », Semen, 42. Accès : https://doi.org/10.4000/semen.10623.
Candel E., Gomez-Mejia G., 2021, « Like », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/like.
Carlino V., Mabi C., 2018, « Débat public (procédure) », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/debat-public-procedure.
Cervulle M., Pailler F., 2014, « #mariagepourtous : Twitter et la politique affective des hashtags », Revue française des sciences de l’information et de la communication, 4. Accès : https://doi.org/10.4000/rfsic.717.
Cordier A., 2023, Grandir informés, Les pratiques informationnelles des enfants, adolescents et jeunes adultes, Caen, C&F Éd.
Eck H., Blandin C., dirs, 2010, « La vie des femmes ». La presse féminine aux XIXe et XXe siècles, Paris, Éd. Panthéon-Assas.
Falgas J., 2017, « Lurker » Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/lurker.
Foucault M., 1977, « Le jeu de Michel Foucault (entretien avec D. Colas, A. Grosrichard, G. Le Gaufey, J. Livi, G. Miller, J. Miller, J.-A. Miller, C, Millot, G. Wajeman) », Ornicar ? Bulletin périodique du champ freudien, 10, pp. 62-93. Accès : http://1libertaire.free.fr/MFoucault158.html
Frinault T., 2021, « Sondages d’opinion », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/sondages-dopinion.
Garcin-Marrou I., Hare I., 2019, « Presse écrite et événement terroriste : routines narratives et émergence de la société civile, 1995-2016 », Le Temps des Médias, 32, pp. 153-169.
Halté P., « Emoji », 2023, Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/emoji.
Jeanneret Y., Souchier E., 1999, « Pour une poétique de l’écrit d’écran », Xoana, 6-7, pp. 97-107.
Jeanneret Y., Souchier E., 2005, « L’énonciation éditoriale dans les écrits d’écran », Communication et langages, 145, pp. 3-15.
Julliard V., 2016, « #Theoriedugenre : comment débat-on du genre sur Twitter ? », Questions de communication, 30, pp. 135-157. Accès : https://doi.org/10.4000/questionsdecommunication.10744
Julliard V., 2022, « Communauté politique, sémiotique, émotionnelle. Ce que la circulation des images révèle de la structuration de la mobilisation anti-genre sur Twitter », Communication & langages, 212, pp. 131-153.
Krieg-Planque A., 2000, « Analyser le discours de presse », Communication, 20 (1), pp. 75-97. Accès : https://doi.org/10.4000/communication.6432.
Laval S., 2022, « Micro-trottoir » Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/micro-trottoir.
Marti C., 2015, « Marketing » Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/marketing.
Mayaffre D., 2011, « Vers une herméneutique matérielle Numérique, Corpus textuels, Logométrie et Langage politique », mémoire d’habilitation à diriger des thèses en sciences du langage, Université de Nice – Sophia-Antipolis. Accès : https://theses.hal.science/tel-00655380v1/document
Mayaffre D., 2013 « Analyses logométriques et rhétorique du discours », in : Olivesi S., éd., Introduction à la recherche en SIC, Grenoble, Presses universitaires de Grenoble, pp. 153-180.
Mercier A., 2015 « Débat public », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/debat-public.
Mercier A., 2020, « Gilets jaunes » Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/gilets-jaunes.
Monnier A., Seoane A., 2019, « Discours de haine sur l’internet », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/discours-de-haine-sur-linternet.
Monnoyer-Smith L., 2016, « Le web comme dispositif : comment appréhender le complexe », pp. 13-33, in : Barats C., dir., Manuel d’analyse du web, Paris, A. Colin.
Née E. et al., 2017, Méthodes et outils informatiques pour l’analyse des discours, Rennes, Presses universitaires de Rennes.
Neveu É., 2021, « Problème public », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/probleme-public.
Ollivier-Yaniv C., 2021, « Communication publique », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/communication-publique.
Paveau M.-A., 2015, « Ce qui s’écrit dans les univers numériques », Itinéraires. Littérature, textes, cultures, 2014-1. Accès : http://journals.openedition.org/itineraires/2313.
Paveau M.-A., 2017, L’Analyse du discours numérique, Paris, Hermann.
Paveau M.-A., 2019, « Technographismes en ligne. Énonciation matérielle visuelle et iconisation du texte », Corela. Cognition, représentation, langage, HS-28. Accès : http://journals.openedition.org/corela/9185.
Pincemin B., 2012, « Hétérogénéité des corpus et textométrie », Langages, 187, pp. 13-26. Accès : https://doi.org/10.3917/lang.187.0013.
Schafer V., Pailler F., 2022, « Viralité », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/viralite.
Schafer V., Barats C., Fickers A., 2020, « Fading Away… The challenge of sustainability in digital studies », Digital Humanities Quarterly, 14/3,
http://www.digitalhumanities.org/dhq/vol/14/3/000484/000484.html
Siguier M., 2021, « Énonciation éditoriale », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/enonciation-editoriale.
Souillard N. et al., 2020, « Les Gilets jaunes, étude d’un mouvement social au prisme de ses arènes médiatiques », Terminal. Technologie de l’information, culture & société, 127. Accès : https://doi.org/10.4000/terminal.5671.
Stassin B., 2022, « Hashtag » Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/hashtag.
Touzet H., 2022, « Sondeurs et sondeuses d’opinion » Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/sondeurs-et-sondeuses-dopinion.
Wojcik S., 2015, « Arène », Publictionnaire. Dictionnaire encyclopédique et critique des publics. Accès : https://publictionnaire.huma-num.fr/notice/arene.
Copyright © 2024 Publictionnaire - Tous droits réservés - ISSN 2609-6404