1. La voce del dato n° 51
Questo è il numero 51 de La voce del dato, la newsletter di tropic srl.
Un’edizione che dà ricetto, come sempre, ai link ai nostri articoli pubblicati durante la settimana.
Oggi, l’approfondimento ospitato nel paragrafo n°3 mostra qualche informazione estratta dall’analisi di circa 1.000.000 di community notes. Utile, a nostro avviso, nella settimana in cui anche Meta annuncia che negli Stati Uniti si affiderà alle community notes per la verifica delle veracità delle informazioni lì pubblicate. Un sistema ora in uso su X, il fu Twitter.
2. I link
- Parole d’Italia (69). La nostra attività settimanale di media intelligence e opinion mining, che monitora l’infosfera italiana.
- Parole d’Italia ha due estensioni. Nella prima estensione, ci sono i post degli account Facebook e YouTube di alcuni dei quotidiani italiani più diffusi (secondo i dati ADS) e dei siti di informazione più visitati (secondo i dati Comscore e Semrush). Anche questa volta abbiamo aggiunto l’analisi di un corpus di titoli, estratti dalle pubblicazioni online di una decina di testate.
- Questa settimana, la seconda estensione di Parole d’Italia (69) è dedicata al rapporto tra leader politici e trend sui social media. L’occasione è data da un recente caso di cronaca.
- Share of Words (61). Share of Words è l’attività gemella di Parole d’Italia. In questo caso, a essere indagata è l’infosfera internazionale, con un approfondimento sui messaggi in lingua inglese che hanno generato il maggior numero di interazioni.
3. X: un giorno di community notes
Cosa c’è nelle community notes?
Meta abbandona, in parte, il fact-checking. Adotta le community notes. Come ha fatto X, fu Twitter, sin dal principio.
Ma cosa c’è in queste community notes? Ciascuno, con un po’ di competenza, può scoprirlo. X pubblica ogni giorno dei file scaricabili.
Gli attributi esplorabili sono molti. Per esempio.
Classification: misinformed or potentially misleading VS not misleading.
Believable: believable by few VS believable by many.
Harmful: considerable harm VS little harm.
E poi, molto utile e molto interessante per quello che facciamo, Summary: lì ci sono i testi di tutte le community notes pubblicate nelle 24 ore (da quel che par di capire).
L’8 gennaio scorso abbiamo scaricato i file e analizzato il Summary, con qualche attributo correlato.
Queste sono alcune delle informazioni estratte grazie all’analisi testuale di più di un milione di note.
Le parole più frequenti.
Le parole più frequenti correlate a tre attributi: believable, classification, harmful.
Quali sono gli elementi più “contestati”, qual è l’oggetto della “contestazione”, su cosa verte la rettifica? Gli n-gram ci aiutano a capirlo.