Forskere har demonstrert en algoritmebasert automatisert løsning som er sammenlignbar med og noen ganger bedre enn mennesker til å korrekt identifisere falske nyheter. Systemet som identifiserer talende språklige signaler i falske nyhetshistorier, kan gi nyhetsaggregat og sosiale medier som Google Nyheter et nytt våpen i kampen mot feilinformasjon.
En automatisert løsning kan være et viktig verktøy for nettsteder som sliter med å takle et angrep av falske nyhetshistorier, ofte opprettet for å generere klikk eller for å manipulere opinionen, sa Rada Mihalcea, professor i University of Michigan bak prosjektet, i en uttalelse..
Ifølge det nye systemet forfalskninger opptil 76 prosent av tiden, sammenlignet med en menneskelig suksessrate på 70 prosent, ifølge studien som ble presentert 24. august på den internasjonale konferansen om beregningslingvistikk i Santa Fe, New Mexico..
Forskerne mener at deres språklige analysetilnærming også kan brukes til å identifisere falske nyhetsartikler som er for nye til å bli avkreftet ved å kryssreferere fakta med andre historier. Den språklige analysetilnærmingen analyserer kvantifiserbare attributter som grammatisk struktur, ordvalg, tegnsetting og kompleksitet.
For studien opprettet Mihalceas team sine egne data, og Crowdsourcing av et online team som omvendt konstruerte verifiserte ekte nyhetshistorier til forfalskninger. Dette er hvordan de fleste faktiske falske nyheter blir opprettet, sa Mihalcea, av enkeltpersoner som raskt skriver dem mot en belønning.
Studiedeltakere fikk betalt for å gjøre korte, faktiske nyheter til lignende, men falske nyheter, og etterligne artiklernes journalistiske stil. På slutten av prosessen hadde forskerteamet et datasett på 500 virkelige og falske nyhetshistorier. De matet deretter disse merkede par historier til en algoritme som utførte en språklig analyse, og lærte seg å skille mellom ekte og falske nyheter.
Til slutt forvandlet teamet algoritmene til et datasett med reelle og falske nyheter hentet direkte fra nettet, og nådde 76 prosent suksessrate. Detaljene i det nye systemet og datasettet som teamet brukte til å bygge det, kunne brukes av nyhetssider eller andre enheter til å bygge sine egne falske nyhetsdeteksjonssystemer, sa Mihalcea.