Investigadores de la universidad de Michigan (Estados Unidos) y de Ámsterdan (Países Bajos), colaboraron entre si para crear un algoritmo capaz de identificar el contenido “falso” de internet en forma automática, con casi la misma precisión de las personas.
Según lo publicado por el equipo de investigación en ArXiv, el algoritmo no utiliza noticias satíricas, sino que se encarga de identificar noticias falsas y verdaderas, luego de analizarlas mediante un proceso de lenguaje natural (NLP System), el cual se encarga de comparar las diferencias lingüísticas.
Los investigadores han establecido ciertos aspectos necesarios para separar contenido verdadero y falso dentro de noticias, entre los que destacan tener disponibles ejemplos tanto veraces como engañosos para comparar, que las noticias estén en formato de texto digital, recoger contenido que tenga una base de verdad verificable, que los textos a comparar mantengan una extensión y estructura similares o considerar los factores lingüísticos y culturales, ya que pueden modificar el contenido de una publicación.
Ya al tener listos los parámetros de identificación, los investigaores programaron dos bases de datos en las que registraron las noticias que sirven para el algoritmo. La primera contiene noticias verdaderas de seis temáticas (deportes, negocios, entretenimiento, política, tecnología y educación) procedentes de medios de comunicación legítimos, como CNN, New York Times, entre otros, que los investigadores comprobaron de forma manual. También contiene noticias falsas procedentes la comunidad de Amazon Mechanical Turk (AMT).
Las noticias falsas se crearon a raíz de las primeras, los participantes de AMT, retocaron algunas de la noticias verdaderas, tergiversando el contenido pero dejaron el mismo lenguaje y estructura periodística.
La segunda base de datos, esta integrada exclusivamente de contenido de la web, principalmente de cuentas de compañías y personalidades famosas.
Al observar el éxito del algoritmo pudieron determinar que ciertamente éste puede identificar noticias falsas y verdaderas, con casi la misma precisión que un se humano. Sin embargo, también descubrieron que las personas son mejores analizando noticias falsas relacionadas con famosos, mientas que el algoritmo es más preciso con las noticias serias.