Vigilancia bajo control

From Medialab Prado
Jump to: navigation, search

Logo.png


Contents

Descripción del proyecto / Description of the project

SUC pretende ser una herramienta de alerta sobre la información que contienen las bases de datos. Para ello hace uso de la ley de Benford, una ley estadística que nos informa sobre el índice de aparición esperado de ciertas cifras para el primer dígito de cantidades grandes. En concreto, nos dice que el número 1 aparece con más frecuencia como primer dígito que el 2, el 2 aparece con más frecuencia en esa posición que el 3, el 3 con más frecuencia que el 4... y así sucesivamente hasta el 9, que es el menos frecuente. Dichas cantidades grandes se encuentran en la vida diaria en facturas, presupuestos, porcentajes de emisiones de gases, participación en elecciones, etc. y siguen la ley de Benford, por lo que ésta resulta un mecanismo para poder detectar fraudes electorales, supuestos desajustes en información presupuestaria, etc. Para ello se elaborará un mapa mundial que establezca la "calidad" de los datos según su procedencia geográfica.

El proyecto se va a dividir en dos etapas: una primera destinada al proceso de la información procedente de las bases de datos, o sea, parseo de los datos más interpretación a través de la ley de Benford, y una segunda etapa en la que se procederá a su visualización.


The aim of the project is to make an application that deals with public databases according with statistical tools, such as Benford's Law. This law claims that, in real life, for big numbers (such as budgets or emissions rate), the first digit follows an exponential behaviour. This mechanism is used to detect data incoherences, which will be treated as an indicator and visualized in an informative way by the application.

Benford’s law

Benford’s law is an statistical law that brings us information about the appearing index of certain figures for the first digits of big numbers. Specifically it tells us that number 1 is more frequent like first digit than number 2, number 2 more frequent than number 3 until the nine which is the least frequent. Those big quantities appear in common live as, for example, gas emissions percentages, budgets, participation in elections etc. All that data adjust to Benford’s law and that’s why it is a very useful tool to detect frauds or alterations on data. Benford.jpg

The public weapon

The Benford’s public weapon is a tool that applies Benford’s law to local data base and shows a visualization of the deviation of the data. The tool also builds a world map using the information that the users send us.

Captura1.jpg

Captura2.jpg

Preguntas iniciales / First day questions

Respuestas a preguntas iniciales

1. Descripción de los objetivos del proyecto

El proyecto consiste en la realización de una aplicación que tome como entrada datos procedentes de bases de datos públicas, en formato csv, los procese y visualice el estado de los datos atendiendo a la Ley de Benford.
Inspiración (proyectos, teorías, marco, contexto, referencias)

La propia Ley de Benford. Esta ley postula que, en la vida real, para números con una cantidad de cifras considerable (tales como presupuestos, índices de emisiones, etc.), la primera cifra de dichos grandes números sigue un comportamiento especial. Este mecanismo es utilizado para detectar incoherencias en los datos, las cuales serán tomadas como indicador y se visualizará a modo informativo.

2. Objetivos a corto plazo (2 semanas)

Poseer una aplicación funcional con su aspecto estético definido.

3. Objetivos a largo plazo (desarrollos posteriores a Visualizar'09)

Ampliación de funcionalidades en la aplicación.

Desarrollo de un sistema gráfico perfeccionado, plenamente inteligible, mostrando con la mayor claridad posible los resultados obtenidos.

4. Datos (estado, origen, pertenencia)

Bases de datos, tanto públicas como privadas, susceptibles de análisis por parte de la aplicación.

5. Conversión de datos a experiencia perceptiva

UNDER CONSTRUCTION (Actualmente en estado embrionario)

6. Suposiciones o hipótesis previas

Se espera poder detectar indicios de fraude en los datos analizados por parte de la aplicación.


Datos / Data

Para usar SUC, el usuario deberá ejecutar la aplicación y subir un fichero de datos a través de ella. Dicho fichero deberá tener un formato CSV (con separaciones en ";"). Cada dato correspondiente a una misma columna de la base de datos debe encontrarse en una línea distinta.


Tecnologías / Technologies

SUC está desarrollado íntegramente en Processing, tanto para realizar las labores de parseo y proceso de datos como para implementar la visualización.


Estado actual y seguimiento del proceso / Current status and next steps

La aplicación actual es un prototipo funcional con una visualización básica. Aunque la funcionalidad es bastante restringida, la base tiene una forma muy definida y robusta.


Autores del proyecto / Authors of the project

  • Jonás Fernández Reviejo
  • Victor Rodrigo Gudiel
  • Miguel Valero Espada


Colaboradores / Collaborators

  • Oriol Ocaña (diseño gráfico)
  • Sandra Chávez (diseño gráfico)
  • Tom Schofield (programación processing)
  • Yeray Hernández (programación)


P1020051.JPG P1020053.JPG P1020055.JPG P1020056.JPG P1020059.jpg P1020069.JPG