Agenda charla captura de datos
From Medialab Prado
Contents |
Agenda provisional
17:30 a 19:00: Talleres
- Taller sobre extracción de datos de las redes sociales, por The Data Republic
- Taller sobre cómo convertir documentos a formatos reutilizables, por David Cabo
- Taller sobre scraping usando Needlebase, por Sergio Álvarez Leiva de Vizzuality
19:15 Charlas sobre acceso y reutilización
- El derecho de acceso a la información en España, por Access Info Europe
- La reutilización de datos en España, Jorge Cancio (Proyecto Aporta)
20:00 Presentación de The Data Republic
Problemas a resolver
- De PDF a texto: tipos de PDF, herramientas gratuitas y de pago disponibles...
- Cuando extraes información del INE viene con unos encabezados y con comas para separar los decimales de los números, sin embargo google refine necesita separación por puntos. Quizá estaría bien intentar crear un script que solucionase estos problemas comunes de las descargas del INE.
- Ya he capturado los datos. ¿Cómo los represento para que otros puedan utilizarlos fácilmente y no tengan que hacer el mismo proceso que yo?
Ponentes y/o temas sugeridos
Parte legal de la captura de datos (acceso y reutilización de los datos)
- Derecho de acceso a la información en España: ¿existe? ¿sólo para información medioambiental (Convenio Aarhus)?
- Portales de Open Data en España y el mundo
- La propia Vicky o Alguien de Access-info
Parte técnica de la captura de datos
- Francis Irving (ScraperWiki)
- Alguien que use Needlebase
- Un brainstorming para determinar qué necesidades de herramientas hay. A lo mejor se puede sacar un wish-list con prioridades y puede haber gente que pueda crear esas herramientas en el futuro.
- Alguien que extraiga información de Twitter y/o redes sociales.
Parte legal de la reutilización de los datos
- Aparte del tema del derecho al acceso a la información, quizá fuese interesante una charla sobre la reutilización de datos públicos y sus aspectos legales. responder a preguntas de tipo:
- ¿Si consigo la información por algún medio desde la página de algún organismo público, puedo utilizarla sin problemas?
- ¿Debo hacer mención a la fuente de datos origen aunque estos hayan sido transformados o agregados en la visualización creada?
- ¿Que responsabilidad se tendría en caso de que algún organismo público decidiese querellarse por el uso de la información no autorizada?
- ¿Que licencias de reutilización me libran de problemas como los anteriores?

