Esta materia tiene como objetivo proporcionar al estudiante un contacto
directo con las tecnologías utilizadas para la implementación de repositorios
de datos y su posterior explotación.
Se presentan los estándares más relevantes y las iniciativas más visibles en
diferentes áreas de conocimiento dentro del contexto Open Science.
Repositorios en abierto
102276
2022-23
MÁSTER UNIVERSITARIO EN CIENCIA DE DATOS / MASTER IN DATA SCIENCE
4
OPTATIVA
Cuatrimestral
Castellano e Inglés
Estándares de ingestión de datos.
Repositorios digitales: ejemplos institucionales.
Implementación de un repositorio digital: herramienta Invenio.
Herramientas analíticas de explotación de repositorios.
CG1 - Integrarse eficazmente en un grupo de trabajo y trabajar en equipo,
compartir la información disponible e integrar su actividad en la actividad
del grupo colaborando de forma activa en la consecución de objetivos comunes
CG6 - Buscar, obtener, procesar, comunicar información y transformarla en
conocimiento
CG7 - Conocer las herramientas metodológicas necesarias para desarrollar
proyectos avanzados
CT1 - Analizar y combinar información utilizando diferentes fuentes
CT2 - Conocer la problemática éticas y legal relacionada con el análisis de
datos y entender su importancia para una sociedad basada en los valores de la
libertad, la justicia, la igualdad y el pluralismo
CT3 - Dominio de la gestión del tiempo
CT5 - Capacidad de trabajo autónomo y toma de decisiones
CT6 - Capacidades asociadas al trabajo en equipo: cooperación, liderazgo,
saber escuchar
DSDM02 - Desarrollar e implementar modelos de datos, incluidos los metadatos
DSDM03 - Recoger e integrar diferentes fuentes de datos y su ingestión para su
posterior análisis
DSDM05 - Asegurar la calidad de los datos, su accesibilidad, y su forma de
publicación (curación)
DSENG01 - Aplicar los principios de ingeniería a la investigación, diseño y
desarrollo de un prototipo de aplicaciones de análisis de datos, o al
desarrollo de estructuras, instrumentos, máquinas, experimentos, procesos,
sistemas requeridos para ello
DSENG02 - Desarrollar y aplicar soluciones computacionales para problemas en
un cierto dominio de aplicación, usando una amplia gama de plataformas de
análisis de datos
DSBPM02 - Utilizar los datos disponibles para mejorar los servicios existentes
o desarrollar nuevos servicios
AF1 - Participación y asistencia a lecciones magistrales y seminarios
AF2 - Realización de prácticas de computación y análisis de datos
AF3 - Desarrollo de proyectos guiados
AF4 - Participación en casos prácticos en empresas o centros de investigación
AF6 - Tutorías (presenciales o por medio de recursos telemáticos)
AF7 - Elaboración de informes de laboratorio y trabajos
AF8 - Estudio individual de contenidos de la asignatura
AF9 - Trabajo en grupo
A10 - Pruebas de evaluación
Aprox. 100 horas:
30 % en clase
45% individual
25% en grupo
En la asignatura se comenzará por una exposición de los conceptos básicos,
incluyendo ejemplos sencillos pero relevantes, que serán analizados
individualmente y discutidos en común.
Se revisarán los diferentes componentes de una solución, y los actores que
participan en el desarrollo de la misma.
Identificar la forma de acceder a diferentes repositorios de datos en abierto
para abordar un problema de Data Science.
Implementar ejemplos sencillos pero útiles de acceso a portales de datos
relevantes directamente o mediante APIs en un contexto de web services.
Operar un repositorio sencillo con datos históricos. Implementar una versión
ya disponible y proponer mejoras en el diseño del mismo.
Ilustrar cómo el software existente puede usarse para mejorar la calidad de
los datos, y en particular su accesibilidad.
SE1 - Examen (escrito, oral y/o práctico en el aula de computación)
(ponderación mínima 0% y máxima 40%)
SE2 - Valoración de informes y trabajos escritos (ponderación mínima 0% y
máxima 60%)
SE3 - Valoración de exposiciones orales de trabajos (ponderación mínima 0% y
máxima 60%)
SE4 - Seguimiento de actividades presenciales (ponderación mínima 0% y máxima
40%)
Open Access Overview: https://legacy.earlham.edu/~peters/fos/overview.htm
Open Access Tracking Project (OATP): http://tagteam.harvard.edu/hubs/oatp/tag/oa.repositories
Harnad, Stevan. (1995) Universal FTP Archives for Esoteric Science and
Scholarship: A Subversive Proposal. In: Ann Okerson & James O'Donnell (Eds.)
Scholarly Journals at the Crossroads; A Subversive Proposal for Electronic
Publishing. Washington, DC., Association of Research Libraries, June 1995: http://www.arl.org/scomm/subversive/toc.html
Budapest Open Access Initiative (2002): https://www.budapestopenaccessinitiative.org/
Crow, Raym. "The Case for Institutional Repositories: A SPARC Position Paper.
Discussion Paper."ARL Bimonthly Report 223 (2002): https://ils.unc.edu/courses/2015_fall/inls700_001/Readings/Crow2002-CaseforInstitutionalRepositoriesSPARCPaper.pdf
Chan, Leslie. "Supporting and Enhancing Scholarship in the Digital Age: The
Role of Open Access Institutional Repository." Canadian Journal of
Communication. Vol. 29. No. 3 (2004): 277-300: http://cjc-online.ca/index.php/journal/article/viewFile/1455/1580
Michael Nielsen, The Future of Science, 2008: http://michaelnielsen.org/blog/the-future-of-science-2/
Peter Suber (20 July 2012), Open Access, MIT Press, ISBN 978-0-262-51763-8,
Wikidata Q54410433 . Updates and supplements
Directorio de repositorios: http://v2.sherpa.ac.uk/opendoar/
Agregador BASE: https://www.base-search.net/
Beyond the Paper (2013): https://www.nature.com/articles/495437a
A social networking site is not an open access repository (2015): https://osc.universityofcalifornia.edu/2015/12/a-social-networking-site-is-not-an-open-access-repository/
Where to Keep Research Data: https://www.dcc.ac.uk/guidance/how-guides/where-keep-research-data
Registry of Data Repositories: http://oad.simmons.edu/oadwiki/Data_repositories
Registry of Data Repositories: https://www.re3data.org/
Directorio de repositorios, estándares, recursos: https://fairsharing.org/
Making Institutional Repositories Work (2016): https://www.jstor.org/stable/j.ctt1wf4drg
RDA FAIR Data Maturity Model WG: https://www.rd-alliance.org/node/60731/outputs
COAR Community Framework for Good Practices in Repositories: https://comments.coar-repositories.org/wp-content/uploads/2020/06/COAR-community-framework-for-repositories-June-16-20201.pdf
Open data repositories: Current risks and opportunities (2020): https://crln.acrl.org/index.php/crlnews/article/view/24273/32092
More Scholarly Communications Consolidation as Institutional Repository
Provider DuraSpace Merges into Lyrasis: https://scholarlykitchen.sspnet.org/2019/01/25/lyrasis-duraspace-merger/
The 2.5% Commitment (2017): https://scholarworks.iupui.edu/handle/1805/14063
Against the 2.5% Commitment: https://cameronneylon.net/blog/against-the-2-5-commitment/
Next generation repositories: https://ngr.coar-repositories.org/,
https://coartraining.gitbook.io/coar-repository-toolkit/
Plan S and cOAlition S: https://www.coalition-s.org/
CAUL Fair, affordable and open access to knowledge program:
https://www.caul.edu.au/sites/default/files/documents/fair-access/repositories2019program-report.pdf
Special Issue "14th International Conference on Open Repositories 2019 – All
The User Needs": https://www.mdpi.com/journal/publications/special_issues/OR2019
Invest in Open Infrastructure: https://investinopen.org/
Este documento puede utilizarse como documentación de referencia de esta asignatura para la solicitud de reconocimiento de créditos en otros estudios. Para su plena validez debe estar sellado por la Secretaría de Estudiantes UIMP.
Descripción no definida
Cuatrimestral
Créditos ECTS: 4
Bernal Martínez, Isabel
Responsable General de Digital
Unidad de Recursos de Información Científica para la Investigación
Consejo Superior de Investigaciones Científicas (CSIC)
Lloret Iglesias, Lara
Científica Titular del CSIC
Instituto de Física de Cantabria (IFCA), Consejo Superior de Investigaciones Científicas