Open Data o datos abiertos, actualmente, es un término común en los medios de comunicación, pero, por supuesto, donde es habitual es en ciencia, sobre todo, como parte de la denominada revolución de los datos y la expansión de la "data science" o ciencia de los datos o las humanidades digitales. De hecho, Google para la acepción inglesa de datos abiertos ofrece, aproximadamente, 133 millones de resultados e, incluso, hoy en día, la palabra datos abiertos ya es habitual en los titulares periodísticos donde se afirma, por ejemplo, que los datos abiertos salvan vidas o generan riqueza. Incluso, existe el Día Mundial de los "datos abiertos" pero, además, en 2018, se celebrará la quinta Conferencia Internacional de Datos Abiertos, una conferencia bianual y que tiene en esta edición el lema "El futuro está abierto". Todos estos elementos nos ayudan a ver la trascendencia de los datos abiertos en la actualidad. Open Data: los datos abiertos entronca con los movimientos de "Open source" o código abierto de software. "Open access" que se refiere al acceso gratuito a la información y al uso sin restricciones de los recursos digitales como tester, bases de datos, soportes de audio, vídeo o multimedia en general, así como, el Open Knowledge. Por ejemplo, la Open Knowledge International, una organización global sin ánimo de lucro, persigue mostrar el valor de los datos abiertos para la sociedad civil, ayudándola a acceder y a usar estos datos con herramientas y habilidades técnicas para afrontar problemas sociales. De esta manera, se libera una información que permitirá crear y compartir conocimiento. En realidad, estos movimientos se retroalimentan unos a otros. Veamos en detalle cuál es el significado del concepto Open Data. Data o datos, del latín "datum", significa lo que será una etimología muy acorde con el concepto de dato abierto. Como "data" se suele entender el material en bruto producto de la extracción del mundo en categorías, medidas u otras formas de representación como los números, caracteres, símbolos, imágenes, sonidos, bites, etcétera que, metafóricamente, podrían ser los ladrillos que permiten construir el conocimiento. Los datos representan la naturaleza y, por ejemplo, permiten medir la edad de las personas, su altura, su peso, su opinión, sus hábitos, el clima. Por ejemplo, éstos pueden estar en soporte físico tangible o en formato analógico o digital. En verdad existe un continuo incremento de la cantidad de datos sobre nuestro universo, ya sean creados por las diferentes instancias gubernativas, por instituciones de investigación, por el sector privado o por los individuos a través de sensores que se encuentran en millones de dispositivos, máquinas, vehículos, etcétera, que, convenientemente, analizados desde el Big Data ofrece muchas posibilidades. De hecho Big Data y Open Data, también, tienen sus concomitancias. Los datos son abiertos, según el manual de datos abiertos de la ya mencionada Open Knowledge International, cuando cualquier persona puede usarlos, reutilizarlos, redistribuirlos y, como máximo, se encuentran sujetos a requerimiento de atribución. Además, deben poderse compartir. Idealmente, estos datos aunque, también, puedan ser personales, pero, completamente anominimizados, deberán estar disponibles en su totalidad y ser descargables desde internet, preferiblemente, con un formato que sea machine readable y que se les pueda integrar otros conjuntos de datos buscando la interoperativilidad de estos datos, la cual, tiene detrás la idea del linked data. Los datos abiertos podrán ser utilizados, potencialmente, por cualquier persona o grupo de personas en cualquier sector, ciencia o empresa. Muchas veces, cuando se habla de abrir datos se habla, generalmente, de los datos generados por parte de la distancia del gobierno en el ejercicio de sus atribuciones, como, por ejemplo, información fiscal, de empleo, desempleo, censal, escolar, demográfica, indicadores económicos, medición de las temperaturas, etcétera, con el fin de aumentar la transparencia, la participación ciudadana o la eficiencia del gobierno. Sin embargo, la creación masiva de datos desde instituciones de investigación para sus proyectos ofrece un importante campo para la aplicación de la abertura de los datos. Muchos de los datos producidos en proyectos de investigación pueden ser de interés para otras investigaciones, con fines similares o distintos a los que se originaron cuando fueron creados. De interés, también, pueden ser para la industria o incluso para el ciudadano de a pie. De esta manera, una nueva utilización, es decir, la reutilización de estos datos supondría rentabilizar los costes de la investigación, lo que representaría un mayor retorno a la sociedad y permitiría la mejora de su calidad como consecuencia de su uso reiterado. Más específicamente, la reutilización de estos datos, para la ciencia, reforzaría la investigación comparativa, promovería las nuevas investigaciones que podrían aplicar nuevos métodos de análisis o métodos alternativos, permitiría la verificación de resultados previos o la exploración de temas no previstos por los investigadores e investigadoras iniciales, facilitando, por supuesto, estudios interdisciplinarios, interinstitucionales y, por supuesto, internacionales. Ayudaría a la formación de nuevos investigadores, posibilitaría la creación de nuevos datos mediante el cruce de datos producidos en diferentes investigaciones, aumentando, así, la representatividad de estos datos y, sin duda, evitaría la duplicación de costosas operaciones de recogida de datos. En definitiva, con estos datos abiertos se podría seguir contribuyendo al progreso científico y a la innovación. Algunas áreas científicas, ya hace años que, siguen esta estela en el acceso abierto de datos. Un caso paradigmático es el campo de la demografía, con la creación de múltiples infraestructuras de investigación a partir de la creación de base de datos de censos de población o de encuestas sociales, por ejemplo de salud. Véase el caso de IPUMS, una de las infraestructuras de investigación del Minessota Population Center de la Universidad de Minnesota, en Estados Unidos, y en concreto, el caso de IPUMS International. IPUMS International integra los datos censales individuales de 82 países, desde 1960 hasta la actualidad. Para su utilización no es necesario ningún tipo de registro. Ésto sí, debe tenerse cierta formación en el manejo de datos. Desde la demografía histórica, también, existen múltiples ejemplos de la creación de bases de datos individuales por parte de investigadores particulares, lo que se podría denominar "small data", que muchas veces, con el tiempo, se han convertido en infraestructuras de investigación que ya han ido aumentando en volumen con el trabajo continuado en sus instituciones de origen. Por ejemplo, la Demographic Database in Umea, Suecia, o la The Utah Genealogical Database, en Estados Unidos, o la Scania Database, también, en Suecia. De esta manera, la demografía histórica y su necesidad de datos para sus investigaciones resulta ser un buen laboratorio para la creación de datos abiertos, con la participación de ciudadanos voluntarios a partir del paradigma de crowd sourcing. Estos ciudadanos ayudan a la producción de los datos en formato digital, para luego, toda la ciudadanía, donde, también, se incluyen a los investigadores, puedan disfrutar de estos datos de manera directa o mediante visualizaciones creadas adhoc, a partir de mapas, pirámides de población o buscadores onomásticos. Es decir, se crea conocimiento a través de unos datos creados por la ciudadanía, para la ciudadanía. En este sentido, puede verse el proyecto Redes, tecnología e innovación ciudadana en la construcción de redes sociales históricas para la comprensión del legado demográfico, financiado por el proyecto Recer Caixa, en su modalidad de Humanidades Digitales y desarrollado por el Centro de Visión por Computador y el Centro de Estudios Demográficos de la Universidad Autónoma de Barcelona. Ya para terminar esta breve introducción, mencionar las críticas que recibe este movimiento de Open Data. El hecho de que cualquier persona tenga el potencial para usar estos datos es, ciertamente, una falacia, ya que, no todo el mundo dispone de la infraestructura digital necesaria, del hardware o software imprescindible o de la formación indispensable que permita manejar datos. Por estos motivos, algunos autores se han llegado a preguntar si este tipo de iniciativas abiertas no estarán empoderando más a los más poderosos y, de hecho, ya se han visto casos. La otra gran diatriba a los datos abiertos es cómo se financia su producción y, sobre todo, su mantenimiento, los cuales, por definición no tienen que tener costes para el usuario final.