Metadatos. Conócelos y decide.

26 de enero de 2019

Me sorprendió mucho el impacto que tuvo el tema de los metadatos en los asistentes a la ponencia sobre «optimización de imágenes para la web».

Lo cierto es que cuando preparé el tema no lo hice pensando en el SEO sino exclusivamente en la imagen. No preví que muchos de los que allí se juntaron buscan, a la vez, optimizaciones que favorezcan el posicionamiento de sus contenidos.

Pensando en esto, voy a intentar ampliar, siempre desde mi punto de vista, el tema de los metadatos.

Qué son

Los metadatos son fragmentos de información estructurada que describen otros datos. Normalmente no son visibles con simplemente abrir el archivo sino que necesitas alguna aplicación leerlos. Suelen estar incluídos en el propio fichero aunque también es posible mantenerlos aparte. En general incluyen información sobre los datos que contiene el fichero.

El autor, la hora de creación, el software con el que fue creado, una descripción corta del contenido del fichero, o información sobre el copyright, son algunos de los metadatos que podemos encontrar casi para cualquier documento.

La inclusión de metadatos ayuda a clasificar los documentos pudiendo ser encontrados u ordenados en base a los diferentes parámetros incluídos en los mismos. Así, se convierten en una herramienta que facilita el trabajo de gestionar información de manera más efectiva.

De la misma manera pueden indicarnos la procecencia de un fichero o su validez, por ejemplo incluyendo la firma digital del documento. De este modo posibilita la trazabilidad y proporciona seguridad.

Metadatos y web

Si nos referimos a documentos web, etiquetas tan conocidas, sobre todo en el ámbito del SEO, como description, title, o keywords son metadatos sobre el propio documento HTML. Teniendo acceso a estos datos, deberías poder saber si el documento es de tu interés antes de abrirlo. De estos datos se nutrían los buscadores hace años. Ahora carecen prácticamente de importancia debido a que el mal uso reiterado, casi fraudulento, ha minado su confiabilidad.

Otro tipo de metadatos en la web son los microdatos que los buscadores emplean para dar mejores resutados a sus visitantes.

También podemos entender como metadatos las cabeceras de los email o http, donde es común que se informe de el origen y destino de los datos, el tipo y el tamaño de los mismos.

Archivos de imagen

En las imágenes, sobre todo en las fotografías, los metadatos aportan una gran cantidad de información. El modelo de la cámara, la posición GPS, datos sobre los parámetros de la cámara al tomar la foto o la fecha en la que se toma la foto, son algunos de los metadatos que podemos encontrar en una fotografía digital. Estos datos pueden ser muy útiles pero también pueden hablar de más.

¿Has pensado la cantidad de información que entregas a las redes sociales cada vez que compartes una foto?

Seguridad y privacidad.

Como podrás entender, dan mucho juego y proporcionan grandes ventajas. Pero también tenemos que tener muy en cuenta las implicaciones de los metadatos en la seguridad y la privacidad.

Simplemente teniendo acceso a un conjunto más o menos amplio de metadatos se pueden averiguar muchas cosas de una sociedad, identificar personas, sus intereses e incluso sus problemas personales, de salud y su red social.

En el ámbito comercial, si puedo saber que dos personas se intercambian varios email diariamente en horario laboral, puedo extraer, con pocas posibilidades de equivocarme, que esas personas mantienen una colaboración. Si investigo algo más posiblemente pueda averiguar qué negocios tiene cada uno, y con ello intuir los intereses de las partes. Podría orientar anuncios, o bien contactar con ellos ofreciéndoles algo que posiblemente compren. Todo, sin necesidad de acceder al contenido de los email.

Más allá del mercadeo, los metadatos de los diferentes ficheros acostumbran a incluir las versiones de las aplicaciones o sistemas operativos o incluso rutas de archivo o nombres de usuario. Proporcionando información a un atacante sobre posibles vulnerabilidades de tu sistema o el de tu empresa.

Creo que con esto quedan claras las dos caras de los metadatos. Cuando vayas a publicar un fichero en Internet tú decides si los quieres eliminar o mantener, pero estaría bien que pudieses elegir cuáles. Es posible que incluir algunos te aporten cierta ventaja. Existen herramientas que permiten la eliminación o la edición de los metadatos.

Editar los metadatos

Exiftool es una herramienta multiplataforma en línea de comandos que permite leer, escribir y manipular metadatos de imágenes, audio y pdf.

Para su instalación en debian y derivados basta con hacer: sudo apt-get install libimage-exiftool-perl

Existen bastantes manuales sobre el uso de ExifTool en la web. Per si necesitas una referencia rápida, aquí puedes encontrar una lista.

En Windows 10, el propio sistema te permite borrar o editar metadatos de las imágenes.

Y hasta aquí por hoy. Espero haberte aclarado algo más el tema.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.