Preservando la historia visual
La morgue contiene fotos de finales de siglo XIX que representan un enorme valor histórico que no se encuentra en ningún otro lugar del mundo. En 2015, una tubería rota
inundó la biblioteca de archivos, lo que puso en riesgo a toda la colección. Afortunadamente, el daño fue menor, pero ese suceso desencadenó la siguiente pregunta: ¿cómo se pueden almacenar de manera segura algunos de los recursos físicos más preciados de la empresa?
"La morgue es un tesoro de documentos perecederos que son una crónica invaluable, no solo de la historia de The Times, sino de casi más de un siglo de eventos internacionales que han definido al mundo moderno", afirma
Nick Rockwell, director de Tecnología de The New York Times.
No solo las imágenes contienen información valiosa. En muchos casos, la parte posterior de las fotos incluye la hora y el lugar donde se tomó. Rockwell agrega: "Durante años, el personal del departamento de fotografía y el área de negocios han estado explorando posibles formas de digitalizar las fotos de la morgue. Pero hasta el año pasado, la idea de un archivo digitalizado parecía fuera de alcance".
Para preservar esta historia invaluable y darle a
The Times la posibilidad de mejorar sus informes con incluso más narraciones visuales y contexto histórico,
The Times está digitalizando su archivo con
Cloud Storage para almacenar escaneos en alta resolución de todas las imágenes de la morgue.
Cloud Storage es nuestro sistema para almacenar objetos que brinda a clientes como
The Times una solución de administración automática, almacenamiento en diferentes regiones geográficas y una interfaz y API de administración fáciles de usar.
Creando un sistema de administración de recursos
Almacenar imágenes de alta resolución no es suficiente para crear un sistema que los editores de fotos puedan usar fácilmente. Para que un sistema de administración de recursos funcione correctamente, debe permitir que los usuarios puedan navegar y buscar fotos sin complicaciones.
The Times creó una canalización que almacena y procesa las fotos, y usará la tecnología de la nube para procesar y reconocer texto, escritura a mano y otros detalles que se pueden encontrar en las imágenes.
Así es como funciona. Una vez que se ingiere una imagen en Cloud Storage,
The Times utiliza
Cloud Pub/Sub para iniciar el procesamiento y realizar varias tareas. Las imágenes se redimensionan a través de los servicios que se ejecutan en
Google Kubernetes Engine (GKE), y los metadatos de la imagen se almacenan en una base de datos
PostgreSQL que se ejecuta en
Cloud SQL, el servicio de base de datos totalmente administrado de Google.
Cloud Pub/Sub ayudó a
The New York Times a crear esta canalización sin necesidad de crear API complejas o sistemas de procesos empresariales. Además, como es una solución totalmente administrada, no se pierde tiempo manteniendo la infraestructura subyacente.
Para cambiar el tamaño de las imágenes y modificar sus metadatos,
The Times utiliza los programas de línea de comandos de código abierto "
ImageMagick" y "
ExifTool". Agregaron estas herramientas con servicios de Go a las imágenes de Docker para ejecutarlas en GKE de forma escalable y con un mínimo esfuerzo administrativo. Agregar más capacidad para procesar más imágenes es algo trivial, y
The Times puede detener o iniciar su clúster Kubernetes cuando no es necesario. Las imágenes también se guardan en
depósitos multirregionales de Cloud Storage para que estén disponibles en varias ubicaciones.
La última pieza del archivo es el seguimiento de ambas imágenes y sus metadatos a medida que avanzan a través de los sistemas de
The Times. Cloud SQL es una gran opción. Para los desarrolladores del reconocido periódico, esta herramienta proporciona una instancia estándar de PostgreSQL, como un servicio totalmente administrado, que elimina la necesidad de instalar nuevas versiones, aplicar parches de seguridad o configurar opciones de replicación complejas. Cloud SQL les permite a los ingenieros utilizar una solución SQL estándar de forma sencilla.
Aprendizaje automático para obtener información adicional
Almacenar las imágenes es solo la mitad de la historia. Para hacer que un archivo como la morgue de
The Times sea más accesible y útil, se deben aprovechar las funciones adicionales de GCP. En el caso de
The Times, uno de los mayores desafíos al escanear un archivo fotográfico ha sido agregar datos sobre el contenido de las imágenes. La
API de Cloud Vision puede ayudar con es tarea.
A modo de ejemplo, echemos un vistazo a esta foto de
The Times de la antigua Penn Station. Aquí se puede apreciar el frente y el reverso de la foto: