A medida que continúa creciendo el impacto del COVID-19, los investigadores de la salud y de las ciencias biológicas compiten en una carrera por saber más sobre el nuevo coronavirus y están recurriendo cada vez más a las tecnologías de la nube para hacer ese trabajo.
Estamos muy agradecidos por el trabajo de esos expertos y queremos apoyarlos con herramientas y tecnologías que puedan ayudarlos a combatir esta pandemia. Hoy nos complace compartir más información sobre una serie de iniciativas con las que estamos comprometidos para apoyar no solo a los investigadores, sino también a las organizaciones y comunidades en las que prestan servicio.
Cómo ayudamos a los investigadores a pronosticar la propagación y el impacto del COVID-19En enero, The Laboratory for the Modelling of Biological + Sociotechnical Systems (
MoBS) de Network Science Institute, perteneciente a Northeastern University, comenzó a utilizar Google Cloud para realizar simulaciones de modelos a gran escala basados en datos con el objetivo de calcular la forma en que las estrategias de mitigación, como las restricciones de viaje y las políticas de distanciamiento social, afectarían a la propagación de la infección. Los modelos son muy complejos; contienen docenas de parámetros y enormes conjuntos de datos; y requieren grandes cantidades de potencia de cálculo, procesamiento de datos y almacenamiento.
Utilizando las capacidades de computación de alto rendimiento (HPC) de Google Cloud, incluido el procesamiento por lotes a través de
API de Cloud Life Sciences, los investigadores de Northeastern University han podido ejecutar simultáneamente miles de máquinas virtuales interrumpibles (PVM) para potenciar su trabajo. Esto ha reducido de días a horas el tiempo que se tarda en realizar simulaciones complejas. Además, cuando estén completas las simulaciones, podrán analizar los resultados usando
BigQuery y compartir rápidamente esos conocimientos con investigadores y organismos de salud pública de todo el mundo para difundir cómo se está propagando el virus.
Los beneficios son invaluables. Hasta la fecha, los investigadores de
Northeastern University han podido generar más de nueve millones de modelos diferentes y analizar más de 5,500 terabytes de datos resultantes. También evaluaron el
riesgo relativo de importar casos (visualizado con la herramienta de visualización gratuita
Data Studio de Google) y
publicaron sus hallazgos en Science.
"Desarrollar modelos basados en datos para predecir la propagación de la infección por COVID-19 y su posible impacto es monumental en la carrera por frenar el virus", explicó el Dr. Matteo Chinazzi, científico investigador asociado del MoBS.
Cómo seguimos apoyando la investigación crítica Otorgaremos
20 millones de dólares en créditos de Google Cloud para permitir a los investigadores aprovechar el poder de la nube en su lucha contra el COVID-19. Para administrar esos créditos de manera eficaz, nos asociamos con
Harvard Global Health Institute a fin de identificar oportunidades de investigación prometedoras y aplicar las capacidades de Google Cloud para apoyarlas. Harvard Global Health Institute ha reunido a un equipo de asesores científicos de diversas disciplinas para examinar las presentaciones. Los investigadores que necesiten la capacidad de Google Cloud para trabajar en temas relacionados con el COVID-19 pueden
enviarnos propuestas directamente a nosotros. Se considerarán las solicitudes de forma continua.
"Los investigadores académicos corren de aquí para allá para descubrir posibles tratamientos y terapias, por lo que la colaboración es más importante que nunca. Nuestra asociación con Google proporciona a esos investigadores recursos muy necesarios para acelerar la respuesta global ante el COVID-19", afirmó el Dr. Ashish K. Jha, de Harvard Global Health Institute. "Estamos considerando todos los diferentes tipos de enfoques de investigación, como la investigación clínica, la investigación científica de referencia, la entrega de fármacos y la investigación terapéutica, los servicios de salud y la investigación política, y la investigación epidemiológica, para hacer frente a la urgencia de la pandemia".
También estamos
brindando apoyo a los investigadores de Biocomplexity Institute, perteneciente a University of Virginia, que están realizando simulaciones diarias de epidemias en Google Cloud. Los resultados de esas simulaciones son conjuntos de datos que ayudan a los Gobiernos estatales, locales y nacionales a hacer un seguimiento de la propagación del COVID-19, a evaluar el impacto de las intervenciones, a decidir cómo y cuándo se flexibilizarán esas medidas, y a tomar decisiones sobre cómo y dónde asignar recursos.
Cómo llevamos el análisis de datos y el aprendizaje automático a más investigadoresPara que los datos tengan una mayor disponibilidad y sean más accesibles, Google Cloud lanzó
COVID-19 Public Dataset Program, que permite consultar de forma gratuita los conjuntos de datos relacionados con el COVID-19 en BigQuery. Esto incluye los datos de casos ampliamente referenciados de
Johns Hopkins University (que también pueden visualizarse en Hojas de cálculo de Google como
paneles), así como los conjuntos de datos que pueden resultar pertinentes en la investigación del COVID-19, como
American Community Survey y
Open Street Maps. Además, introdujimos siete nuevos conjuntos de datos de
Social Determinant of Health (SDoH) disponibles en el programa, que pueden ayudar a los investigadores a identificar qué comunidades de Estados Unidos son más vulnerables a la pandemia.
En marzo, la Casa Blanca y las instituciones de apoyo convocaron a la comunidad de la IA para que desarrollara nuevas técnicas de minería de datos y texto para examinar
COVID-19 Open Research Dataset (CORD-19), la colección de literatura sobre coronavirus legible por máquinas más extensa hasta la fecha. A modo de ayuda, pedimos a nuestra comunidad de Kaggle de científicos de datos que se unieran al esfuerzo y que también participaran en
desafíos adicionales para pronosticar la propagación del COVID-19. Las contribuciones de esos esfuerzos, incluida una revisión de la bibliografía seleccionada por AA, pueden consultarse
aquí.
Cómo aceleramos los esfuerzos de investigación para el descubrimiento de fármacos a un costo menorLos investigadores están trabajando las veinticuatro horas del día para comprender mejor el COVID-19 y minimizar su impacto tanto en nuestra salud como en la economía mundial. Al distribuir su trabajo a través de decenas de miles de máquinas virtuales de Google Cloud, los investigadores pueden acelerar sus modelos y análisis, lo que genera un ahorro sustancial de tiempo y recursos. Las
VM interrumpibles de Google Cloud son ideales para ejecutar este tipo de aplicaciones de investigación fácilmente distribuidas y tolerantes a errores, ya que permiten a los investigadores acelerar la porción computacional de su investigación a una fracción del costo de las VM estándar.
Con el objetivo de acelerar la mayor cantidad posible de proyectos de investigación relacionados con el COVID-19, Google está ampliando el acceso a máquinas virtuales interrumpibles mediante créditos específicos para apoyar las iniciativas de respuesta al COVID-19, además de los créditos generales de Cloud mencionados anteriormente en este artículo. A medida que recibamos las propuestas de investigación sobre el COVID-19, Google trabajará con los investigadores para identificar las formas en que pueden acelerar y ampliar su trabajo mediante el uso de máquinas virtuales interrumpibles, como es el caso del siguiente ejemplo.
El desarrollo de un nuevo fármaco en
Estados Unidos suele costar entre 2,000 y 3,000 millones de dólares, y tarda unos diez años. Los equipos de
Harvard Medical School y Dana Farber Cancer Institute (DFCI) están utilizando
VirtualFlow, una plataforma virtual de código abierto para descubrir fármacos que se ejecuta en Google Cloud y que utiliza máquinas virtuales interrumpibles para delimitar con mayor rapidez y precisión objetivos de fármacos prometedores a fin de acelerar el descubrimiento de terapias y tratamientos para los enfermos de COVID-19.
VirtualFlow los está ayudando a identificar miles de millones de compuestos de fármacos contra las proteínas del SARS-CoV-2 en cuestión de días, lo que aumenta enormemente su capacidad para estudiar y analizar posibles terapias contra el COVID-19.
"Los enfoques de pruebas virtuales que estamos utilizando han reducido enormemente el tiempo necesario para el descubrimiento de fármacos y tratamientos, y es de esperar que generen un desarrollo terapéutico más rápido contra las enfermedades", afirmó Christoph Gorgulla, investigador posdoctoral de Harvard Medical School.
"Aprovechando la abundancia de datos estructurales disponibles sobre las proteínas del SARS-CoV-2, estamos utilizando la tecnología de Google Cloud para identificar inhibidores de proteínas virales. Usar cientos de miles de núcleos computacionales de Google Cloud nos permite terminar esta tarea de examinar mil millones de compuestos (~12,000 millones de instancias) en un par de semanas. Lograr esto en una laptop estándar llevaría 1,500 años", explicó Haribabu Arthanari, profesor asistente de Harvard Medical School.