Objeto BioCompute - BioCompute Object

Objeto BioCompute
Estado Grupo de trabajo activo de IEEE
Estándares relacionados Lenguaje de flujo de trabajo común
Licencia Cláusula BSD-3
Abreviatura BCO
Sitio web osf .io / h59uh /


El proyecto BioCompute Object (BCO) es una iniciativa impulsada por la comunidad para construir un marco para estandarizar y compartir cálculos y análisis generados a partir de secuenciación de alto rendimiento (HTS, también conocida como secuenciación de próxima generación o secuenciación masivamente paralela ). Desde entonces, el proyecto se ha estandarizado como IEEE 2791-2020, y los archivos del proyecto se mantienen en un repositorio de código abierto . La edición del 22 de julio de 2020 del Registro Federal anunció que la FDAahora admite el uso de BioCompute (oficialmente conocido como IEEE 2791-2020) en presentaciones regulatorias, y la inclusión del estándar en el Catálogo de estándares de datos para el envío de datos HTS en NDA, ANDA, BLA e IND a CBER , CDER , y CFSAN .

Originalmente comenzó como un contrato de colaboración entre la Universidad George Washington y la Administración de Alimentos y Medicamentos , el proyecto ha crecido para incluir más de 20 universidades, empresas de biotecnología, asociaciones público-privadas y empresas farmacéuticas, incluidas Seven Bridges y Harvard Medical School . El BCO tiene como objetivo facilitar el intercambio de flujos de trabajo de HTS entre varias organizaciones, como la FDA, compañías farmacéuticas, organizaciones de investigación por contrato, proveedores de plataformas bioinformáticas e investigadores académicos. Debido a la naturaleza sensible de las presentaciones regulatorias, se pueden publicar pocas referencias directas al material. Sin embargo, el proyecto está financiado actualmente para capacitar a los revisores y administradores de la FDA para que lean e interpreten los BCO, y actualmente tiene 4 publicaciones enviadas o casi enviadas.

Fondo

Uno de los mayores desafíos en bioinformática es documentar y compartir los flujos de trabajo científicos de tal manera que el cálculo y sus resultados puedan ser revisados ​​por pares o reproducidos de manera confiable. Las canalizaciones bioinformáticas suelen utilizar varias piezas de software, cada una de las cuales suele tener varias versiones disponibles, varios parámetros de entrada, varias salidas y, posiblemente, configuraciones específicas de la plataforma. Al igual que con los parámetros experimentales en un protocolo de laboratorio, pequeños cambios en los parámetros computacionales pueden tener un gran impacto en la validez científica de los resultados. BioCompute Framework proporciona un diseño orientado a objetos a partir del cual se puede construir, firmar digitalmente y compartir un BCO que contiene detalles de una tubería y cómo se usó . El concepto BioCompute se desarrolló originalmente para satisfacer las necesidades de investigación y revisión regulatorias de la FDA para la evaluación, validación y verificación de datos genómicos. Sin embargo, el Marco de biocomputación sigue los principios de datos FAIR y se puede utilizar ampliamente para proporcionar comunicación e interoperabilidad entre diferentes plataformas, industrias, científicos y reguladores.

Utilidad

Como estandarización para los datos genómicos, los objetos BioCompute son principalmente útiles para tres grupos de usuarios: 1) investigadores académicos que llevan a cabo nuevos experimentos genéticos, 2) compañías farmacéuticas / biotecnológicas que desean enviar trabajos a la FDA para revisión regulatoria, y 3) clínicas. entornos (hospitales y laboratorios) que ofrecen pruebas genéticas y medicina personalizada . La utilidad para los investigadores académicos es la capacidad de reproducir datos experimentales con mayor precisión y con menos incertidumbre. La utilidad para las entidades que deseen enviar un trabajo a la FDA es un enfoque simplificado, nuevamente con menos incertidumbre y con la capacidad de reproducir el trabajo con mayor precisión. Para entornos clínicos, es fundamental que los datos de HTS y los metadatos clínicos se transmitan de manera precisa, idealmente de una manera estandarizada que sea legible por cualquier parte interesada, incluidos los socios reguladores.

Formato

El objeto BioCompute está en formato json y, como mínimo, contiene todas las versiones de software y los parámetros necesarios para evaluar o verificar una canalización computacional. También puede contener datos de entrada como archivos o enlaces, genomas de referencia o componentes ejecutables de Docker. Un objeto BioCompute se puede integrar con HL7 FHIR como un recurso de procedencia. También se están desarrollando múltiples implementaciones conjuntas que aprovechan el formato centrado en informes de BCO, incluido CWL (uno de los cuales es parte de un contrato público activo financiado por el gobierno con un cofundador de CWL para probar y generar documentación para un BCO-CWL conjunto, así como ejemplos) y RO.

Consorcio BCO

El grupo de trabajo BioCompute Object facilita un medio para que las diferentes partes interesadas proporcionen información sobre las prácticas actuales en el BCO. Este grupo de trabajo se formó durante la preparación del Taller de Estándares Computacionales para Ciencias Regulatorias HTS 2017 , e inicialmente estuvo integrado por los participantes del taller. Ha habido un crecimiento continuo del grupo de trabajo BCO como resultado directo de la interacción entre una variedad de partes interesadas de todas las comunidades interesadas en la estandarización del procesamiento de datos HTS computacional. Las asociaciones público-privadas formadas entre universidades, empresas privadas de datos genómicos, plataformas de software, instituciones gubernamentales y reguladoras han sido un punto de entrada fácil para que nuevas personas o instituciones en el proyecto BCO participen en la discusión de las mejores prácticas para los objetos.

Implementaciones

El biocomputado del paquete R simple puede crear, validar y exportar objetos BioCompute. El Compliance Suite Genómica es una aplicación brillante que ofrece características similares a las expresiones regulares encuentran en todos los editores de texto modernos. Hay varios paquetes de software de código abierto y aplicaciones web desarrollados internamente que implementan la especificación BioCompute, tres de los cuales se han implementado en una nube AWS EC2 de acceso público . Estos incluyen una instancia del entorno virtual integrado de alto rendimiento , el BioCompute Portal (una aplicación web basada en formularios que puede crear y editar objetos BioCompute según el estándar IEEE-2791-2020 , y una instancia de Galaxy compatible con BioCompute .

Referencias

enlaces externos