Provenance Data as a First-Class Citizen for Deep Learning Workflow Analyses
Autores
7567 |
2375,51,3056
|
|
7568 |
2375,51,3056
|
|
7569 |
2375,51,3056
|
Informações:
Publicações do PESC
Workflows de aprendizado profundo (AP) consistem em várias etapas conectadas e repetitivas, incluindo preparação de dados, treinamento, avaliação e implantação de modelos. Cada etapa envolve decisões que impactam o desempenho e a aplicabilidade do modelo final. É essencial rastrear as etapas do workflow que geraram o modelo de AP, para oferecer qualidade e confiabilidade ao modelo. No entanto, as soluções de rastreabilidade existentes frequentemente não oferecem o encadeamento do workflow de AP, dependem de formatos proprietários ou não geram documentos de proveniência que acompanhem os modelos em produção. Essas limitações comprometem os benefícios da rastreabilidade. Apresentamos o DLProv, um conjunto de serviços de proveniência para apoiar a rastreabilidade em workflows de AP. DLProv apoia consultas em SQL durante o treinamento e gera documentos de proveniência que registram a preparação de dados, o treinamento e a avaliação do modelo. Esses documentos seguem o padrão W3C PROV, garantindo interoperabilidade. O DLProv possui uma arquitetura independente de framework de AP, mas também inclui instâncias especializadas para Keras e Redes Neurais Informadas por Física (PINNs). Avaliamos o DLProv em estudos de caso, desde arquiteturas consolidadas de AP até PINNs, mostrando sua capacidade de capturar e gerenciar dados de proveniência, assegurando rastreabilidade em conformidade com o W3C PROV. Os experimentos também analisam o uso do documento de proveniência gerado, permitindo identificar problemas no modelo de AP implantado. Nossos experimentos também mostraram que a integração dos serviços do DLProv não comprometem o tempo de execução do workflow.
Deep Learning (DL) workflows consist of multiple connected and repetitive steps, including data preparation, model training, evaluation, and deployment. Each step involves decisions that impact the final model’s performance and applicability. It is important to trace the workflow steps that generated the DL model to provide quality and trust to the model. However, existing traceability solutions often do not provide DL workflow traceability, rely on proprietary formats, or fail to generate provenance documents that can accompany models into production. These limitations compromise the benefits of traceability. We introduce DLProv, a suite of provenance services designed to ensure traceability in DL workflows. DLProv supports SQL-based querying during training and generates provenance documents that capture data preparation, model training, and evaluation. These documents comply with the W3C PROV standard, ensuring interoperability. DLProv features a framework-agnostic architecture, allowing integration with different DL frameworks, and includes specialized instances for Keras and Physics-Informed Neural Networks (PINNs). We evaluated DLProv across multiple case studies, ranging from well-established DL architectures to PINNs, showing its ability to capture and manage provenance data while ensuring traceability in compliance with W3C PROV. Our experiments also highlighted the use of the provenance document generated after the model's deployment, enabling the identification of potential issues in the DL model. In addition, our evaluation showed that integrating DLProv services does not compromise workflow execution time.