-
Notifications
You must be signed in to change notification settings - Fork 0
Rendere più robusto il run tracking su Windows durante la scrittura dei run record #79
Copy link
Copy link
Closed
Description
Problema
Durante l'intake di bdap-lea nel flusso canonico toolkit run all --config dataset.yml, il run ha completato correttamente RAW e CLEAN ma ha poi urtato un PermissionError: [WinError 5] Access is denied durante la fase di scrittura/rename del run record sotto data/_runs/....
Effetto pratico:
- gli artefatti di layer risultano presenti e coerenti
- il candidato può essere tecnicamente sano
- ma il run viene marcato come fallito per un problema di persistenza del run record
Questo è un attrito reale sul percorso canonico del toolkit, non solo su tooling avanzato.
Contesto
Caso emerso su un candidate reale:
- dataset:
bdap-lea - comando:
toolkit run all --config dataset.yml - ambiente: Windows locale
Nel caso specifico:
- RAW: ok
- CLEAN: ok
- MART: eseguibile poi separatamente
- failure: scrittura/rename del run record in
_runs
Obiettivo
Rendere più robusta la persistenza dei run record su Windows, in particolare nei casi di rename atomico / replace di file temporanei.
Scope minimo
- riprodurre il failure mode su Windows
- verificare il path di scrittura dei run record e l'uso di temp file + rename/replace
- ridurre i casi in cui un run semanticamente riuscito viene marcato come failed per un problema di persistenza locale
- mantenere invariato il contratto dei run record se possibile
Non obiettivo
- redesign generale del run tracking
- cambio del formato dei run record
- cambiare il flusso canonico del toolkit
Criterio di uscita
Un toolkit run all riuscito non deve fallire solo per il write finale del run record su Windows, quando gli artefatti dei layer sono già stati prodotti correttamente.
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels
Type
Projects
Status
✅ Completato