Skip to content

Rendere più robusto il run tracking su Windows durante la scrittura dei run record #79

@Gabrymi93

Description

@Gabrymi93

Problema

Durante l'intake di bdap-lea nel flusso canonico toolkit run all --config dataset.yml, il run ha completato correttamente RAW e CLEAN ma ha poi urtato un PermissionError: [WinError 5] Access is denied durante la fase di scrittura/rename del run record sotto data/_runs/....

Effetto pratico:

  • gli artefatti di layer risultano presenti e coerenti
  • il candidato può essere tecnicamente sano
  • ma il run viene marcato come fallito per un problema di persistenza del run record

Questo è un attrito reale sul percorso canonico del toolkit, non solo su tooling avanzato.

Contesto

Caso emerso su un candidate reale:

  • dataset: bdap-lea
  • comando: toolkit run all --config dataset.yml
  • ambiente: Windows locale

Nel caso specifico:

  • RAW: ok
  • CLEAN: ok
  • MART: eseguibile poi separatamente
  • failure: scrittura/rename del run record in _runs

Obiettivo

Rendere più robusta la persistenza dei run record su Windows, in particolare nei casi di rename atomico / replace di file temporanei.

Scope minimo

  • riprodurre il failure mode su Windows
  • verificare il path di scrittura dei run record e l'uso di temp file + rename/replace
  • ridurre i casi in cui un run semanticamente riuscito viene marcato come failed per un problema di persistenza locale
  • mantenere invariato il contratto dei run record se possibile

Non obiettivo

  • redesign generale del run tracking
  • cambio del formato dei run record
  • cambiare il flusso canonico del toolkit

Criterio di uscita

Un toolkit run all riuscito non deve fallire solo per il write finale del run record su Windows, quando gli artefatti dei layer sono già stati prodotti correttamente.

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

Status

✅ Completato

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions