Skip to content

[OCR] Implementar deteccao de tabelas e formatacao #75

@jedin01

Description

@jedin01

Descricao

Melhorar a deteccao e extracao de tabelas presentes nas provas.

Tarefas

  • Detectar regioes de tabela no documento
  • Extrair estrutura da tabela (linhas e colunas)
  • Preservar alinhamento de celulas
  • Converter para formato estruturado (JSON/HTML)
  • Associar tabelas as questoes correspondentes
  • Renderizar tabelas na interface de revisao

Formato de Saida

{
  "table": {
    "headers": ["Col1", "Col2"],
    "rows": [
      ["val1", "val2"],
      ["val3", "val4"]
    ]
  }
}

Branch Relacionada

feature/orc-implementation

Estimativa

3 dias

Metadata

Metadata

Assignees

Labels

enhancementNew feature or requestocrOCR e extracao de textopriority:mediumPrioridade mediapythonServico Python

Type

No type

Projects

No projects

Relationships

None yet

Development

No branches or pull requests

Issue actions