Add multi-pass extraction for large inputs

## Problem

Some documents are too large to process in a single LLM call, even with truncation. Need multi-pass extraction for comprehensive results.

## Dependencies

- Requires: #39 (token counting)
- Requires: #40 (truncation strategies)

## Proposed Solution

Implement chunking and multi-pass extraction:

1. **Intelligent chunking**
   - Split by semantic boundaries (paragraphs, sections)
   - Maintain overlap for context (e.g., 100 tokens)
   - Preserve document structure

2. **Multi-pass extraction**
   - Extract from each chunk independently
   - Merge results intelligently:
     - Deduplicate extracted entities
     - Resolve conflicts (use confidence scores)
     - Combine arrays/lists
   - Track chunk provenance

3. **Configuration**
```typescript
interface ChunkingConfig {
  enabled: boolean;
  chunkSize: number;      // tokens per chunk
  overlap: number;        // token overlap between chunks
  mergeStrategy: 'concat' | 'dedupe' | 'smart';
}
```

4. **Output metadata**
   - Report chunks processed
   - Show merge conflicts resolved
   - Confidence scores per field

## Acceptance Criteria

- [ ] Chunking algorithm implementation
- [ ] Multi-pass extraction pipeline
- [ ] Result merging with deduplication
- [ ] Conflict resolution strategy
- [ ] CLI flag: `--enable-chunking`
- [ ] CLI flag: `--chunk-size N`
- [ ] Metadata in extraction results
- [ ] Tests for various document sizes
- [ ] Documentation with examples
- [ ] Performance benchmarks

## Related

- Parent: #30 (closed - split into focused issues)
- Prerequisites: #39, #40
- Note: This is the most complex feature - consider optional/experimental flag

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add multi-pass extraction for large inputs #41

Problem

Dependencies

Proposed Solution

Acceptance Criteria

Related

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Add multi-pass extraction for large inputs #41

Description

Problem

Dependencies

Proposed Solution

Acceptance Criteria

Related

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions