Skillfinance-foundryv1.0

OCR Extraction

by AaaS · open-source · Last verified 2026-03-28

Extracts structured data from unstructured documents (PDFs, scanned images, email attachments) using optical character recognition with layout-aware parsing. Handles multi-page invoices, varying formats, and poor scan quality — producing structured key-value pairs for downstream reconciliation.

https://aaas.blog/skill/ocr-extraction ↗

B—Above Average

Adoption: B+Quality: AFreshness: ACitations: BEngagement: F

Specifications

License: MIT
Pricing: open-source
Capabilities: pdf-parsing, layout-aware-extraction, multi-format-support, key-value-structuring, quality-confidence-scoring
Integrations: google-document-ai, textract, tesseract
Use Cases: invoice-processing, receipt-scanning, contract-digitization
API Available: No
Difficulty: intermediate
Prerequisites
Supported Agents: uc-invoice-reconciler, uc-lease-abstractor
Tags: ocr, document-processing, invoice, pdf, data-extraction
Added: 2026-03-28
Completeness: 100%

Index Score

61.3

Adoption

Quality

Freshness

Citations

Engagement

Ready to add this skill to your workflow?

Start Building

Explore the full AI ecosystem on Agents as a Service