kreuzberg

Document intelligence framework for Python - Extract text, metadata, and structured data from PDFs, images, Office documents, and more. Built on Pandoc, PDFium, and Tesseract.

GitHubスター

2,340

ユーザー評価

未評価

お気に入り

0

閲覧数

5

フォーク

95

イシュー

5

技術情報

プログラミング言語

Python主要言語

システム要件

特定の要件は記載されていません

メンテナンス状況

アクティブ

GitHubトピック

asyncdocument-intelligencemcpmetadata-extractionocrpandocpdf-extractionpdfiumpythonragtable-extractiontesseracttext-extraction