|
tika
☆
« Back to VersTracker
|
||||||||||||||||||||||||||||||
|
Description: Content analysis toolkit |
||||||||||||||||||||||||||||||
| Type: Formula | Tracked Since: Dec 28, 2025 | ||||||||||||||||||||||||||||||
| Links: Homepage | @ApacheTika | formulae.brew.sh | ||||||||||||||||||||||||||||||
| Category: Developer tools | ||||||||||||||||||||||||||||||
| Tags: parsing metadata-extraction document-processing search-indexing content-analysis | ||||||||||||||||||||||||||||||
| Install: brew install tika | ||||||||||||||||||||||||||||||
|
About: Apache Tika is a content analysis toolkit that detects and extracts metadata and structured text content from over a thousand different file types. It provides a unified parsing interface, enabling developers to index content for search engines and analyze documents without managing complex format-specific libraries. This makes it essential for building robust document ingestion and data extraction pipelines. |
||||||||||||||||||||||||||||||
Key Features:
|
||||||||||||||||||||||||||||||
Use Cases:
|
||||||||||||||||||||||||||||||
Alternatives:
|
||||||||||||||||||||||||||||||
| Version History | ||||||||||||||||||||||||||||||
|