I+D / Propiedad industrial

Buscadores de patentes (OCR + indexación)

Extracción y OCR multilingüe + búsqueda a milisegundos con Sphinx sobre PostgreSQL.

Reto

Consultar millones de registros PDF escaneados en varios idiomas, manteniendo precisión y respuesta rápida.

Solución

Pipeline OCR + extracción de metadatos; indexación en Sphinx; API PHP con AJAX y UI en JS.

Impacto

Investigación más ágil y decisiones documentadas en menos tiempo.