Descubrí tres repositorios de GitHub perfectos para proyectos en Python, organizados en múltiples scripts. Desde automatización y análisis de datos hasta machine learning, estas herramientas son ideales para aprender, explorar y crear.
2025-03-10
2025-02-15
Baroc Recognizer - "Batch and Recursive Optical Character Recognition" (OCR)
Hoy quiero presentarte Baroc Recognizer (Batch and Recursive Optical Character Recognition), una herramienta que va a facilitar la forma en que trabajás con documentos digitales. Este software está diseñado para realizar OCR (Reconocimiento Óptico de Caracteres) de manera masiva y recursiva en PDFs e imágenes. Si necesitás extraer texto de cientos de documentos sin tener que hacerlo uno por uno, ¡este programa es para vos!
¿Qué es Baroc Recognizer?
Baroc Recognizer es una solución integral para convertir documentos escaneados o imágenes en texto editable. Con su capacidad para procesar archivos en lote y de forma recursiva, podés ahorrar tiempo y esfuerzo en tareas que, de otra manera, te llevarían horas.
2025-02-09
Regex Bulk Replace: Multiple busqueda y reemplazo con expresiones regulares.
Si necesitás transformar textos de forma precisa,
Regex Bulk Replace es la herramienta ideal, esta app te permite
aplicar múltiples búsquedas y reemplazos en secuencia usando el poder de las
expresiones regulares.
¿Qué hace la aplicación?
2025-01-24
Parrafix Elimina lineas cortadas resultante de la extracción del texto de un pdf
Parrafix
Soluciona el error cuando un txt tiene todos los parrafos cortados, con saltos de lineas, los elimina y deja solo si terminan con punto.
Despues de convertir una archivo pdf a txt todas los renglones terminan con saltos de líneas, esto es incorrecto. deberían ser lineas continuas hasta el punto de fin de parrafo.
Guía: Uso y Función del Script de Procesamiento de Texto
Suscribirse a:
Entradas (Atom)