Tipos de Archivo Soportados
Una guía completa de los formatos de archivo soportados por el sistema de procesamiento de documentos de BrainBox
Listo para Producción
Estable
Estos tipos de archivo están completamente soportados y probados para uso en producción.
PDF con OCR Básico
.pdf
- Para mejores resultados de OCR, divide los documentos en lotes de hasta 300 páginas para evitar tiempos de espera en el procesamiento
- El OCR se aplica automáticamente solo cuando no se puede extraer texto del PDF
- Importante: Para PDFs mixtos (que contienen texto escaneado y digital), separa las páginas que necesitan OCR de las que tienen texto seleccionable. Si un PDF tiene cualquier texto seleccionable, el OCR no se aplicará y el contenido escaneado puede perderse
- Estamos trabajando activamente en una solución para manejar mejor los PDFs con contenido mixto
Archivos de Audio y Video
.mp3, .wav, .m4a, .mp4, .webm, .mov
- Transcripción automática con diarización de hablantes vía AssemblyAI
- Tamaño máximo de archivo: 1 GB por archivo
- Duración máxima: 10 horas por archivo
- Genera transcripción buscable con marcas de tiempo precisas
- Crea subtítulos WebVTT automáticamente
- Facturación: 1 Unidad de Inteligencia por minuto de audio/video
Funciones Beta
En Pruebas
Estos tipos de archivo están en pruebas beta y pueden tener algunas limitaciones.
Documentos de Word
.doc, .docx
Hojas de Cálculo de Excel
.xls, .xlsx
Imágenes
.jpg, .png, .tiff
Funciones Alfa
Experimental
Estas funciones están en desarrollo temprano y pueden ser inestables.
PowerPoint
.ppt, .pptx
Archivos CSV
.csv
Archivos de Texto
.txt, .md
Archivos de Código
.js, .ts, .py, .css, .html, .json, .xml
Próximamente
En Desarrollo
Estas funciones están planificadas para futuras versiones.
Archivos de Audio
.mp3, .wav
Procesamiento Avanzado de PDF
OCR y Análisis Mejorados