IA privada vs. LLMs públicos: la lista de verificación de un CFO
Cuándo enviar datos a OpenAI es aceptable, cuándo no, y cómo se ve correr modelos comparables a GPT-4 dentro de tu propia infraestructura.
El riesgo real no es el modelo, es la ruta del dato
Cuando usas una API pública, cada prompt — contratos, expedientes, datos de clientes — sale de tu perímetro hacia un tercero. Para salud, finanzas, legal o gobierno eso no es un detalle técnico: es un problema de cumplimiento (NOM, CNBV, residencia de datos). La pregunta del CFO no es "¿qué tan bueno es el modelo?" sino "¿quién toca mi dato y bajo qué jurisdicción?".
Los modelos abiertos ya son suficientes para la mayoría del trabajo
Para extracción de información, resumen, Q&A sobre documentos y generación de texto, los modelos open-weights de alta densidad de parámetros — familias Llama (Meta), Qwen (Alibaba) y similares — alcanzan paridad práctica con los modelos propietarios de primer nivel en la mayoría de tareas empresariales. Corren dentro de tu infraestructura — on-premise o en una VPC dedicada con residencia de datos en México — exponiendo una API compatible con OpenAI, así que el código existente se reutiliza sin cambios.
La economía se invierte a escala
Hardware empresarial accesible — desde un servidor con una GPU de gama alta hasta configuraciones multi-GPU — atiende desde decenas hasta cientos de usuarios concurrentes según el tamaño del modelo. Con alto volumen de inferencia, el hardware propio se amortiza típicamente en uno a dos años frente al costo acumulado por token de una API externa, además de eliminar el riesgo de fuga de datos.
La lista de verificación
¿Tus datos están regulados o bajo NDA? ¿La residencia de datos es un requisito? ¿Tu volumen de inferencia es alto y constante? ¿Necesitas fine-tuning con datos propios sin que salgan? Si respondes "sí" a dos o más, la IA privada deja de ser un lujo y se vuelve la opción por defecto.