---
title: "Data Lake en Supabase: guía 2026 empresa mediana"
description: "Cómo construir un data lake con Supabase para empresa mediana en Colombia: arquitectura Bronze/Silver/Gold, costos reales, alternativa a AWS y BigQuery."
slug: "data-lake-en-supabase-para-empresa-mediana-colombia"
url: "https://catalizadora.ai/blog/data-lake-en-supabase-para-empresa-mediana-colombia"
cluster: "datos-sistemas/data-lake-supabase"
author: "Pablo Estrada"
published_at: "2026-06-17T05:18:47.138814+00:00"
updated_at: "2026-06-19T19:59:51.42746+00:00"
read_minutes: "5"
lang: "es"
---
# Data Lake en Supabase: guía 2026 empresa mediana

> Cómo construir un data lake con Supabase para empresa mediana en Colombia: arquitectura Bronze/Silver/Gold, costos reales, alternativa a AWS y BigQuery.

Para una empresa mediana colombiana en 2026, **Supabase es una opción seria de data lake hasta 5 TB con queries moderadas**: arquitectura Bronze/Silver/Gold limpia, 150 a 300 USD al mes para 1 TB, Postgres puro sin lock-in, escalado horizontal hasta el punto donde BigQuery o Snowflake ganan. En una distribuidora cliente nuestra normalizamos 3.6 millones de filas legacy de SQL Server 2019 con 197 tablas inconsistentes en 48 horas, todo en Supabase con verificación fila-a-fila. Cuando los datos se unifican, los problemas se anuncian solos.

## ¿Supabase sirve realmente para data lake?

Sí, Supabase sirve para data lake hasta volúmenes de 1 a 5 TB con queries moderadas. Supabase es Postgres puro (PostgreSQL 17 al momento) con extensiones (pg_vector, postgis, pg_graphql), storage S3-compatible con buckets públicos o privados, edge functions Deno, auth con RLS row-level security, y realtime via WAL.

Para una empresa mediana colombiana (50 a 300 empleados, 100 GB a 2 TB de datos operativos), Supabase es alternativa seria a AWS data lake o BigQuery. Pasado los 5 TB con queries pesadas analíticas, conviene migrar a un warehouse columnar como BigQuery, Snowflake o ClickHouse.

## Arquitectura Bronze, Silver, Gold sobre Supabase

El patrón estándar Bronze/Silver/Gold se implementa con esquemas Postgres separados:

**Esquema `bronze`**: datos crudos como llegan. Tablas espejo de los sistemas fuente, sin modificación. Storage barato (puede ir a Supabase Storage como parquet si es muy grande). Útil para auditabilidad y reprocesamiento.

**Esquema `silver`**: datos normalizados, deduplicados, con tipos correctos y joins de referencia aplicados. Vistas o tablas según volumen. Es la capa que tu equipo de datos consulta directamente.

**Esquema `gold`**: tablas de decisión listas para BI y reportería ejecutiva. KPIs precalculados, vistas materializadas para sub-segundo, agregados por dimensión. Es lo que conecta tu dashboard.

El flujo es: ingesta → bronze → transformación dbt → silver → agregación → gold → BI. dbt orquesta las transformaciones con tests y lineage automático.

## Comparativa 2026: Supabase vs AWS vs BigQuery para empresa mediana

| Criterio | Supabase Pro | AWS (S3+Athena+Glue) | BigQuery |
|---|---|---|---|
| Costo entry mensual | 25 USD | 50 a 150 USD | 0 + storage 20 USD/TB |
| Storage 1 TB | 100 USD/mes | 23 USD/mes | 20 USD/mes (active) |
| Compute base | 25 USD incluido | Pay-per-query | Pay-per-query |
| Implementación inicial | 12,000 a 25,000 USD | 18,000 a 40,000 USD | 15,000 a 30,000 USD |
| Curva de equipo | Baja (Postgres puro) | Alta | Media |
| Lock-in | Bajo | Alto | Medio |
| Total mensual 1 TB | 150 a 300 USD | 400 a 1,000 USD | 200 a 500 USD |
| Escalado más de 5 TB | Llega a límite | Excelente | Excelente |

## El caso real: migración 3.6 millones de filas en 48 horas

En una distribuidora cliente nuestra (control de plagas, 100 franquicias multi-país) implementamos data lake completo en Supabase con arquitectura Bronze/Silver/Gold:

- **Reto inicial**: 13 millones de filas legacy en SQL Server 2019 con 197 tablas inconsistentes, 10 años de datos desorganizados.
- **Stack**: Supabase Pro, Python 3.12, pymssql, PyArrow, parquet, dbt, BigQuery espejo.
- **Snapshot worker**: chunking 8 paralelo, batch 50K, throttle 10 queries por segundo, bronze parquet 2.7 GB subido a Supabase Storage.
- **Verificación triple**: source SQL Server = bronze parquet = silver views = gold materialized views.

Resultado:

- 3.6 millones de filas migradas a Supabase en 48 horas.
- 197 tablas snapshot legacy preservadas en bronze.
- 825 silver views, 75 gold materialized views.
- 73 gold tables finales normalizadas.
- 57 RLS policies y 17 roles RBAC.
- 1.17 TB en GCS como bronze parquet raw.
- 2,528 archivos en Storage bucket.

Inversión total del proyecto completo (no sólo data lake): 26,000 USD pago único en 12 semanas. La parte de data lake en sí cabe en el rango 12,000 a 18,000 USD si se cotiza por separado. Operación mensual: cerca de 150 USD en Supabase Pro más storage adicional.

## Cómo arrancar data lake en Supabase paso a paso

1. **Crear proyecto Supabase Pro**: 25 USD al mes, región us-east-1 o sa-east-1 (Brasil) para latencia LATAM.
2. **Definir esquemas**: `CREATE SCHEMA bronze; CREATE SCHEMA silver; CREATE SCHEMA gold;`. Roles separados para cada esquema (RBAC).
3. **Diseñar ingesta**: snapshot workers Python para sistemas legacy (SQL Server, MySQL), webhooks o Airbyte/Fivetran para SaaS (HubSpot, Stripe), uploads manuales para Excel/CSV.
4. **dbt para transformaciones**: proyecto dbt con `bronze` como source, `silver` como staging, `gold` como marts. Tests de unicidad, no nulos, referencias.
5. **Vistas materializadas en gold**: para KPIs ejecutivos con refresh programado (cada 5 min, cada hora, diario).
6. **Conectar BI**: Metabase, Power BI o dashboard a medida sobre gold. RLS si necesitás multi-tenant por usuario.
7. **Monitoreo**: Supabase logs, métricas de query performance, alertas en degradación.

## ¿Cuándo dejar Supabase y migrar a BigQuery o Snowflake?

Llegás al límite de Supabase como data lake cuando:

- Pasás los 5 TB con queries analíticas pesadas (JOINs sobre 100M filas).
- Tu BI tarda más de 5 segundos en queries con cache caliente.
- Necesitás columnar storage o particionamiento específico.
- Tu equipo de datos quiere features de warehouse moderno (time travel, zero-copy clones).

Para una empresa mediana colombiana típica, ese punto no llega antes de 3 años de crecimiento serio. Hasta entonces, Supabase entrega.

## Próximos pasos

Si tenés data en 5 sistemas o más sin unificar, arrancá con un workshop de 1 día sobre la arquitectura Bronze/Silver/Gold y diseñá el blueprint. Si ya tenés data lake pero rendimiento o costo te preocupa, podemos hacer auditoría. Si querés data lake como parte de transformación operativa completa, agendá una llamada de 30 minutos sobre tu operación.

- [MAGIA Core](https://catalizadora.ai/magia/core) si querés data lake unificado más sistema a medida en 12 semanas, código a tu nombre.
- [MAGIA Forge](https://catalizadora.ai/magia/forge) si tu operación requiere multi-tenant con IA y guardrails sobre data lake.

Sin retainers, sin licencias atadas, código a tu nombre.
## Preguntas frecuentes

### ¿Supabase sirve para un data lake real o sólo para apps web?

Supabase sirve para data lake hasta volúmenes de 1 a 5 TB con queries moderadas. Es Postgres puro con storage S3-compatible y compute escalable. Para una empresa mediana colombiana con 100 GB a 2 TB, sale más simple y económico que AWS o BigQuery. Pasado 5 TB con queries pesadas, BigQuery o Snowflake ganan.

### ¿Cuánto cuesta operar un data lake en Supabase para empresa mediana?

Supabase Pro arranca en 25 USD al mes con 8 GB Postgres y 100 GB de storage S3 incluidos. Para 1 TB total entre Postgres y Storage, esperá pagar 150 a 300 USD al mes. Comparado con AWS equivalente (400 a 1,000 USD al mes), es 50 a 70 por ciento más barato.

### ¿Qué significa arquitectura Bronze, Silver, Gold en Supabase?

Bronze son datos crudos como llegan (esquema bronze en Postgres o parquet en Supabase Storage). Silver son datos normalizados y limpios (esquema silver con vistas). Gold son tablas de decisión listas para BI (esquema gold con vistas materializadas). El patrón se implementa con esquemas separados y dbt.

### ¿Cómo migro datos legacy de SQL Server a Supabase?

El patrón estable es: snapshot worker en Python con pymssql y PyArrow, chunking paralelo por PK range, parquet intermedio en Supabase Storage, carga a bronze, transformación a silver via dbt, gold con vistas materializadas. Una distribuidora cliente nuestra migró 3.6 millones de filas en 48 horas con verificación fila-a-fila.

### ¿Cuándo conviene Supabase sobre AWS o BigQuery para data lake?

Supabase gana para empresa mediana colombiana con 100 GB a 2 TB que ya conoce Postgres, quiere arranque rápido y simplicidad operativa. AWS gana en más de 10 TB con servicios ML avanzados. BigQuery gana cuando ya estás en Google Cloud o tu equipo tiene experiencia SQL columnar.


---

Source: https://catalizadora.ai/blog/data-lake-en-supabase-para-empresa-mediana-colombia
Author: Pablo Estrada — AI Catalyst, LLC (catalizadora.ai)
