¿Qué es la convolución de una imagen y para qué sirve?

La convolución es una operación que recorre cada píxel de la imagen y lo recalcula combinando su valor con el de sus vecinos según unos pesos. Esos pesos forman una pequeña matriz llamada kernel o máscara (aquí de 3×3). Según los valores del kernel, la misma operación puede desenfocar, enfocar, resaltar bordes o crear relieve. Es la base de los filtros de imagen, del postprocesado en videojuegos y de las redes neuronales convolucionales.

¿Qué es un kernel y qué hace cada preset (blur, sharpen, Sobel)?

Un kernel es la matriz de pesos que se aplica a cada vecindario de píxeles. Un kernel de desenfoque (blur) promedia los vecinos y suaviza la imagen; uno de enfoque (sharpen) resta los vecinos para realzar el detalle; el Laplaciano y los kernels de Sobel detectan bordes calculando diferencias de intensidad; el relieve (emboss) usa pesos opuestos en diagonal para simular luz lateral. Cambiando los 9 números cambias por completo el efecto.

¿Por qué hay que dividir o normalizar un kernel?

Cuando se suman los nueve pesos multiplicados por los píxeles, el resultado puede ser mayor que 255 o menor que 0. Para mantener el brillo medio se divide la suma entre un divisor, que normalmente es la suma de los pesos del kernel (por ejemplo 9 en un desenfoque de promedio). Si la suma de pesos es 0, como en los kernels de bordes, se usa divisor 1 y a veces se añade un desplazamiento para centrar el resultado en gris.

¿Qué relación tiene la convolución con las redes neuronales y la visión por computador?

Las redes neuronales convolucionales (CNN) usan exactamente esta operación: cada capa convolucional aplica muchos kernels a la imagen. La diferencia es que los pesos de esos kernels no se escriben a mano, sino que se aprenden durante el entrenamiento. Las primeras capas suelen aprender detectores de bordes y texturas muy parecidos a Sobel o al Laplaciano, y las capas más profundas combinan esas señales para reconocer objetos.

¿Cómo se tratan los bordes de la imagen al aplicar un kernel?

En los píxeles del borde, el kernel 3×3 se sale de la imagen porque no hay vecinos. Hay varias estrategias: rellenar con ceros, repetir el píxel más cercano (extensión o clamp) o reflejar la imagen. Este visualizador usa extensión por clamp: cuando una coordenada se sale, se limita al borde más próximo. Así se evitan marcos negros o artefactos en los bordes del resultado.

meskeIA

Visualizador de Convolución y Kernels

Edita un kernel 3×3 y mira cómo transforma la imagen al instante: la misma operación que usan los filtros de Photoshop, el postprocesado de videojuegos y las redes neuronales (CNN)

Términos de UsoTérminos|Política de PrivacidadPrivacidad|Contacto

1. Elige la imagen de muestra

La imagen se genera por código en el navegador (no se carga ningún archivo), por eso el resultado es siempre el mismo y se puede procesar píxel a píxel.

2. Aplica un filtro (preset)

3. Edita el kernel 3×3

Divisor automático (suma de pesos)

Divisor (normalización):

Desplazamiento (offset):

Suma de pesos: 1Divisor aplicado: 1Resta los vecinos para realzar el contraste local y los detalles.

Si la suma de pesos es 0 (filtros de bordes), el divisor automático usa 1. Para el relieve y los Sobel, un desplazamiento de 128 centra el resultado en gris para ver bordes en ambos sentidos.

4. Compara el antes y el después

Original

Resultado

El resultado se recalcula automáticamente cada vez que cambias un peso, el divisor o el preset. Los bordes de la imagen se tratan por extensión (se repite el píxel del borde).

Qué hace cada kernel

Kernel	Idea	Qué hace	Divisor típico
Identidad	Centro 1, vecinos 0	No cambia nada: útil como punto de partida	1
Desenfoque (box)	Promedio de los 9 píxeles	Suaviza, quita ruido y detalle fino	9 (suma de pesos)
Gaussiano	Más peso al centro	Desenfoque más natural, sin halos	16
Enfocar (sharpen)	Centro alto, vecinos negativos	Realza el detalle y el contraste local	1
Bordes (Laplaciano)	Suma de pesos = 0	Zonas planas a negro, bordes brillantes	1
Sobel H / V	Gradiente en una dirección	Detecta bordes horizontales o verticales	1 (+ offset 128)
Relieve (emboss)	Pesos opuestos en diagonal	Aspecto repujado con luz lateral	1 (+ offset 128)

Dónde se usa la convolución

Filtros de foto y Photoshop

Desenfocar, enfocar, perfilar o crear relieve son convoluciones. El menú «Filtro > Otros > A medida» de Photoshop es literalmente un editor de kernel como este.

💡 El «desenfoque gaussiano» que ves en todas partes es esta operación con un kernel en forma de campana.

Postprocesado en videojuegos

Efectos como el bloom, el desenfoque de movimiento o el contorno de objetos (outline) se implementan en shaders aplicando kernels al fotograma renderizado.

💡 En shaders, la convolución se hace muestreando texeles vecinos: la misma ventana 3×3 de aquí, pero en la GPU.

Visión por computador

Detectar bordes y esquinas es el primer paso de muchos algoritmos: Sobel y el Laplaciano preparan la imagen para detectar contornos, líneas o seguir objetos.

💡 Suavizar con un gaussiano antes de buscar bordes reduce el ruido y mejora la detección (base del detector de Canny).

Redes neuronales (CNN)

Cada capa convolucional de una CNN aplica muchos kernels a la imagen. La diferencia es que sus pesos no se escriben a mano: se aprenden durante el entrenamiento.

💡 Las primeras capas de una CNN suelen aprender detectores de bordes muy parecidos a Sobel; las profundas reconocen objetos.

Preguntas frecuentes

¿Qué diferencia hay entre convolución y correlación cruzada?

En la convolución matemática estricta el kernel se voltea (se gira 180°) antes de aplicarlo; en la correlación cruzada no. En procesamiento de imágenes y en las CNN casi siempre se usa la correlación cruzada y se la llama «convolución» por costumbre. Para kernels simétricos, como el desenfoque, el resultado es idéntico.

💡 Este visualizador usa la correlación cruzada, la convención habitual en visión por computador y aprendizaje profundo.

¿Por qué algunos filtros oscurecen o aclaran toda la imagen?

El brillo medio cambia según la suma de los pesos. Si suman más de 1 (sin normalizar), la imagen se aclara; si suman menos, se oscurece. Por eso se divide por la suma de pesos: para conservar el brillo. En los filtros de bordes la suma es 0, así que las zonas planas quedan negras y solo brillan los cambios.

💡 Activa el «divisor automático» y compara: sin normalizar, un box blur de pesos 1 dispara el brillo.

¿Para qué sirve el desplazamiento (offset)?

Los filtros de bordes y de relieve producen valores positivos y negativos. Como un píxel no puede ser negativo, los valores por debajo de 0 se recortarían a negro y se perdería información. Sumar 128 desplaza el cero a gris medio, de modo que se ven los cambios en ambos sentidos.

💡 Por eso un Sobel con offset se ve gris con bordes claros y oscuros, en lugar de casi todo negro.

¿Qué pasa en los bordes de la imagen?

En el primer y último píxel el kernel 3×3 se sale de la imagen. Hay que decidir qué valor tienen esos vecinos inexistentes: rellenar con ceros, repetir el píxel del borde (extensión) o reflejar. Esta herramienta repite el píxel del borde, lo que evita marcos negros artificiales.

💡 En las CNN, rellenar con ceros (zero padding) es lo más común porque permite controlar el tamaño de salida.

¿Por qué la convolución es la base de las CNN?

Una capa convolucional no es más que aplicar kernels a la imagen, igual que aquí. La clave es que un mismo kernel se reutiliza en toda la imagen (comparte pesos), así que detecta el mismo patrón aparezca donde aparezca. Esa eficiencia es lo que hizo posible la visión por computador moderna.

💡 Entender un kernel 3×3 a mano es entender qué hace cada filtro de una red neuronal por dentro.

¿Cómo afecta el tamaño del kernel?

Aquí trabajamos con 3×3, el tamaño más común. Kernels mayores (5×5, 7×7) abarcan más vecindario: desenfocan más o detectan estructuras más grandes, pero cuestan más cálculo. Muchos efectos potentes se logran encadenando varios kernels pequeños en lugar de uno grande.

💡 Dos desenfoques 3×3 seguidos equivalen aproximadamente a uno 5×5, y son más baratos de calcular.

Cómo se calcula un píxel de salida

Centra la ventana 3×3 en el píxel

Para calcular el píxel de salida (x, y), mira ese píxel y sus 8 vecinos: una ventana de 3×3 centrada en él.

Multiplica cada vecino por su peso

Empareja cada uno de los 9 píxeles de la ventana con el peso del kernel en esa posición y multiplícalos. Se hace por separado en cada canal de color (R, G y B).

Suma los 9 productos

Suma esos nueve resultados. Esa suma es el valor «crudo» del nuevo píxel antes de ajustar el brillo.

Divide y suma el offset

Divide entre el divisor (normalmente la suma de pesos) para conservar el brillo y suma el desplazamiento si lo hay.

Recorta a [0, 255] y repite

Limita el valor final entre 0 y 255 y guárdalo. Repite el proceso para todos los píxeles de la imagen.

Consejos para experimentar

Empieza por la identidad

Con un 1 en el centro y ceros alrededor la imagen no cambia. Mueve un peso y observa el efecto para entender cada posición.

Normaliza para conservar el brillo

Si los pesos suman más de 1, divide entre su suma. Activa el divisor automático y verás cómo se mantiene la luminosidad.

Usa offset para los bordes

En filtros con valores negativos (Sobel, relieve) suma 128 para no perder los valores por debajo de cero al recortar.

Compara las dos escenas

El tablero y las ondas tienen muchos bordes rectos y curvos: ideal para ver qué hacen Sobel y el Laplaciano.

Exagera el sharpen con cuidado

Subir el centro y bajar los vecinos enfoca más, pero en exceso aparecen halos y se amplifica el ruido.

Piensa en CNN

Cada kernel que diseñas a mano es un «filtro» como los que una red neuronal aprende sola al entrenarse.

Errores frecuentes al aplicar kernels

No normalizar: olvidar dividir entre la suma de pesos aclara u oscurece toda la imagen.
Ignorar los bordes: dejar los píxeles del contorno sin tratar produce marcos negros o ruido.
No recortar a [0, 255]: los valores fuera de rango dan colores erróneos o desbordes.
Olvidar el offset en filtros con pesos negativos: los valores negativos se pierden a negro.
Aplicar el kernel sobre la imagen ya modificada en vez de sobre una copia: corrompe el cálculo.
Procesar el canal alfa como si fuera color: hay que dejar la transparencia intacta.

🔗Apps relacionadas

🎨Espacios de ColorRGB, HSV, HSL y HEX 🧠Redes NeuronalesLa convolución en las CNN 🏔️Ruido PerlinTexturas procedurales 💡Iluminación (Phong)Gráficos y render

meskeIA

Cargando aplicación...

Preparando tu experiencia meskeIA

meskeIA

Visualizador de Convolución y Kernels

Edita un kernel 3×3 y mira cómo transforma la imagen al instante: la misma operación que usan los filtros de Photoshop, el postprocesado de videojuegos y las redes neuronales (CNN)

Términos de UsoTérminos|Política de PrivacidadPrivacidad|Contacto

1. Elige la imagen de muestra

La imagen se genera por código en el navegador (no se carga ningún archivo), por eso el resultado es siempre el mismo y se puede procesar píxel a píxel.

2. Aplica un filtro (preset)

3. Edita el kernel 3×3

Divisor automático (suma de pesos)

Divisor (normalización):

Desplazamiento (offset):

Suma de pesos: 1Divisor aplicado: 1Resta los vecinos para realzar el contraste local y los detalles.

Si la suma de pesos es 0 (filtros de bordes), el divisor automático usa 1. Para el relieve y los Sobel, un desplazamiento de 128 centra el resultado en gris para ver bordes en ambos sentidos.

4. Compara el antes y el después

Original

Resultado

El resultado se recalcula automáticamente cada vez que cambias un peso, el divisor o el preset. Los bordes de la imagen se tratan por extensión (se repite el píxel del borde).