02 · Modelos de redes neuronales

1 ¿Qué es una red neuronal?

Está inspirada (libremente) en el cerebro: unidades llamadas neuronas organizadas en capas. Cada neurona recibe números, los combina y pasa el resultado a la siguiente capa. La información fluye de la entrada (los datos) hacia la salida (la predicción).

Lo asombroso: nadie programa las reglas. Durante el entrenamiento la red ajusta sus conexiones (pesos) hasta que sus predicciones aciertan. Eso es "aprender".

2 Su anatomía: todo son capas

Una red se organiza en tres tipos de capa. Cambia su ancho (neuronas por capa) y su profundidad (número de capas ocultas) y observa cómo crece — y cuántos parámetros hay que ajustar.

Capa de entrada — recibe los datos (ej: 4 medidas de una flor)

Capas ocultas — procesan e interconectan la información

Capa de salida — entrega la predicción o clasificación

Capas ocultas (profundidad)2

Neuronas por capa (ancho)5

Neuronas ocultas—

Parámetros—

✦ Deep Learning (3+ capas ocultas)

💡 Cada conexión y cada neurona aportan un parámetro que el entrenamiento debe ajustar. Por eso "crecer" la red —a lo ancho o en profundidad— dispara el número de parámetros a millones, y con ello la cantidad de datos que hace falta para entrenarla bien. A las redes con muchas capas ocultas las llamamos Deep Learning.

3 Ve la red "pensar"

Demo en vivo · mueve las entradas

Esta red decide si una estructura necesita inspección a partir de 3 datos. Cambia las entradas y observa cómo el "pensamiento" (los pulsos) recorre las capas y cambia el veredicto. Las conexiones teal suman, las naranja restan.

Vibración medida70%

Grietas visibles40%

Antigüedad60%

Salida de la red —

💡 Cada número dentro de una neurona es su activación: qué tan "encendida" está. Al re-inicializar los pesos verás otra red "sin entrenar" que opina distinto — entrenar es justamente encontrar los pesos correctos.

4 Una neurona por dentro

Demo en vivo · ajusta pesos y sesgo

Toda red se construye con esta pieza diminuta. Una neurona multiplica cada entrada por su peso, suma todo (más un sesgo) y pasa ese total Σ por una función de activación. Prueba las tres funciones: el gráfico muestra su forma y un punto marca dónde cae tu Σ — esa es la salida.

Entradas

x₁0.8

x₂0.5

x₃0.3

Pesos

w₁1.2

w₂-0.8

w₃0.6

sesgo (bias)-0.2

Activación

Suma (Σ)—

Salida—

💡 La función de activación es la chispa no-lineal: sin ella, apilar neuronas daría siempre una simple recta. Gracias a ella, las redes pueden aprender patrones curvos y complejos como el rostro de una grieta.

¿Cómo se lee la salida? Es la activación: qué tan "encendida" queda la neurona. Si está en una capa oculta, ese número se pasa como entrada a las neuronas de la capa siguiente. Si está en la capa de salida, es la respuesta final del modelo — por ejemplo, con sigmoide, un valor cercano a 1 se lee como "sí" (alta probabilidad) y cercano a 0 como "no".

5 ¿Por qué se volvieron tan poderosas justo ahora?

La idea no es nueva. Lo que cambió fue el poder de cómputo. Recórrela en el tiempo:

1950s

Nace la idea. El concepto de neurona artificial es simple y aparece a mediados del siglo XX. Pero apenas hay con qué calcularlo.

1980s

Se formaliza la matemática. Se desarrolla la teoría moderna de redes neuronales: cómo ajustar los pesos de forma sistemática.

1990s

Aparecen las GPUs. Pensadas para videojuegos, resultan ideales para redes: hacen muchísimos cálculos simples en paralelo.

Hoy

Crecimiento exponencial. Con datos y GPUs abundantes, entrenar redes enormes (Deep Learning) se vuelve práctico.

CPU vs. GPU: ¿por qué importa?

Una red hace millones de multiplicaciones independientes. La CPU es como un genio que resuelve una a una; la GPU, como un ejército que resuelve filas enteras a la vez. Lánzalos a competir:

CPU···

GPU···

GPU más rápida—

Misma cantidad de operaciones en ambos. La GPU no es "mejor": simplemente las reparte en paralelo.

💡 Las CPU tradicionales ejecutan cálculos complejos de forma secuencial; las GPU ejecutan miles de cálculos simples en paralelo. Como una red neuronal es justo eso —operaciones simples y masivas—, las GPU dispararon su crecimiento.

6 No todas las redes son iguales

Según la tarea, se usan arquitecturas distintas. Toca para ver dónde brilla cada una.

▦

Convolucionales (CNN)

Especialistas en imágenes. Detectan bordes, texturas y formas. Son las que reconocen una grieta en una foto de concreto. visión por computador

↻

Recurrentes (RNN / LSTM)

Tienen "memoria". Ideales para series de tiempo: las vibraciones de un sensor a lo largo de horas o días. secuencias

✦

Transformers

La arquitectura detrás de los modelos de lenguaje actuales. Procesan todo en paralelo y "prestan atención" a lo relevante. lenguaje · más

✓ Comprueba lo aprendido

¿Qué ajusta una red neuronal durante el entrenamiento para mejorar sus predicciones?

Exacto: entrenar = encontrar los pesos que hacen acertar a la red.

¿Para qué sirve la función de activación dentro de una neurona?

Correcto: sin activación, la red entera colapsaría en una simple recta.

Quieres detectar grietas en fotos de concreto. ¿Qué arquitectura encaja mejor?

Sí: las CNN son las especialistas en imágenes.