MÓDULO 02

Modelos de
redes neuronales

Son el motor detrás de casi toda la IA moderna. Suenan complejas, pero la idea es bella: muchas operaciones simples conectadas que, juntas, aprenden a reconocer patrones. Vamos a abrirlas.

1 ¿Qué es una red neuronal?

Está inspirada (libremente) en el cerebro: unidades llamadas neuronas organizadas en capas. Cada neurona recibe números, los combina y pasa el resultado a la siguiente capa. La información fluye de la entrada (los datos) hacia la salida (la predicción).

Lo asombroso: nadie programa las reglas. Durante el entrenamiento la red ajusta sus conexiones (pesos) hasta que sus predicciones aciertan. Eso es "aprender".

2 Su anatomía: todo son capas

Una red se organiza en tres tipos de capa. Cambia su ancho (neuronas por capa) y su profundidad (número de capas ocultas) y observa cómo crece — y cuántos parámetros hay que ajustar.

Capa de entrada — recibe los datos (ej: 4 medidas de una flor)
Capas ocultas — procesan e interconectan la información
Capa de salida — entrega la predicción o clasificación
Capas ocultas (profundidad)2
Neuronas por capa (ancho)5
Neuronas ocultas
Parámetros
Deep Learning (3+ capas ocultas)
💡 Cada conexión y cada neurona aportan un parámetro que el entrenamiento debe ajustar. Por eso "crecer" la red —a lo ancho o en profundidad— dispara el número de parámetros a millones, y con ello la cantidad de datos que hace falta para entrenarla bien. A las redes con muchas capas ocultas las llamamos Deep Learning.

3 Ve la red "pensar"

Demo en vivo · mueve las entradas

Esta red decide si una estructura necesita inspección a partir de 3 datos. Cambia las entradas y observa cómo el "pensamiento" (los pulsos) recorre las capas y cambia el veredicto. Las conexiones teal suman, las naranja restan.

Vibración medida70%
Grietas visibles40%
Antigüedad60%
Salida de la red
💡 Cada número dentro de una neurona es su activación: qué tan "encendida" está. Al re-inicializar los pesos verás otra red "sin entrenar" que opina distinto — entrenar es justamente encontrar los pesos correctos.

4 Una neurona por dentro

Demo en vivo · ajusta pesos y sesgo

Toda red se construye con esta pieza diminuta. Una neurona multiplica cada entrada por su peso, suma todo (más un sesgo) y pasa ese total Σ por una función de activación. Prueba las tres funciones: el gráfico muestra su forma y un punto marca dónde cae tu Σ — esa es la salida.

Entradas
x₁0.8
x₂0.5
x₃0.3
Pesos
w₁1.2
w₂-0.8
w₃0.6
sesgo (bias)-0.2
Activación

Suma (Σ)
Salida
💡 La función de activación es la chispa no-lineal: sin ella, apilar neuronas daría siempre una simple recta. Gracias a ella, las redes pueden aprender patrones curvos y complejos como el rostro de una grieta.
¿Cómo se lee la salida? Es la activación: qué tan "encendida" queda la neurona. Si está en una capa oculta, ese número se pasa como entrada a las neuronas de la capa siguiente. Si está en la capa de salida, es la respuesta final del modelo — por ejemplo, con sigmoide, un valor cercano a 1 se lee como "sí" (alta probabilidad) y cercano a 0 como "no".

5 ¿Por qué se volvieron tan poderosas justo ahora?

La idea no es nueva. Lo que cambió fue el poder de cómputo. Recórrela en el tiempo:

1950s
Nace la idea. El concepto de neurona artificial es simple y aparece a mediados del siglo XX. Pero apenas hay con qué calcularlo.
1980s
Se formaliza la matemática. Se desarrolla la teoría moderna de redes neuronales: cómo ajustar los pesos de forma sistemática.
1990s
Aparecen las GPUs. Pensadas para videojuegos, resultan ideales para redes: hacen muchísimos cálculos simples en paralelo.
Hoy
Crecimiento exponencial. Con datos y GPUs abundantes, entrenar redes enormes (Deep Learning) se vuelve práctico.

CPU vs. GPU: ¿por qué importa?

Una red hace millones de multiplicaciones independientes. La CPU es como un genio que resuelve una a una; la GPU, como un ejército que resuelve filas enteras a la vez. Lánzalos a competir:

CPU···
GPU···
GPU más rápida

Misma cantidad de operaciones en ambos. La GPU no es "mejor": simplemente las reparte en paralelo.

💡 Las CPU tradicionales ejecutan cálculos complejos de forma secuencial; las GPU ejecutan miles de cálculos simples en paralelo. Como una red neuronal es justo eso —operaciones simples y masivas—, las GPU dispararon su crecimiento.

6 No todas las redes son iguales

Según la tarea, se usan arquitecturas distintas. Toca para ver dónde brilla cada una.

Convolucionales (CNN)

Especialistas en imágenes. Detectan bordes, texturas y formas. Son las que reconocen una grieta en una foto de concreto. visión por computador

Recurrentes (RNN / LSTM)

Tienen "memoria". Ideales para series de tiempo: las vibraciones de un sensor a lo largo de horas o días. secuencias

Transformers

La arquitectura detrás de los modelos de lenguaje actuales. Procesan todo en paralelo y "prestan atención" a lo relevante. lenguaje · más

Comprueba lo aprendido

¿Qué ajusta una red neuronal durante el entrenamiento para mejorar sus predicciones?
Exacto: entrenar = encontrar los pesos que hacen acertar a la red.
¿Para qué sirve la función de activación dentro de una neurona?
Correcto: sin activación, la red entera colapsaría en una simple recta.
Quieres detectar grietas en fotos de concreto. ¿Qué arquitectura encaja mejor?
Sí: las CNN son las especialistas en imágenes.