03 · Entrena tu primer modelo

1 El problema: 4 medidas, 3 especies

El dataset Iris es el "hola mundo" del Machine Learning. De cada flor se miden 4 características (las features) y se quiere predecir a cuál de 3 especies pertenece.

Entradas — 4 medidas (cm)

X₁ Largo del sépalo

X₂ Ancho del sépalo

X₃ Largo del pétalo

X₄ Ancho del pétalo

Salida — 1 de 3 especies

Setosa

Versicolor

Virginica

Para entrenarlo, primero unos expertos etiquetan muchas flores ya medidas: ese es el aprendizaje supervisado del Módulo 01. El modelo aprende qué combinaciones de medidas distinguen cada especie.

2 Clasifica una flor tú mismo

Demo en vivo · mueve las medidas

Esta es una red 4-8-3: 4 neuronas de entrada, 8 ocultas y 3 de salida (una por especie). Mueve las medidas y observa la capa de salida: la red empuja la neurona correcta hacia 1 y las otras hacia 0. El pétalo es la pista más decisiva — pruébalo.

Largo del sépalo5.1 cm

Ancho del sépalo3.5 cm

Largo del pétalo1.4 cm

Ancho del pétalo0.2 cm

Setosa

—

Versicolor

—

Virginica

—

💡 Las 3 salidas suman 100%: el modelo reparte su "confianza" entre las especies. Entrenar fue, precisamente, ajustar los pesos para que la neurona correcta se acerque a 1 y las demás a 0 en miles de flores de ejemplo.

3 Cómo se entrena, paso a paso

Toca cada paso. El 90% del trabajo real no es la red: es preparar bien los datos.

1

Construir la base de datos

Se mide cada flor y se arma una matriz de entrada con todas las variables (X₁, X₂, X₃, X₄), junto a la salida conocida (la especie) que etiquetan los expertos. esto es lo más importante

2

Dividir los datos

Se separan en entrenamiento (para aprender), prueba (para evaluar sin trampa) y a veces validación (para afinar). Y se normalizan para que todas las medidas pesen parejo. train / test / val

3

Ajustar los pesos (minimizar el error)

El modelo predice, mide qué tan lejos quedó de la respuesta correcta y ajusta sus pesos para reducir ese error. Repite millones de veces hasta que la neurona correcta tiende a 1 y las demás a 0.

4

Quitar variables redundantes

Si dos variables dicen casi lo mismo (son colineales), conviene eliminar una: simplifica el modelo sin perder información. colinealidad

5

Cuidar la generalización

Un modelo puede acertar con sus datos pero fallar fuera del rango con el que aprendió. El nº de capas y de neuronas son hiperparámetros: se encuentran experimentando.

4 ¿Con qué se programa?

La buena noticia: las librerías ya traen toda la matemática. Solo defines la arquitectura y los datos.

Python

Hoy la opción más popular. Librerías completas (TensorFlow, PyTorch, scikit-learn) que incluyen toda la matemática necesaria.

Matlab

Antes más rígido; hoy bastante versátil para prototipar y visualizar modelos.

modelo_iris.py

# Una red 4-8-3 en pocas líneas
model = Sequential([
  Dense(8, activation="relu", input_shape=(4,)),   # 4 medidas → 8 neuronas ocultas
  Dense(3, activation="softmax"),               # → 3 especies
])
model.compile(loss="categorical_crossentropy", optimizer="adam")
model.fit(X_train, y_train, epochs=100)     # ← aquí ajusta los pesos

5 Lo que de verdad importa

Lo más decisivo no es la red, sino definir claramente qué quieres predecir y construir la base de datos adecuada para ello. El resto es experimentar.

El mismo flujo de las flores se aplica a la ingeniería. Para predecir la resistencia de un material, las features dejan de ser pétalos y pasan a ser geometría, resistencia de los materiales, cantidad de hierro o tipo de hormigón:

Entradas — propiedades de la mezcla

X₁ Geometría

X₂ Cantidad de hierro

X₃ Tipo de hormigón

X₄ …más variables

Salida — un número

Resistencia estimada

El modelo puede revelar factores no obvios (p. ej. la importancia del manganeso) y dar ventaja competitiva al predecir antes de construir.

✓ Comprueba lo aprendido

En la red 4-8-3 de las flores, ¿qué representan el 4 y el 3?

Exacto: 4 features de entrada, 8 neuronas ocultas y 3 salidas (una por especie).

¿Por qué dividimos los datos en entrenamiento y prueba?

Correcto: si lo evaluáramos con los mismos datos de entrenamiento, no sabríamos si generaliza.

Según la clase, ¿qué es lo más importante de todo el proceso?

Sí: sin un objetivo claro y buenos datos, ninguna arquitectura sofisticada salva el modelo.