Skip to content

Commit a455c4e

Browse files
committed
fix mermaid graph
1 parent bb29661 commit a455c4e

File tree

1 file changed

+20
-20
lines changed

1 file changed

+20
-20
lines changed

_posts/2025-01-12-algoritmos-de-aprendizaje-por-refuerzo-fundamentos-aplicaciones-y-ejemplos.md

Lines changed: 20 additions & 20 deletions
Original file line numberDiff line numberDiff line change
@@ -1,17 +1,17 @@
11
---
22
title: 'Algoritmos de Aprendizaje por Refuerzo: Fundamentos, Aplicaciones y Ejemplos'
3-
image: /assets/img/headers/algoritmos-ia-aprendizaje-por-refuerzo.png
3+
image: "/assets/img/headers/algoritmos-ia-aprendizaje-por-refuerzo.png"
44
mermaid: true
55
tags:
6-
- Inteligencia Artificial
7-
- Algoritmos
8-
- Aprendizaje por refuerzo
9-
- Q-Learning
10-
- DQN
11-
- Actor-Critic
6+
- Inteligencia Artificial
7+
- Algoritmos
8+
- Aprendizaje por refuerzo
9+
- Q-Learning
10+
- DQN
11+
- Actor-Critic
1212
categories:
13-
- Inteligencia Artificial
14-
- Algoritmos
13+
- Inteligencia Artificial
14+
- Algoritmos
1515
---
1616

1717
El **aprendizaje por refuerzo** es un paradigma del aprendizaje automático en el que un agente interactúa con su entorno para aprender a tomar decisiones que maximicen una recompensa acumulada. En este post, exploraremos qué son los algoritmos de aprendizaje por refuerzo, cómo funcionan, ejemplos de algoritmos y aplicaciones prácticas, acompañados de diagramas explicativos.
@@ -56,11 +56,11 @@ El **DQN** extiende el Q-Learning al utilizar redes neuronales para aproximar la
5656

5757
```mermaid
5858
graph LR
59-
A[Estado (Imagen/Vector)] --> B[Red Neuronal]
60-
B --> C[Estimación de Q-Valores]
61-
C --> D[Selección de Acción]
62-
D --> E[Ejecutar Acción y Recibir Recompensa]
63-
E --> F[Actualización de la Red]
59+
A["Estado (Imagen/Vector)"] --> B["Red Neuronal"]
60+
B --> C["Estimación de Q-Valores"]
61+
C --> D["Selección de Acción"]
62+
D --> E["Ejecutar Acción y Recibir Recompensa"]
63+
E --> F["Actualización de la Red"]
6464
```
6565

6666
**Explicación**:
@@ -96,12 +96,12 @@ El aprendizaje por refuerzo se ha aplicado en videojuegos, donde los agentes apr
9696
**Diagrama - Agente en Videojuego:**
9797

9898
```mermaid
99-
graph LR
100-
A[Estado del Juego] --> B[Agente (RL)]
101-
B --> C[Selección de Acción]
102-
C --> D[Ejecutar Acción]
103-
D --> E[Feedback y Recompensa]
104-
E --> B
99+
graph LR
100+
A["Estado del Juego"] --> B["Agente (RL)"]
101+
B --> C["Selección de Acción"]
102+
C --> D["Ejecutar Acción"]
103+
D --> E["Feedback y Recompensa"]
104+
E --> B
105105
```
106106

107107
#### 3.2. **Robótica y Control Autónomo**

0 commit comments

Comments
 (0)