Dilema-do-Prisioneiro/ProcessarResultados.py at main · KSalmaze/Dilema-do-Prisioneiro · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
import json
import pandas as pd
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split
# Tem q testar o modelo


def processar_resultados():
    # Carregar dados de um arquivo JSON
    with open('output/tournament_results.json', 'r') as file:
        data = json.load(file)

    all_data = []
    for noise_level, entries in data.items():
        for entry in entries:
            rates = {
                "Cooperation_rating": entry["Cooperation_rating"],
                "Initial_C_rate": entry["Initial_C_rate"],
                "CC_rate": entry["CC_rate"],
                "CD_rate": entry["CD_rate"],
                "DC_rate": entry["DC_rate"],
                "DD_rate": entry["DD_rate"],
                "CC_to_C_rate": entry["CC_to_C_rate"],
                "CD_to_C_rate": entry["CD_to_C_rate"],
                "DC_to_C_rate": entry["DC_to_C_rate"],
                "DD_to_C_rate": entry["DD_to_C_rate"],
                "Median_score": entry["Median_score"]
            }
            all_data.append(rates)

    # Converter dados em um DataFrame do Pandas
    df = pd.DataFrame(all_data)

    # Separar características (features) e resultado (target)
    x = df.drop(columns=["Median_score"])
    y = df["Median_score"]

    # Dividir os dados em conjuntos de treino e teste
    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=42)

    # Treinar o modelo de árvore de decisão
    # Treinar o modelo
    arvore = DecisionTreeRegressor(random_state=42)
    arvore.fit(x_train, y_train)

    # Fazer previsões no conjunto de teste
    y_pred = arvore.predict(x_test)

    # Calcular o erro quadrático médio
    mse = mean_squared_error(y_test, y_pred)
    print(f'Mean Squared Error: {mse}')

    # Identificar as features mais importantes
    features_importancia = arvore.feature_importances_
    features_nome = x.columns

    exibir_importancias(features_nome, features_importancia)


def exibir_importancias(nomes, importancia):

    data_frame = pd.DataFrame({'Feature': nomes, 'Importancia': importancia})
    data_frame = data_frame.sort_values(by='Importancia', ascending=False)

    print(data_frame)


if __name__ == "__main__":
    processar_resultados()