IBM
diff --git a/‎AutoTS/Project.toml‎
Lines changed: 4 additions & 0 deletions b/‎AutoTS/Project.toml‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎AutoTS/src/AutoTS.jl‎
Lines changed: 14 additions & 0 deletions b/‎AutoTS/src/AutoTS.jl‎
Lines changed: 14 additions & 0 deletions
diff --git a/‎AutoTS/src/automlflowtsprediction.jl‎
Lines changed: 155 additions & 0 deletions b/‎AutoTS/src/automlflowtsprediction.jl‎
Lines changed: 155 additions & 0 deletions
diff --git a/‎AutoTS/src/carettspredictor.jl‎
Lines changed: 154 additions & 0 deletions b/‎AutoTS/src/carettspredictor.jl‎
Lines changed: 154 additions & 0 deletions
@@ -0,0 +1,4 @@
+name = "AutoTS"
+uuid = "9f9003ca-5fd1-4e14-9a26-1226c8bf687b"
+version = "0.1.0"
+authors = ["Paulito Palmes, PhD <[email protected]>"]
@@ -0,0 +1,14 @@
+module AutoTS
+
+greet() = print("Hello World!")
+
+include("carettspredictor.jl")
+using .CaretTSPredictors
+export CaretTSPredictor, carettsdriver
+
+include("automlflowtsprediction.jl")
+using .AutoMLFlowTSPredictions
+export AutoMLFlowTSPrediction
+export mlftsdriver
+
+end # module AutoTS
@@ -0,0 +1,155 @@
+module AutoMLFlowTSPredictions
+
+using PDFmerger: append_pdf!
+using Plots
+using Statistics
+using Serialization
+import PythonCall
+const PYC = PythonCall
+using CSV
+
+using DataFrames: DataFrame
+using Random
+using ..AbsTypes
+using ..Utils
+using ..CaretTSPredictors
+
+import ..AbsTypes: fit, fit!, transform, transform!
+export fit, fit!, transform, transform!
+export mlftsdriver, AutoMLFlowTSPrediction
+
+const MLF = PYC.pynew()
+const REQ = PYC.pynew()
+
+function __init__()
+  PYC.pycopy!(MLF, PYC.pyimport("mlflow"))
+  PYC.pycopy!(REQ, PYC.pyimport("requests"))
+end
+
+include("./mlflowutils.jl")
+
+mutable struct AutoMLFlowTSPrediction <: Workflow
+  name::String
+  model::Dict{Symbol,Any}
+
+  function AutoMLFlowTSPrediction(args=Dict())
+    default_args = Dict(
+      :name => "AutoTSPredictions",
+      :projectname => "AutoTSPredictions",
+      :url => "http://localhost:8080",
+      :description => "Automated Timeseries Prediction",
+      :projecttype => "tsprediction",
+      :artifact_name => "AutoTSPredictionModel.bin",
+      :impl_args => Dict(
+        :name => "autots",
+        :learner=>"auto",
+        :forecast_horizon=>10
+      )
+    )
+    cargs = nested_dict_merge(default_args, args)
+    initmlflowcargs!(cargs)
+    cargs[:automodel] = CaretTSPredictor(cargs[:impl_args])
+    new(cargs[:name], cargs)
+  end
+end
+
+function AutoMLFlowTSPrediction(name::String, args::Dict)
+  AutoMLFlowTSPrediction(Dict(:name => name, args...))
+end
+
+function AutoMLFlowTSPrediction(name::String; args...)
+  AutoMLFlowTSPrediction(Dict(Dict(pairs(args))...))
+end
+
+function (obj::AutoMLFlowTSPrediction)(; args...)
+  model = obj.model
+  cargs = nested_dict_merge(model, Dict(pairs(args)))
+  obj.model = cargs
+  return obj
+end
+
+function fit!(mlfas::AutoMLFlowTSPrediction, X::DataFrame, Y::Vector=[])::Nothing
+  # start experiment run
+  setupautofit!(mlfas)
+  # automate prediction
+  autots = mlfas.model[:automodel]
+  tsoutput = fit_transform!(autots, X, Y)
+  # save model in memory
+  mlfas.model[:automodel] = autots
+  # log info to mlflow
+  MLF.log_param("TSOutput", tsoutput)
+  MLF.log_metric("ForecastHorizon", autots.model[:forecast_horizon])
+  # log artifacts and end experiment run
+  logmlartifact(mlfas)
+  return nothing
+end
+
+function fit(mlfas::AutoMLFlowTSPrediction, X::DataFrame, Y::Vector=[])::Nothing
+  mlfcopy = deepcopy(mlfas)
+  fit!(mlfcopy, X, Y)
+  return mlfcopy
+end
+
+function plottroutput(mlfas::AutoMLFlowTSPrediction, Y::Union{Vector,DataFrame})
+  data = Y
+  votepercent = mlfas.model[:automodel].model[:votepercent]
+  tmpdir = tempdir()
+  println(tmpdir)
+  artifact_plot = joinpath(tmpdir, "plots.pdf")
+  artifact_allplots = joinpath(tmpdir, "allplots.pdf")
+  rm(artifact_allplots, force=true)
+  if votepercent == 0.0
+    for ndx in 0.1:0.1:1.0
+      strndx = string(ndx)
+      coldata = data[:, strndx]
+      ndx = findall(x -> x == true, coldata)
+      Plots.plot(data[:,1], label="tsdata", title="TS Prediction")
+      xlabel!("X")
+      ylabel!("Y")
+      plp = scatter!(ndx, data[:,1][ndx], label="prediction")
+      savefig(plp, artifact_plot)
+      append_pdf!(artifact_allplots, artifact_plot, cleanup=true)
+    end
+  else
+    strndx = string(votepercent)
+    coldata = data[:, strndx]
+    ndx = findall(x -> x == true, coldata)
+    Plots.plot(data[:,1], label="tsdata", title="TS Prediction")
+    xlabel!("X")
+    ylabel!("Y")
+    scatter!(ndx, data[:,1][ndx], label="prediction")
+    savefig(artifact_allplots)
+  end
+  MLF.log_artifact(artifact_allplots)
+end
+
+function transform!(mlfas::AutoMLFlowTSPrediction, X::DataFrame)
+  # start experiment run
+  Y = autotransform!(mlfas, X)
+  # create plots and save them as mlfow artifacts
+  # plottroutput(mlfas, Y)
+  # end run
+  MLF.end_run()
+  return Y
+end
+
+function transform(mlfas::AutoMLFlowTSPrediction, X::DataFrame)
+  mlfasc = deepcopy(mlfas)
+  return transform!(mlfasc, X)
+end
+
+function mlftsdriver()
+  url = "http://mlflow.home"
+  url = "http://mlflow.isiath.duckdns.org:8082"
+  url = "http://localhost:8081"
+
+  X = CSV.read("./data/node_cpu_ratio_rate_5m_1d_1m.csv",DataFrame;header=false)
+
+  #X = vcat(5 * cos.(-10:10), sin.(-30:30), 3 * cos.(-10:10), 2 * tan.(-10:10), sin.(-30:30)) |> x -> DataFrame([x], :auto)
+
+  mlfas = AutoMLFlowTSPrediction(Dict(:url => url))
+  pred=fit_transform!(mlfas, X)
+  return pred
+end
+
+end
@@ -0,0 +1,154 @@
+module CaretTSPredictors
+
+using Distributed
+import PythonCall
+const PYC = PythonCall
+
+# standard included modules
+using DataFrames: DataFrame
+using Random
+using ..AbsTypes
+using ..Utils
+
+import ..AbsTypes: fit, fit!, transform, transform!
+export fit, fit!, transform, transform!
+export CaretTSPredictor, carettspredictors
+export carettsdriver
+
+function carettspredictors()
+  println("Use available learners:")
+  [print(learner, " ") for learner in keys(carettspredictor_dict)]
+  println()
+end
+
+const CTS = PYC.pynew()
+const PD = PYC.pynew()
+
+function __init__()
+  PYC.pycopy!(CTS, PYC.pyimport("pycaret.time_series"))
+  PYC.pycopy!(PD, PYC.pyimport("pandas"))
+end
+
+const carettspredictor_dict = Dict{String,PYC.Py}(
+  "exp_smooth" => CTS, "ets" => CTS, "arima" => CTS,
+  "auto_arima" => CTS, "theta" => CTS,
+  "huber_cds_dt" => CTS, "knn_cds_dt" => CTS,
+  "lr_cds_dt" => CTS, "ridge_cds_dt" => CTS, "br_cds_dt" => CTS,
+  "en_cds_dt" => CTS, "lasso_cds_dt" => CTS, "et_cds_dt" => CTS,
+  "rf_cds_dt" => CTS, "dt_cds_dt" => CTS, "lightgbm_cds_dt" => CTS,
+  "ada_cds_dt" => CTS, "omp_cds_dt" => CTS, "gbr_cds_dt" => CTS,
+  "llar_cds_dt" => CTS, "naive" => CTS,
+  "polytrend" => CTS, "croston" => CTS, "grand_means" => CTS,
+  "bats" => CTS, "tbats" => CTS
+  #"snaive","stlf","prophet","catboost_cds_dt"
+
+)
+
+const carettsexp_dict = Dict{String,PYC.Py}()
+carettsexp_dict["TSForecastingExperiment"] = CTS
+
+
+mutable struct CaretTSPredictor <: Learner
+  name::String
+  model::Dict{Symbol,Any}
+  function CaretTSPredictor(args=Dict())
+    default_args = Dict(
+      :name => "caretts",
+      :verbose => false,
+      :learner => "auto",
+      :experiment => "TSForecastingExperiment",
+      :output => "forecast",
+      :forecast_horizon => 10,
+      :impl_args => Dict{Symbol,Any}()
+    )
+    cargs = nested_dict_merge(default_args, args)
+    cargs[:name] = cargs[:name] * "_" * randstring(3)
+    skl = cargs[:learner]
+    if skl != "auto" && !(skl in keys(carettspredictor_dict))
+      println("$skl is not supported.")
+      println()
+      carettspredictors()
+      error("Argument keyword error")
+    end
+    new(cargs[:name], cargs)
+  end
+end
+
+function CaretTSPredictor(learner::String, args::Dict)
+  CaretTSPredictor(Dict(:learner => learner, :name => learner, args...))
+end
+
+function CaretTSPredictor(learner::String; args...)
+  CaretTSPredictor(Dict(:learner => learner, :name => learner, :impl_args => Dict(pairs(args))))
+end
+
+function fit!(adl::CaretTSPredictor, xx::DataFrame, ::Vector=[])::Nothing
+  xh = xx |> Array
+  py_dataframe = getproperty(PD, "DataFrame")
+  x = py_dataframe(xh)
+  impl_args = copy(adl.model[:impl_args])
+  expt = adl.model[:experiment]
+  learner = adl.model[:learner]
+  py_experiment = getproperty(carettsexp_dict[expt], expt)()
+  _verbose = adl.model[:verbose]
+  py_experiment.setup(x, session_id=123, verbose=_verbose)
+  if learner != "auto"
+    clearner = py_experiment.create_model(learner, verbose=_verbose)
+    @info "evaluating the model: $clearner"
+    finalmodel = py_experiment.finalize_model(clearner)
+    adl.model[:finalmodel] = finalmodel
+  else
+    best = py_experiment.compare_models(verbose=_verbose)
+    @info "evaluating the best model: $best"
+    finalmodel = py_experiment.finalize_model(best)
+    adl.model[:finalmodel] = finalmodel
+  end
+
+  # save experiment
+  #adl.model[:py_experiment] = py_experiment
+  return nothing
+end
+
+function transform!(adl::CaretTSPredictor, xx::DataFrame)
+  xh = deepcopy(xx) |> Array
+  py_dataframe = getproperty(PD, "DataFrame")
+  x = py_dataframe(xh)
+  learner = adl.model[:learner]
+  expt = adl.model[:experiment]
+  py_experiment = getproperty(carettsexp_dict[expt], expt)()
+  _verbose = adl.model[:verbose]
+  py_experiment.setup(x, session_id=123, verbose=_verbose)
+  forecast_horizon = adl.model[:forecast_horizon]
+  finalmodel = adl.model[:finalmodel]
+  res = py_experiment.predict_model(finalmodel, fh=forecast_horizon, verbose=_verbose)
+  finalres = res.y_pred |> PYC.PyArray |> Vector
+  return finalres
+end
+
+function carettsdriver()
+  DT = PYC.pyimport("pycaret.datasets")
+  PD = PYC.pyimport("pandas")
+  get_data = getproperty(DT, "get_data")
+  dftmp = get_data("airline") |> collect
+  dt=PYC.pyconvert.(Float64,dftmp)
+  df = DataFrame(x1=dt)
+  #df = rand(100, 1) |> x -> DataFrame(x, :auto)
+  #bmodel = CaretTSPredictor("auto_arima", Dict(:verbose => true,:forecast_horizon=>30))
+  bmodel = CaretTSPredictor("auto", Dict(:verbose => true,:forecast_horizon=>30))
+  bestres = fit_transform!(bmodel, df)
+  #tabres = @sync @distributed (hcat) for learner in ["ridge_cds_dt", "auto_arima", "ets", "rf_cds_dt"]
+  #  model = CaretTSPredictor(learner, Dict(:verbose => false))
+  #  res = fit_transform!(model, df)
+  #  DataFrame(learner => res)
+  #end
+  #@show hcat(tabres, DataFrame(:best => bestres))
+  #print(bmodel.model[:finalmodel])
+  #return nothing
+  #hcat(tabres, DataFrame(:best => bestres))
+  ndx1=1:length(df.x1)
+  ndx2=(length(ndx1)+1):length(ndx1)+length(bestres)
+  (ndx1,df.x1,ndx2,bestres)
+end
+
+end
+