Multiomics-Analytics-Group
diff --git a/‎.gitignore‎
Lines changed: 1 addition & 0 deletions b/‎.gitignore‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎report/helpers/utils.py‎
Lines changed: 213 additions & 0 deletions b/‎report/helpers/utils.py‎
Lines changed: 213 additions & 0 deletions
diff --git a/‎report/main.py‎
Lines changed: 21 additions & 14 deletions b/‎report/main.py‎
Lines changed: 21 additions & 14 deletions
diff --git a/‎report/metadata_manager.py‎
Lines changed: 30 additions & 7 deletions b/‎report/metadata_manager.py‎
Lines changed: 30 additions & 7 deletions
@@ -1,6 +1,7 @@
 # Byte-compiled / optimized / DLL files
 __pycache__/
 report/__pycache__/
+report/helpers/__pycache__/
 *.py[cod]
 *$py.class
 
 
@@ -0,0 +1,213 @@
+import os
+import sys
+from datetime import datetime
+import logging
+
+## CHECKS
+def assert_path(filepath: str):
+    """
+    Checks that fpath is a string and that it exists
+
+    PARAMS
+    -----
+    - filepath (str): the filepath or folderpath
+
+    OUTPUTS
+    -----
+    - raises assertion error if filepath is not a string or doesn't exist
+    """
+
+    assert isinstance(filepath, str), f"filepath must be a string: {filepath}"
+    assert os.path.exists(
+        os.path.abspath(filepath)
+    ), f"filepath does not exist: {os.path.abspath(filepath)}"
+
+
+## LOGGING
+def get_basename(fname: None | str = None) -> str:
+    """
+    - For a given filename, returns basename WITHOUT file extension
+    - If no fname given (i.e., None) then return basename that the function is called in
+
+    PARAMS
+    -----
+    - fname (None or str): the filename to get basename of, or None
+
+    OUTPUTS
+    -----
+    - basename of given filepath or the current file the function is executed
+
+    EXAMPLES
+    -----
+    1)
+    >>> get_basename()
+    utils
+
+    2)
+    >>> get_basename('this/is-a-filepath.csv')
+    is-a-filepath
+    """
+    if fname is not None:
+        # PRECONDITION
+        assert_path(fname)
+        # MAIN FUNCTIONS
+        return os.path.splitext(os.path.basename(fname))[0]
+    else:
+        return os.path.splitext(os.path.basename(sys.argv[0]))[0]
+
+
+def get_time(incl_time: bool = True, incl_timezone: bool = True) -> str:
+    """
+    Gets current date, time (optional) and timezone (optional) for file naming
+
+    PARAMETERS
+    -----
+    - incl_time (bool): whether to include timestamp in the string
+    - incl_timezone (bool): whether to include the timezone in the string
+
+    RETURNS
+    -----
+    - fname (str): includes date, timestamp and/or timezone
+        connected by '_' in one string e.g. yyyyMMdd_hhmm_timezone
+
+    EXAMPLES
+    -----
+    1)
+    >>> get_time()
+    '20231019_101758_CEST'
+
+    2)
+    >>> get_time(incl_time=False)
+    '20231019_CEST'
+
+    """
+
+    # PRECONDITIONALS
+    assert isinstance(incl_time, bool), "incl_time must be True or False"
+    assert isinstance(incl_timezone, bool), "incl_timezone must be True or False"
+
+    # MAIN FUNCTION
+    # getting current time and timezone
+    the_time = datetime.now()
+    timezone = datetime.now().astimezone().tzname()
+    # convert date parts to string
+    y = str(the_time.year)
+    M = str(the_time.month)
+    d = str(the_time.day)
+    h = str(the_time.hour)
+    m = str(the_time.minute)
+    s = str(the_time.second)
+    # putting date parts into one string
+    if incl_time and incl_timezone:
+        fname = "_".join([y + M + d, h + m + s, timezone])
+    elif incl_time:
+        fname = "_".join([y + M + d, h + m + s])
+    elif incl_timezone:
+        fname = "_".join([y + M + d, timezone])
+    else:
+        fname = y + M + d
+
+    # POSTCONDITIONALS
+    parts = fname.split("_")
+    if incl_time and incl_timezone:
+        assert len(parts) == 3, f"time and/or timezone inclusion issue: {fname}"
+    elif incl_time or incl_timezone:
+        assert len(parts) == 2, f"time/timezone inclusion issue: {fname}"
+    else:
+        assert len(parts) == 1, f"time/timezone inclusion issue: {fname}"
+
+    return fname
+
+
+def generate_log_filename(folder: str = "logs", suffix: str = "") -> str:
+    """
+    Creates log file name and path
+
+    PARAMETERS
+    -----
+    folder (str): name of the folder to put the log file in
+    suffix (str): anything else you want to add to the log file name
+
+    RETURNS
+    -----
+    log_filepath (str): the file path to the log file
+    """
+    # PRECONDITIONS
+    assert_path(folder)
+
+    # MAIN FUNCTION
+    log_filename = get_time(incl_timezone=False) + "_" + suffix + ".log"
+    log_filepath = os.path.join(folder, log_filename)
+
+    return log_filepath
+
+
+def init_log(filename: str, display: bool = False, logger_id: str | None = None):
+    """
+    - Custom python logger configuration (basicConfig())
+        with two handlers (for stdout and for file)
+    - from: https://stackoverflow.com/a/44760039
+    - Keeps a log record file of the python application, with option to
+        display in stdout
+
+    PARAMETERS
+    -----
+    - filename (str): filepath to log record file
+    - display (bool): whether to print the logs to whatever standard output
+    - logger_id (str): an optional identifier for yourself,
+        if None then defaults to 'root'
+
+    RETURNS
+    -----
+    - logger object
+
+    EXAMPLE
+    -----
+    >>> logger = init_log('logs/tmp.log', display=True)
+    >>> logger.info('Loading things')
+    [2023-10-20 10:38:03,074] root: INFO - Loading things
+    """
+    # PRECONDITIONALS
+    assert isinstance(filename, str), "filename must be a string"
+    assert (
+        isinstance(logger_id, str) or logger_id is None
+    ), "logger_id must be a string or None"
+
+    # MAIN FUNCTION
+    # init handlers
+    file_handler = logging.FileHandler(filename=filename)
+    stdout_handler = logging.StreamHandler(stream=sys.stdout)
+    if display:
+        handlers = [file_handler, stdout_handler]
+    else:
+        handlers = [file_handler]
+
+    # logger configuration
+    logging.basicConfig(
+        # level=logging.DEBUG,
+        format="[%(asctime)s] %(name)s: %(levelname)s - %(message)s",
+        handlers=handlers,
+    )
+    logging.getLogger("matplotlib.font_manager").disabled = True
+
+    # instantiate the logger
+    logger = logging.getLogger(logger_id)
+    logger.setLevel(logging.DEBUG)
+
+    return logger
+
+
+def get_logger():
+    """
+    Putting at all together to init the log file.
+    """
+    # get log suffix, which will be the current script's base file name
+    log_suffix = get_basename()
+    # generate log file name
+    log_file = generate_log_filename(suffix=log_suffix)
+    # init logger
+    logger = init_log(log_file, display=True)
+    # log it
+    logger.info(f"Path to log file: {log_file}")
+
+    return logger
@@ -2,24 +2,31 @@
 import quarto_reportview as doc_reportview
 from metadata_manager import MetadataManager
 from report import ReportType
+from helpers.utils import get_logger
 
 if __name__ == '__main__':
-    # Load report metadata from YAML file
-    yaml_manager = MetadataManager()
-
+    # Create logging file
+    logger = get_logger()
+    
+    # Load report object and  metadata from YAML file
+    yaml_manager = MetadataManager(logger)
     report, report_metadata = yaml_manager.load_report_metadata('./report_metadata_micw2graph.yaml')
 
     # Create report view
-    doc_report = doc_reportview.QuartoReportView(report_metadata['report']['id'], report_metadata['report']['name'], 
-                                                report=report, 
-                                                report_type = ReportType[report_metadata['report']['report_type'].upper()],
-                                                report_format = doc_reportview.ReportFormat[report_metadata['report']['report_format'].upper()], 
-                                                columns=None)
-    doc_report.generate_report(output_dir="quarto_report/")
-    doc_report.run_report(output_dir="quarto_report/")
+    # doc_report = doc_reportview.QuartoReportView(report_metadata['report']['id'], 
+    #                                             report_metadata['report']['name'], 
+    #                                             report=report, 
+    #                                             report_type = ReportType[report_metadata['report']['report_type'].upper()],
+    #                                             report_format = doc_reportview.ReportFormat[report_metadata['report']['report_format'].upper()],
+    #                                             columns=None)
+    # doc_report.generate_report()
+    # doc_report.run_report()
 
-    st_report = st_reportview.StreamlitReportView(report_metadata['report']['id'], report_metadata['report']['name'], 
-                                                 report=report, report_type = ReportType[report_metadata['report']['report_type'].upper()], columns=None)
-    st_report.generate_report(output_dir="streamlit_report/sections")
-    st_report.run_report(output_dir="streamlit_report/sections")
+    st_report = st_reportview.StreamlitReportView(report_metadata['report']['id'], 
+                                                 report_metadata['report']['name'], 
+                                                 report=report, 
+                                                 report_type = ReportType[report_metadata['report']['report_type'].upper()],
+                                                 columns=None)
+    st_report.generate_report()
+    st_report.run_report()
 
@@ -1,13 +1,26 @@
 import os
 import yaml
 import report as r
+import logging
 from enum import StrEnum
-from typing import Type
+from typing import Type, Optional
+from helpers.utils import get_logger
 
 class MetadataManager:
     """
     Class for handling metadata of reports from YAML files and creating report objects.
     """
+    def __init__(self, logger: Optional[logging.Logger] = None):
+        """
+        Initializes the MetadataManager with an optional logger.
+
+        Parameters
+        ----------
+        logger : logging.Logger, optional
+            A logger object to track warnings, errors, and info messages. If not provided,
+            a default logger will be used.
+        """
+        self.logger = logger or get_logger()
 
     def load_report_metadata(self, file_path: str) -> tuple[r.Report, dict]:
         """
@@ -30,33 +43,39 @@ def load_report_metadata(self, file_path: str) -> tuple[r.Report, dict]:
         ValueError
             If the YAML file is corrupted or contains missing/invalid values.
         """
+        self.logger.info(f"Loading report metadata from {file_path}")
         # Check the existence of the file_path
         if not os.path.exists(file_path):
+            self.logger.error(f"Config file not found: {file_path}")
             raise FileNotFoundError(f"The config file at {file_path} was not found.")
 
         # Load the YAML configuration file
         with open(file_path, 'r') as file:
             try:
                 metadata = yaml.safe_load(file)
             except yaml.YAMLError as exc:
+                self.logger.error(f"Error parsing YAML file at {file_path}: {exc}")
                 raise ValueError(f"Error parsing YAML file: {exc}")
 
+        self.logger.info("Successfully loaded metadata. Creating report object.")
         # Create a Report object from metadata
         report = r.Report(
             id=metadata['report']['id'],
             name=metadata['report']['name'],
+            sections=[],
             title=metadata['report'].get('title'),
             description=metadata['report'].get('description'),
             graphical_abstract=metadata['report'].get('graphical_abstract'),
             logo=metadata['report'].get('logo'),
-            sections=[]
+            logger = self.logger
         )
 
         # Create sections and subsections
         for section_data in metadata.get('sections', []):
             section = self._create_section(section_data)
             report.sections.append(section)
 
+        self.logger.info(f"Report '{report.name}' initialized with {len(report.sections)} sections.")
         return report, metadata
 
     def _create_section(self, section_data: dict) -> r.Section:
@@ -86,7 +105,7 @@ def _create_section(self, section_data: dict) -> r.Section:
         for subsection_data in section_data.get('subsections', []):
             subsection = self._create_subsection(subsection_data)
             section.subsections.append(subsection)
-
+        
         return section
 
     def _create_subsection(self, subsection_data: dict) -> r.Subsection:
@@ -174,7 +193,8 @@ def _create_plot_component(self, component_data: dict) -> r.Plot:
             int_visualization_tool=int_visualization_tool,
             title=component_data.get('title'),
             caption=component_data.get('caption'),
-            csv_network_format=csv_network_format
+            csv_network_format=csv_network_format,
+            logger = self.logger
         )
 
     def _create_dataframe_component(self, component_data: dict) -> r.DataFrame:
@@ -190,7 +210,7 @@ def _create_dataframe_component(self, component_data: dict) -> r.DataFrame:
         -------
         DataFrame
             A DataFrame object populated with the provided metadata.
-        """
+        """        
         # Validate enum field and return dataframe
         file_format = self._validate_enum_value(r.DataFrameFormat, component_data['file_format'])
         return r.DataFrame(
@@ -200,7 +220,8 @@ def _create_dataframe_component(self, component_data: dict) -> r.DataFrame:
             file_format=file_format,
             delimiter=component_data.get('delimiter'),
             title=component_data.get('title'),
-            caption=component_data.get('caption')
+            caption=component_data.get('caption'),
+            logger = self.logger
         )
 
     def _create_markdown_component(self, component_data: dict) -> r.Markdown:
@@ -222,7 +243,8 @@ def _create_markdown_component(self, component_data: dict) -> r.Markdown:
             name=component_data['name'],
             file_path=component_data['file_path'],
             title=component_data.get('title'),
-            caption=component_data.get('caption')
+            caption=component_data.get('caption'),
+            logger = self.logger
         )
 
     def _validate_enum_value(self, enum_class: Type[StrEnum], value: str) -> StrEnum:
@@ -249,4 +271,5 @@ def _validate_enum_value(self, enum_class: Type[StrEnum], value: str) -> StrEnum
         try:
             return enum_class[value.upper()]
         except KeyError:
+            self.logger.error(f"Invalid value for {enum_class.__name__}: {value}")
             raise ValueError(f"Invalid {enum_class.__name__}: {value}")