CovidTrackerFr
diff --git a/‎Makefile‎
Lines changed: 4 additions & 1 deletion b/‎Makefile‎
Lines changed: 4 additions & 1 deletion
diff --git a/‎config.json‎
Lines changed: 28 additions & 0 deletions b/‎config.json‎
Lines changed: 28 additions & 0 deletions
diff --git a/‎scraper/clikodoc/clikodoc.py‎
Lines changed: 177 additions & 0 deletions b/‎scraper/clikodoc/clikodoc.py‎
Lines changed: 177 additions & 0 deletions
@@ -27,12 +27,15 @@ stats: ## Run the statistic scripts
 doctoscrap: ## Scrap all doctolib centers, output : data/output/doctolib-centers.json
 	venv/bin/python -m scraper.doctolib.doctolib_center_scrap
 
-keldocscrap: ## Scrap all doctolib centers, output : data/output/keldoc-centers.json
+keldocscrap: ## Scrap all keldoc centers, output : data/output/keldoc-centers.json
 	venv/bin/python -m scraper.keldoc.keldoc_center_scrap
 
 maiiascrap: ## Retrieve maiia centers from API
 	venv/bin/python -m scraper.maiia.maiia_center_scrap
 
+clikodocscrap: ## Scrap all clikodoc centers, output : data/output/clikodoc-centers.json
+	venv/bin/python -m scraper.clikodoc.clikodoc_center_scrap
+
 lint: install
 	venv/bin/pip install black
 	venv/bin/black $$(git ls-files | grep .py$$)
 
@@ -398,6 +398,34 @@
           "0": "Dimanche"
         }
       }
+    },
+    "clikodoc": {
+      "enabled": true,
+      "timeout": 25,
+      "recognized_urls": [
+        "https://www.clikodoc.com"
+      ],
+      "api": {
+        "homepage": "https://www.clikodoc.com",
+        "doctors": "https://www.clikodoc.com/getDoctorsListForAllState",
+        "next_available_date": "https://www.clikodoc.com/foreapicntrl/nextavaildatelite?module=patients",
+        "slots": "https://www.clikodoc.com/getSlotsForBookingV2"
+      },
+      "doctors_options": {
+        "speciality_id": "9",
+        "city_id": "0"
+      },
+      "slot_limit": 3,
+      "days_limit": 50,
+      "filters": {
+        "first_injection_typeids": [
+          "699",
+          "737"
+        ]
+      },
+      "center_scraper": {
+        "result_path": "data/output/clikodoc_centers.json"
+      }
     }
   }
 }
@@ -0,0 +1,177 @@
+import httpx
+from bs4 import BeautifulSoup
+import json
+from urllib.parse import urlencode
+from pathlib import Path
+import re
+
+from functools import wraps
+from typing import NamedTuple, Optional, Tuple, Dict, List, Iterator
+from datetime import datetime, timedelta, date
+from dataclasses import dataclass, field
+
+from scraper.pattern.center_info import INTERVAL_SPLIT_DAYS, CHRONODOSES
+from scraper.pattern.vaccine import Vaccine
+from scraper.pattern.scraper_request import ScraperRequest
+from scraper.pattern.scraper_result import GENERAL_PRACTITIONER
+from utils.vmd_logger import get_logger
+from utils.vmd_config import get_conf_platform, get_config
+from scraper.profiler import Profiling
+
+import httpx
+from .clikodoc_api import get_next_available_date, get_slots, DEFAULT_CLIENT
+
+CLIKODOC_CONF = get_conf_platform("clikodoc")
+CLIKODOC_ENABLED = CLIKODOC_CONF.get("enabled", False)
+DATA_AUTO_URL = get_config().get("data-auto", {}).get("base_url", "")
+CLIKODOC_CENTERS_PATH = CLIKODOC_CONF.get("center_scraper", {}).get("result_path", "")
+SLOT_LIMIT = CLIKODOC_CONF.get("slot_limit", 3)
+DAYS_LIMIT = CLIKODOC_CONF.get("days_limit", 50)
+
+
+logger = get_logger()
+
+doctors_list = []
+
+
+@dataclass(order=True)
+class Slot:
+    timestamp: datetime
+    motive: str = field(compare=False)
+
+
+def _populate_doctors_list():
+    global doctors_list
+    center_path = Path(CLIKODOC_CENTERS_PATH)
+    #url = f"{DATA_AUTO_URL}{center_path}"
+    #response = httpx.get(url)
+    #response.raise_for_status()
+    #data = response.json()
+    #center_path.write_text(json.dumps(data, indent=2))
+    data = json.loads(center_path.read_text())
+    doctors_list = data
+    logger.info(f"Found {len(data)} Clikodoc centers (external scraper).")
+
+
+def _get_first_available_date(doctorid: str, request: ScraperRequest = None) -> Optional[date]:
+    first_date = get_next_available_date(doctorid, request=request)
+
+    if not first_date or first_date["status"] != "success":
+        return None
+    else:
+        return date.fromisoformat(first_date["nextavaildate"])
+
+
+def _get_slots(doctorid: str, motiveid: str, start_date: date, end_date: date, request: ScraperRequest = None) -> List[Slot]:
+    all_slots: List[Slot] = []
+
+    last_date = start_date
+    max_attempts = 3
+    while last_date < end_date and max_attempts > 0:
+        data = get_slots(doctorid, motiveid, last_date, request=request)
+        if not data["slots"]:
+            last_date += timedelta(days=SLOT_LIMIT)
+            max_attempts -= 1
+            continue
+        max_attempts = 3
+        for day, slots in data["slots"].items():
+            all_slots.extend(
+                [Slot(datetime.strptime(f"{day} {slot['start']}", "%Y-%m-%d %H:%M"), motiveid) for slot in slots]
+            )
+        last_date += timedelta(days=SLOT_LIMIT)
+
+    return all_slots
+
+
+def _count_slots(slots: List[Slot], start_date: date, end_date: date) -> int:
+    return len([slot for slot in slots if slot.timestamp > start_date and slot.timestamp < end_date])
+
+
+@Profiling.measure("clikodoc_slot")
+def fetch_slots(request: ScraperRequest, client: httpx.Client = DEFAULT_CLIENT) -> Optional[str]:
+    if not CLIKODOC_ENABLED:
+        return None
+    first_availability = None
+
+    if not doctors_list:
+        _populate_doctors_list()
+
+    doctor = [doc for doc in doctors_list if doc["rdv_site_web"] == request.url]
+    if not doctor:
+        return None
+    doctor = doctor[0]
+
+    only_by_phone = True
+    slots = []
+    for motive in doctor["motives"]:
+        only_by_phone = only_by_phone and motive["onlyByPhone"]
+        if motive["onlyByPhone"] is True:
+            continue
+
+        first_date = _get_first_available_date(doctor["user_id"], request=request)
+        if not first_date:
+            continue
+
+        slots.extend(_get_slots(doctor["user_id"], motive["id"], first_date, first_date + timedelta(days=DAYS_LIMIT), request=request))
+
+    if not slots:
+        return None
+
+    first_availability = min(slots).timestamp
+    request.add_vaccine_type(Vaccine.ASTRAZENECA)
+    request.update_appointment_count(len(slots))
+
+    # create appointment_schedules array with names and dates
+    appointment_schedules = []
+    start_date = datetime.fromisoformat(request.get_start_date())
+    end_date = start_date + timedelta(days=CHRONODOSES["Interval"], seconds=-1)
+    appointment_schedules.append(
+        {"name": "chronodose", "from": start_date.isoformat(), "to": end_date.isoformat(), "total": 0}
+    )
+    for n in INTERVAL_SPLIT_DAYS:
+        end_date = start_date + timedelta(days=n, seconds=-1)
+        appointment_schedules.append(
+            {
+                "name": f"{n}_days",
+                "from": start_date.isoformat(),
+                "to": end_date.isoformat(),
+                "total": _count_slots(slots, start_date, end_date),
+            }
+        )
+
+    request.update_appointment_schedules(appointment_schedules)
+    logger.info(f"appointment_schedules: {request.appointment_schedules}")
+    return first_availability.isoformat()
+
+
+def center_iterator() -> Iterator[Dict]:
+    if not CLIKODOC_ENABLED:
+        return
+    try:
+        if not doctors_list:
+            _populate_doctors_list()
+        for doctor in doctors_list:
+            center = {}
+            center["gid"] = doctor["gid"]
+            center["rdv_site_web"] = doctor["rdv_site_web"]
+            center["com_cp"] = doctor["location"]["com_zipcode"]
+            center["com_insee"] = doctor["location"]["com_insee"]
+            center["address"] = doctor["location"]["full_address"]
+            center["nom"] = doctor["doctor_name"]
+            center["phone_number"] = doctor["phone"]
+            center["location"] = {
+                "long_coor1": doctor["location"]["longitude"],
+                "lat_coor1": doctor["location"]["latitude"],
+                "com_nom": doctor["location"]["com_name"],
+                "com_cp": doctor["location"]["com_zipcode"],
+            }
+            center["iterator"] = "clikodoc"
+            center["type"] = GENERAL_PRACTITIONER
+            center["business_hours"] = doctor["business_hours"]
+            yield center
+    except Exception:
+        logger.exception(f"Unable to scrape clikodoc centers")
+
+
+if __name__ == "__main__":
+    print_token()