refactoring migrate_user

tcnichol · tcnichol · commit 851503e36d22 · 2024-07-13T11:35:35.000-05:00
this might need to be modified for CILogon, but this will work for local users
diff --git a/scripts/migration/migrate_users.py b/scripts/migration/migrate_users.py
@@ -327,119 +327,139 @@ async def add_dataset_folders(dataset_v1, dataset_v2, current_headers):
         print("added", folder)
 
 
-async def process_users(
+async def process_user(
+    user_v1,
     fs: Minio = Depends(dependencies.get_fs),
     es: Elasticsearch = Depends(dependencies.get_elasticsearchclient),
     rabbitmq_client: BlockingChannel = Depends(dependencies.get_rabbitmq),
 ):
-    print("We create a v2 admin user")
-    NEW_ADMIN_KEY_V2 = create_admin_user()
-    users_v1 = get_clowder_v1_users()
-    for user_v1 in users_v1:
-        print("migrating v1 user", user_v1)
-        id = user_v1["id"]
-        email = user_v1["email"]
-        firstName = user_v1["firstName"]
-        lastName = user_v1["lastName"]
-
-        id_provider = user_v1["identityProvider"]
-        if "[Local Account]" in user_v1["identityProvider"]:
-            # get the v2 users
-            # create a user account in v2 with this username
-            if email != "a@a.com":
-                user_v1_datasets = get_clowder_v1_user_datasets(user_id=id)
-                # TODO check if there is already a local user
-                user_v2 = create_local_user(user_v1)
-                user_v2_api_key = user_v2
-                user_base_headers_v2 = {"X-API-key": user_v2_api_key}
-                user_headers_v2 = {
-                    **user_base_headers_v2,
-                    "Content-type": "application/json",
-                    "accept": "application/json",
-                }
-                for dataset in user_v1_datasets:
-                    print("creating a dataset in v2", dataset["id"], dataset["name"])
-                    dataset_v2_id = await create_v2_dataset(
-                        user_base_headers_v2, dataset, email
-                    )
-                    folders = await add_dataset_folders(
-                        dataset, dataset_v2_id, user_headers_v2
-                    )
-                    print("Created folders in new dataset")
-
-                    all_dataset_folders = await get_folder_and_subfolders(
-                        dataset_id=dataset_v2_id,
-                        folder=None,
-                        current_headers=user_headers_v2,
-                    )
-                    dataset_files_endpoint = (
+    print("migrating v1 user", user_v1)
+    id = user_v1["id"]
+    email = user_v1["email"]
+    firstName = user_v1["firstName"]
+    lastName = user_v1["lastName"]
+
+    id_provider = user_v1["identityProvider"]
+    if "[Local Account]" in user_v1["identityProvider"]:
+        # get the v2 users
+        # create a user account in v2 with this username
+        if email != "a@a.com":
+            user_v1_datasets = get_clowder_v1_user_datasets(user_id=id)
+            # TODO check if there is already a local user
+            user_v2 = create_local_user(user_v1)
+            user_v2_api_key = user_v2
+            user_base_headers_v2 = {"X-API-key": user_v2_api_key}
+            user_headers_v2 = {
+                **user_base_headers_v2,
+                "Content-type": "application/json",
+                "accept": "application/json",
+            }
+            for dataset in user_v1_datasets:
+                print("creating a dataset in v2", dataset["id"], dataset["name"])
+                dataset_v2_id = await create_v2_dataset(
+                    user_base_headers_v2, dataset, email
+                )
+                folders = await add_dataset_folders(
+                    dataset, dataset_v2_id, user_headers_v2
+                )
+                print("Created folders in new dataset")
+
+                all_dataset_folders = await get_folder_and_subfolders(
+                    dataset_id=dataset_v2_id,
+                    folder=None,
+                    current_headers=user_headers_v2,
+                )
+                dataset_files_endpoint = (
                         CLOWDER_V1
                         + "api/datasets/"
                         + dataset["id"]
                         + "/files?=superAdmin=true"
+                )
+                r_files = requests.get(
+                    dataset_files_endpoint, headers=clowder_headers_v1, verify=False
+                )
+                files_result = r_files.json()
+                for file in files_result:
+                    file_folder = None
+                    file_id = file["id"]
+                    filename = file["filename"]
+                    if "folders" in file:
+                        file_folder = file["folders"]
+                    # TODO download the file from v1 using api routes
+                    v1_download_url = (
+                            CLOWDER_V1 + "api/files/" + file_id + "?superAdmin=true"
                     )
-                    r_files = requests.get(
-                        dataset_files_endpoint, headers=clowder_headers_v1, verify=False
+                    print("downloading file", filename)
+                    download = requests.get(
+                        v1_download_url, headers=clowder_headers_v1
                     )
-                    files_result = r_files.json()
-                    for file in files_result:
-                        file_folder = None
-                        file_id = file["id"]
-                        filename = file["filename"]
-                        if "folders" in file:
-                            file_folder = file["folders"]
-                        # TODO download the file from v1 using api routes
-                        v1_download_url = (
-                            CLOWDER_V1 + "api/files/" + file_id + "?superAdmin=true"
-                        )
-                        print("downloading file", filename)
-                        download = requests.get(
-                            v1_download_url, headers=clowder_headers_v1
-                        )
-                        with open(filename, "wb") as f:
-                            f.write(download.content)
-                        file_data = {"file": open(filename, "rb")}
-                        matching_folder = None
-                        if file_folder:
-                            for folder in all_dataset_folders:
-                                if folder["name"] == file_folder["name"]:
-                                    matching_folder = folder
-                        if matching_folder:
-                            upload_files = {"files": open(filename, "rb")}
-                            dataset_file_upload_endpoint = (
+                    with open(filename, "wb") as f:
+                        f.write(download.content)
+                    file_data = {"file": open(filename, "rb")}
+                    matching_folder = None
+                    if file_folder:
+                        for folder in all_dataset_folders:
+                            if folder["name"] == file_folder["name"]:
+                                matching_folder = folder
+                    if matching_folder:
+                        upload_files = {"files": open(filename, "rb")}
+                        dataset_file_upload_endpoint = (
                                 CLOWDER_V2
                                 + "api/v2/datasets/"
                                 + dataset_v2_id
                                 + "/filesMultiple?folder_id="
                                 + matching_folder["id"]
-                            )
-                            response = requests.post(
-                                dataset_file_upload_endpoint,
-                                files=upload_files,
-                                headers=user_base_headers_v2,
-                            )
-
-                        else:
-                            dataset_file_upload_endpoint = (
+                        )
+                        response = requests.post(
+                            dataset_file_upload_endpoint,
+                            files=upload_files,
+                            headers=user_base_headers_v2,
+                        )
+
+                    else:
+                        dataset_file_upload_endpoint = (
                                 CLOWDER_V2
                                 + "api/v2/datasets/"
                                 + dataset_v2_id
                                 + "/files"
-                            )
-                            response = requests.post(
-                                dataset_file_upload_endpoint,
-                                files=file_data,
-                                headers=user_base_headers_v2,
-                            )
-                        if response.status_code == 200:
-                            result = response.json()
-                            print("added file", result)
-                        try:
-                            os.remove(filename)
-                        except Exception as e:
-                            print("could not delete locally downloaded file")
-                            print(e)
-                        print("done with file upload")
+                        )
+                        response = requests.post(
+                            dataset_file_upload_endpoint,
+                            files=file_data,
+                            headers=user_base_headers_v2,
+                        )
+                    if response.status_code == 200:
+                        result = response.json()
+                        print("added file", result)
+                    try:
+                        os.remove(filename)
+                    except Exception as e:
+                        print("could not delete locally downloaded file")
+                        print(e)
+                    print("done with file upload")
+
+
+async def process_users(
+    fs: Minio = Depends(dependencies.get_fs),
+    es: Elasticsearch = Depends(dependencies.get_elasticsearchclient),
+    rabbitmq_client: BlockingChannel = Depends(dependencies.get_rabbitmq),
+):
+    print("We create a v2 admin user")
+    NEW_ADMIN_KEY_V2 = create_admin_user()
+    users_v1 = get_clowder_v1_users()
+    for user_v1 in users_v1:
+        print("migrating v1 user", user_v1)
+        id = user_v1["id"]
+        email = user_v1["email"]
+        firstName = user_v1["firstName"]
+        lastName = user_v1["lastName"]
+
+        id_provider = user_v1["identityProvider"]
+        if "[Local Account]" in user_v1["identityProvider"]:
+            # get the v2 users
+            # create a user account in v2 with this username
+            await process_user(user_v1, fs=fs, es=es, rabbitmq_client=rabbitmq_client)
+            print("Migrated user", user_v1)
 
         else:
             print("not a local account, not migrated at this time")