Experimental support for scanning Delta Tables inside Mount Points #1095

william-conti · 2024-03-24T17:46:41Z

Changes

This feature adds a new crawler that scans inside mount points for Delta Tables.

Functionality

Required

Add --include-mounts to crawl only for specific mounts.

Nice to have

Add --include-parquet-files to include parquet files to the result of the script.
Add --filter-paths to filter for specific paths in a mount point.
Add --max-depth to filter only at a specific amount of sub-folders.

nfx · 2024-03-24T23:30:22Z

src/databricks/labs/ucx/hive_metastore/locations.py

+            for path in table_paths:
+                table = Table(
+                    catalog="hive_metastore",
+                    database="",


Database can't be empty. Infer it from path and default to "default"

I don't really want to do the mapping of paths -> databases/tables there. As this will be handled later in the process.
What if instead just using the mount name as a database ?

Actually, it would even better to default the database of this to 'mounts' or something that would be easily searcheable for downstream applications that must use this table.

and what if there are duplicate table names?...

yeah that can totally happen ... the strategy of picking the parent folder as the table name is irrelevant then.
Maybe let's simply use the table path in mount as the table name instead ? ...

src/databricks/labs/ucx/hive_metastore/locations.py

nfx · 2024-03-24T23:39:22Z

src/databricks/labs/ucx/config.py

@@ -47,6 +47,10 @@ class WorkspaceConfig:  # pylint: disable=too-many-instance-attributes
    # Whether the assessment should capture a specific list of databases, if not specified, it will list all databases.
    include_databases: list[str] | None = None

+    # Whether the tables in mounts crawler should crawl a specific list of mounts.
+    # If not specified, it will list all moubts.
+    include_mounts: list[str] | None = None


By the way, alternatively, we can ask for it during the installer

nfx · 2024-03-25T21:19:53Z

tests/unit/hive_metastore/test_locations.py

+def test_mount_listing_one_table():
+    client = create_autospec(WorkspaceClient)
+    client.dbutils.fs.ls.return_value = [
+        FileInfo("/mnt/lmao/_delta_log", "_delta_log", "", ''),


use different name in public code ;)

codecov · 2024-03-25T21:40:08Z

Codecov Report

Attention: Patch coverage is 96.00000% with 4 lines in your changes are missing coverage. Please review.

Project coverage is 89.85%. Comparing base (739c320) to head (a0266d0).

Files	Patch %	Lines
...rc/databricks/labs/ucx/hive_metastore/locations.py	97.84%	2 Missing ⚠️
src/databricks/labs/ucx/runtime.py	60.00%	2 Missing ⚠️

Additional details and impacted files

@@            Coverage Diff             @@
##             main    #1095      +/-   ##
==========================================
+ Coverage   89.80%   89.85%   +0.05%     
==========================================
  Files          61       61              
  Lines        7249     7347      +98     
  Branches     1300     1318      +18     
==========================================
+ Hits         6510     6602      +92     
- Misses        475      481       +6     
  Partials      264      264

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

nfx

few bugs

src/databricks/labs/ucx/hive_metastore/locations.py

tests/unit/hive_metastore/test_locations.py

src/databricks/labs/ucx/hive_metastore/locations.py

ganeshgirase · 2024-03-28T09:20:35Z

src/databricks/labs/ucx/hive_metastore/locations.py

+        if delta_log_folders is None:
+            delta_log_folders = {}
+
+        entries = self._dbutils.fs.ls(root_dir)


From below code, it would be wise to rename it as paths. and rename "path" variable from line 326 to directory_name to precise.

src/databricks/labs/ucx/hive_metastore/locations.py

ganeshgirase · 2024-03-28T09:53:10Z

src/databricks/labs/ucx/hive_metastore/locations.py

+            elif self._is_parquet(entry.path):
+                delta_log_folders[path] = TableInMount(format="PARQUET", is_partitioned=False)
+            else:
+                self._find_delta_log_folders(entry.path, delta_log_folders)


This seems dangerous logic, as you're forcing to use heap structure in recursion, that can slow down the process, if you've huge list of paths. Line no 328 will also contribute more to this slowdown. Rather, use a logic of processing single path, process it till leaf path, make TableInMount object there and return from stack to accumulate.

src/databricks/labs/ucx/hive_metastore/locations.py

github-actions · 2024-03-28T16:04:25Z

❌ 131/133 passed, 4 flaky, 2 failed, 20 skipped, 1h54m11s total

❌ test_running_real_assessment_job: TimeoutError: timed out after 0:20:00: (21m2.648s)

TimeoutError: timed out after 0:20:00:
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Schema hive_metastore.ucx_s8xky: https://DATABRICKS_HOST/explore/data/hive_metastore/ucx_s8xky
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_s8xky', metastore_id=None, name='ucx_s8xky', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
[gw1] linux -- Python 3.10.14 /home/runner/work/ucx/ucx/.venv/bin/python
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Schema hive_metastore.ucx_s8xky: https://DATABRICKS_HOST/explore/data/hive_metastore/ucx_s8xky
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_s8xky', metastore_id=None, name='ucx_s8xky', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added workspace user fixture: User(active=True, display_name='[email protected]', emails=[ComplexValue(display=None, primary=True, ref=None, type='work', value='[email protected]')], entitlements=[], external_id=None, groups=[], id='760570282773685', name=Name(family_name=None, given_name='[email protected]'), roles=[], schemas=[<UserSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_USER: 'urn:ietf:params:scim:schemas:core:2.0:User'>, <UserSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_EXTENSION_WORKSPACE_2_0_USER: 'urn:ietf:params:scim:schemas:extension:workspace:2.0:User'>], user_name='[email protected]')
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Workspace group ucx_wLYO: https://DATABRICKS_HOST#setting/accounts/groups/989369483909856
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added workspace group fixture: Group(display_name='ucx_wLYO', entitlements=[ComplexValue(display=None, primary=None, ref=None, type=None, value='allow-cluster-create')], external_id=None, groups=[], id='989369483909856', members=[ComplexValue(display='[email protected]', primary=None, ref='Users/760570282773685', type=None, value='760570282773685')], meta=ResourceMeta(resource_type='WorkspaceGroup'), roles=[], schemas=[<GroupSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_GROUP: 'urn:ietf:params:scim:schemas:core:2.0:Group'>])
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Account group ucx_wLYO: https://accounts.CLOUD_ENVdatabricks.net/users/groups/128813246900084/members
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added account group fixture: Group(display_name='ucx_wLYO', entitlements=[], external_id=None, groups=[], id='128813246900084', members=[ComplexValue(display='[email protected]', primary=None, ref='Users/760570282773685', type=None, value='760570282773685')], meta=None, roles=[], schemas=[<GroupSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_GROUP: 'urn:ietf:params:scim:schemas:core:2.0:Group'>])
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Cluster policy: https://DATABRICKS_HOST#setting/clusters/cluster-policies/view/00115E4C83A4541E
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added cluster policy fixture: CreatePolicyResponse(policy_id='00115E4C83A4541E')
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added cluster_policy permissions fixture: 00115E4C83A4541E [group_name admins CAN_USE] -> [group_name ucx_wLYO CAN_USE]
10:57 DEBUG [databricks.labs.ucx.install] Cannot find previous installation: Path (/Users/0a330eb5-dd51-4d97-b6e4-c474356b1d5d/.DL1w/config.yml) doesn't exist.
10:57 INFO [databricks.labs.ucx.install] Please answer a couple of questions to configure Unity Catalog migration
10:57 INFO [databricks.labs.ucx.installer.hms_lineage] HMS Lineage feature creates one system table named system.hms_to_uc_migration.table_access and helps in your migration process from HMS to UC by allowing you to programmatically query HMS lineage data.
10:57 INFO [databricks.labs.ucx.install] Fetching installations...
10:57 INFO [databricks.labs.ucx.installer.policy] Creating UCX cluster policy.
10:57 INFO [databricks.labs.ucx.install] Installing UCX v0.20.1+2720240329105714
10:57 INFO [databricks.labs.ucx.install] Creating dashboards...
10:57 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading step folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/views...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading step folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/estimates...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [DL1W] UCX  Assessment (Estimates)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 01_0_group_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 01_0_group_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00_0_metastore_assignment.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00_0_metastore_assignment.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 02_0_data_modeling.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 02_0_data_modeling.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 03_0_data_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 03_0_data_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/main...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [DL1W] UCX  Assessment (Main)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 10___data_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 10___data_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 15___storage_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 15___storage_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 40___last_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 40___last_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 20___compute_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 20___compute_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00___assessment_overview.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00___assessment_overview.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 05___findings_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 05___findings_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 30_0_job_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 30_0_job_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/CLOUD_ENV...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [DL1W] UCX  Assessment (Azure)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/interactive...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [DL1W] UCX  Assessment (Interactive)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00_0_interactive.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00_0_interactive.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 02_0_cluster_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 02_0_cluster_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.installer.workflows] Creating jobs from tasks in main
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=validate-groups-permissions
10:57 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:57 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=assessment
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-tables-in-mounts-experimental
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=remove-workspace-local-backup-groups
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-groups
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-tables
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-groups-experimental
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=099-destroy-schema
10:57 INFO [databricks.labs.ucx.install] Installation completed successfully! Please refer to the https://DATABRICKS_HOST/#workspace/Users/0a330eb5-dd51-4d97-b6e4-c474356b1d5d/.DL1w/README for the next steps.
10:57 DEBUG [databricks.labs.ucx.installer.workflows] starting assessment job: https://DATABRICKS_HOST#job/918246302662576
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Schema hive_metastore.ucx_s8xky: https://DATABRICKS_HOST/explore/data/hive_metastore/ucx_s8xky
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_s8xky', metastore_id=None, name='ucx_s8xky', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added workspace user fixture: User(active=True, display_name='[email protected]', emails=[ComplexValue(display=None, primary=True, ref=None, type='work', value='[email protected]')], entitlements=[], external_id=None, groups=[], id='760570282773685', name=Name(family_name=None, given_name='[email protected]'), roles=[], schemas=[<UserSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_USER: 'urn:ietf:params:scim:schemas:core:2.0:User'>, <UserSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_EXTENSION_WORKSPACE_2_0_USER: 'urn:ietf:params:scim:schemas:extension:workspace:2.0:User'>], user_name='[email protected]')
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Workspace group ucx_wLYO: https://DATABRICKS_HOST#setting/accounts/groups/989369483909856
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added workspace group fixture: Group(display_name='ucx_wLYO', entitlements=[ComplexValue(display=None, primary=None, ref=None, type=None, value='allow-cluster-create')], external_id=None, groups=[], id='989369483909856', members=[ComplexValue(display='[email protected]', primary=None, ref='Users/760570282773685', type=None, value='760570282773685')], meta=ResourceMeta(resource_type='WorkspaceGroup'), roles=[], schemas=[<GroupSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_GROUP: 'urn:ietf:params:scim:schemas:core:2.0:Group'>])
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Account group ucx_wLYO: https://accounts.CLOUD_ENVdatabricks.net/users/groups/128813246900084/members
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added account group fixture: Group(display_name='ucx_wLYO', entitlements=[], external_id=None, groups=[], id='128813246900084', members=[ComplexValue(display='[email protected]', primary=None, ref='Users/760570282773685', type=None, value='760570282773685')], meta=None, roles=[], schemas=[<GroupSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_GROUP: 'urn:ietf:params:scim:schemas:core:2.0:Group'>])
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Cluster policy: https://DATABRICKS_HOST#setting/clusters/cluster-policies/view/00115E4C83A4541E
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added cluster policy fixture: CreatePolicyResponse(policy_id='00115E4C83A4541E')
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added cluster_policy permissions fixture: 00115E4C83A4541E [group_name admins CAN_USE] -> [group_name ucx_wLYO CAN_USE]
10:57 DEBUG [databricks.labs.ucx.install] Cannot find previous installation: Path (/Users/0a330eb5-dd51-4d97-b6e4-c474356b1d5d/.DL1w/config.yml) doesn't exist.
10:57 INFO [databricks.labs.ucx.install] Please answer a couple of questions to configure Unity Catalog migration
10:57 INFO [databricks.labs.ucx.installer.hms_lineage] HMS Lineage feature creates one system table named system.hms_to_uc_migration.table_access and helps in your migration process from HMS to UC by allowing you to programmatically query HMS lineage data.
10:57 INFO [databricks.labs.ucx.install] Fetching installations...
10:57 INFO [databricks.labs.ucx.installer.policy] Creating UCX cluster policy.
10:57 INFO [databricks.labs.ucx.install] Installing UCX v0.20.1+2720240329105714
10:57 INFO [databricks.labs.ucx.install] Creating dashboards...
10:57 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading step folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/views...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading step folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/estimates...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [DL1W] UCX  Assessment (Estimates)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 01_0_group_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 01_0_group_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00_0_metastore_assignment.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00_0_metastore_assignment.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 02_0_data_modeling.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 02_0_data_modeling.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 03_0_data_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 03_0_data_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/main...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [DL1W] UCX  Assessment (Main)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 10___data_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 10___data_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 15___storage_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 15___storage_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 40___last_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 40___last_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 20___compute_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 20___compute_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00___assessment_overview.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00___assessment_overview.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 05___findings_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 05___findings_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 30_0_job_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 30_0_job_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/CLOUD_ENV...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [DL1W] UCX  Assessment (Azure)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/interactive...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [DL1W] UCX  Assessment (Interactive)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00_0_interactive.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00_0_interactive.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 02_0_cluster_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 02_0_cluster_summary.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.installer.workflows] Creating jobs from tasks in main
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=validate-groups-permissions
10:57 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:57 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=assessment
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-tables-in-mounts-experimental
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=remove-workspace-local-backup-groups
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-groups
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-tables
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-groups-experimental
10:57 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=099-destroy-schema
10:57 INFO [databricks.labs.ucx.install] Installation completed successfully! Please refer to the https://DATABRICKS_HOST/#workspace/Users/0a330eb5-dd51-4d97-b6e4-c474356b1d5d/.DL1w/README for the next steps.
10:57 DEBUG [databricks.labs.ucx.installer.workflows] starting assessment job: https://DATABRICKS_HOST#job/918246302662576
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] clearing 1 cluster_policy permissions fixtures
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] removing cluster_policy permissions fixture: 00115E4C83A4541E [group_name admins CAN_USE] -> [group_name ucx_wLYO CAN_USE]
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] clearing 1 cluster policy fixtures
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] removing cluster policy fixture: CreatePolicyResponse(policy_id='00115E4C83A4541E')
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] clearing 1 workspace user fixtures
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] removing workspace user fixture: User(active=True, display_name='[email protected]', emails=[ComplexValue(display=None, primary=True, ref=None, type='work', value='[email protected]')], entitlements=[], external_id=None, groups=[], id='760570282773685', name=Name(family_name=None, given_name='[email protected]'), roles=[], schemas=[<UserSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_USER: 'urn:ietf:params:scim:schemas:core:2.0:User'>, <UserSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_EXTENSION_WORKSPACE_2_0_USER: 'urn:ietf:params:scim:schemas:extension:workspace:2.0:User'>], user_name='[email protected]')
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] clearing 1 account group fixtures
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] removing account group fixture: Group(display_name='ucx_wLYO', entitlements=[], external_id=None, groups=[], id='128813246900084', members=[ComplexValue(display='[email protected]', primary=None, ref='Users/760570282773685', type=None, value='760570282773685')], meta=None, roles=[], schemas=[<GroupSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_GROUP: 'urn:ietf:params:scim:schemas:core:2.0:Group'>])
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] clearing 1 workspace group fixtures
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] removing workspace group fixture: Group(display_name='ucx_wLYO', entitlements=[ComplexValue(display=None, primary=None, ref=None, type=None, value='allow-cluster-create')], external_id=None, groups=[], id='989369483909856', members=[ComplexValue(display='[email protected]', primary=None, ref='Users/760570282773685', type=None, value='760570282773685')], meta=ResourceMeta(resource_type='WorkspaceGroup'), roles=[], schemas=[<GroupSchema.URN_IETF_PARAMS_SCIM_SCHEMAS_CORE_2_0_GROUP: 'urn:ietf:params:scim:schemas:core:2.0:Group'>])
11:18 INFO [databricks.labs.ucx.install] Deleting UCX v0.20.1+2720240329111806 from https://DATABRICKS_HOST
11:18 INFO [databricks.labs.ucx.install] Deleting inventory database ucx_s8xky
11:18 INFO [databricks.labs.ucx.install] Deleting jobs
11:18 INFO [databricks.labs.ucx.install] Deleting validate-groups-permissions job_id=105755706198217.
11:18 INFO [databricks.labs.ucx.install] Deleting assessment job_id=918246302662576.
11:18 INFO [databricks.labs.ucx.install] Deleting migrate-tables-in-mounts-experimental job_id=341870583643241.
11:18 INFO [databricks.labs.ucx.install] Deleting remove-workspace-local-backup-groups job_id=516846869427205.
11:18 INFO [databricks.labs.ucx.install] Deleting migrate-groups job_id=863056535825173.
11:18 INFO [databricks.labs.ucx.install] Deleting migrate-tables job_id=916065115764357.
11:18 INFO [databricks.labs.ucx.install] Deleting migrate-groups-experimental job_id=411656953280948.
11:18 INFO [databricks.labs.ucx.install] Deleting 099-destroy-schema job_id=932517853012200.
11:18 INFO [databricks.labs.ucx.install] Deleting cluster policy
11:18 INFO [databricks.labs.ucx.install] Deleting secret scope
11:18 INFO [databricks.labs.ucx.install] UnInstalling UCX complete
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] clearing 1 schema fixtures
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] removing schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_s8xky', metastore_id=None, name='ucx_s8xky', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
[gw1] linux -- Python 3.10.14 /home/runner/work/ucx/ucx/.venv/bin/python

❌ test_partitioned_tables: TimeoutError: Timed out after 0:05:00 (21m1.32s)

TimeoutError: Timed out after 0:05:00
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Schema hive_metastore.ucx_srdeg: https://DATABRICKS_HOST/explore/data/hive_metastore/ucx_srdeg
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_srdeg', metastore_id=None, name='ucx_srdeg', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
[gw4] linux -- Python 3.10.14 /home/runner/work/ucx/ucx/.venv/bin/python
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Schema hive_metastore.ucx_srdeg: https://DATABRICKS_HOST/explore/data/hive_metastore/ucx_srdeg
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_srdeg', metastore_id=None, name='ucx_srdeg', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
10:57 DEBUG [databricks.labs.ucx.install] Cannot find previous installation: Path (/Users/0a330eb5-dd51-4d97-b6e4-c474356b1d5d/.2fcE/config.yml) doesn't exist.
10:57 INFO [databricks.labs.ucx.install] Please answer a couple of questions to configure Unity Catalog migration
10:57 INFO [databricks.labs.ucx.installer.hms_lineage] HMS Lineage feature creates one system table named system.hms_to_uc_migration.table_access and helps in your migration process from HMS to UC by allowing you to programmatically query HMS lineage data.
10:57 INFO [databricks.labs.ucx.install] Fetching installations...
10:57 INFO [databricks.labs.ucx.installer.policy] Creating UCX cluster policy.
10:57 INFO [databricks.labs.ucx.install] Installing UCX v0.20.1+2720240329105743
10:57 INFO [databricks.labs.ucx.install] Creating dashboards...
10:57 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading step folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/views...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading step folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/estimates...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [2FCE] UCX  Assessment (Estimates)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 01_0_group_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 01_0_group_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00_0_metastore_assignment.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00_0_metastore_assignment.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 02_0_data_modeling.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 02_0_data_modeling.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 03_0_data_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 03_0_data_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/main...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [2FCE] UCX  Assessment (Main)...
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 10___data_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 10___data_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 15___storage_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 15___storage_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 40___last_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 40___last_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 20___compute_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 20___compute_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00___assessment_overview.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00___assessment_overview.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 05___findings_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 05___findings_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 30_0_job_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 30_0_job_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/CLOUD_ENV...
10:58 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [2FCE] UCX  Assessment (Azure)...
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/interactive...
10:58 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [2FCE] UCX  Assessment (Interactive)...
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00_0_interactive.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00_0_interactive.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 02_0_cluster_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 02_0_cluster_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.installer.workflows] Creating jobs from tasks in main
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-tables-in-mounts-experimental
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=099-destroy-schema
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-groups
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=remove-workspace-local-backup-groups
10:58 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:58 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=assessment
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=validate-groups-permissions
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-tables
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-groups-experimental
10:58 INFO [databricks.labs.ucx.install] Installation completed successfully! Please refer to the https://DATABRICKS_HOST/#workspace/Users/0a330eb5-dd51-4d97-b6e4-c474356b1d5d/.2fcE/README for the next steps.
10:58 INFO [databricks.labs.ucx.mixins.fixtures] Schema hive_metastore.ucx_sybqw: https://DATABRICKS_HOST/explore/data/hive_metastore/ucx_sybqw
10:58 DEBUG [databricks.labs.ucx.mixins.fixtures] added schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_sybqw', metastore_id=None, name='ucx_sybqw', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
10:58 DEBUG [databricks.labs.ucx.installer.workflows] starting assessment job: https://DATABRICKS_HOST#job/1046733640844175
10:57 INFO [databricks.labs.ucx.mixins.fixtures] Schema hive_metastore.ucx_srdeg: https://DATABRICKS_HOST/explore/data/hive_metastore/ucx_srdeg
10:57 DEBUG [databricks.labs.ucx.mixins.fixtures] added schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_srdeg', metastore_id=None, name='ucx_srdeg', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
10:57 DEBUG [databricks.labs.ucx.install] Cannot find previous installation: Path (/Users/0a330eb5-dd51-4d97-b6e4-c474356b1d5d/.2fcE/config.yml) doesn't exist.
10:57 INFO [databricks.labs.ucx.install] Please answer a couple of questions to configure Unity Catalog migration
10:57 INFO [databricks.labs.ucx.installer.hms_lineage] HMS Lineage feature creates one system table named system.hms_to_uc_migration.table_access and helps in your migration process from HMS to UC by allowing you to programmatically query HMS lineage data.
10:57 INFO [databricks.labs.ucx.install] Fetching installations...
10:57 INFO [databricks.labs.ucx.installer.policy] Creating UCX cluster policy.
10:57 INFO [databricks.labs.ucx.install] Installing UCX v0.20.1+2720240329105743
10:57 INFO [databricks.labs.ucx.install] Creating dashboards...
10:57 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading step folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/views...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading step folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/estimates...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [2FCE] UCX  Assessment (Estimates)...
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 01_0_group_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 01_0_group_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00_0_metastore_assignment.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00_0_metastore_assignment.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 02_0_data_modeling.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 02_0_data_modeling.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 03_0_data_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 03_0_data_migration.md because it's a text widget
10:57 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/main...
10:57 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [2FCE] UCX  Assessment (Main)...
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 10___data_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 10___data_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 15___storage_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 15___storage_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 40___last_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 40___last_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 20___compute_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 20___compute_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00___assessment_overview.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00___assessment_overview.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 05___findings_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 05___findings_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 30_0_job_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 30_0_job_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/CLOUD_ENV...
10:58 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [2FCE] UCX  Assessment (Azure)...
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Reading dashboard folder /home/runner/work/ucx/ucx/src/databricks/labs/ucx/queries/assessment/interactive...
10:58 INFO [databricks.labs.ucx.framework.dashboards] Creating dashboard [2FCE] UCX  Assessment (Interactive)...
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 00_0_interactive.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 00_0_interactive.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping query 02_0_cluster_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.framework.dashboards] Skipping viz 02_0_cluster_summary.md because it's a text widget
10:58 DEBUG [databricks.labs.ucx.installer.workflows] Creating jobs from tasks in main
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-tables-in-mounts-experimental
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=099-destroy-schema
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-groups
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=remove-workspace-local-backup-groups
10:58 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:58 INFO [databricks.labs.ucx.installer.mixins] Fetching warehouse_id from a config
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=assessment
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=validate-groups-permissions
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-tables
10:58 INFO [databricks.labs.ucx.installer.workflows] Creating new job configuration for step=migrate-groups-experimental
10:58 INFO [databricks.labs.ucx.install] Installation completed successfully! Please refer to the https://DATABRICKS_HOST/#workspace/Users/0a330eb5-dd51-4d97-b6e4-c474356b1d5d/.2fcE/README for the next steps.
10:58 INFO [databricks.labs.ucx.mixins.fixtures] Schema hive_metastore.ucx_sybqw: https://DATABRICKS_HOST/explore/data/hive_metastore/ucx_sybqw
10:58 DEBUG [databricks.labs.ucx.mixins.fixtures] added schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_sybqw', metastore_id=None, name='ucx_sybqw', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
10:58 DEBUG [databricks.labs.ucx.installer.workflows] starting assessment job: https://DATABRICKS_HOST#job/1046733640844175
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] clearing 0 table fixtures
11:18 INFO [databricks.labs.ucx.install] Deleting UCX v0.20.1+2720240329111832 from https://DATABRICKS_HOST
11:18 INFO [databricks.labs.ucx.install] Deleting inventory database ucx_srdeg
11:18 INFO [databricks.labs.ucx.install] Deleting jobs
11:18 INFO [databricks.labs.ucx.install] Deleting migrate-tables-in-mounts-experimental job_id=948191679673460.
11:18 INFO [databricks.labs.ucx.install] Deleting 099-destroy-schema job_id=754239117955335.
11:18 INFO [databricks.labs.ucx.install] Deleting migrate-groups job_id=13294446000192.
11:18 INFO [databricks.labs.ucx.install] Deleting remove-workspace-local-backup-groups job_id=529797051812826.
11:18 INFO [databricks.labs.ucx.install] Deleting assessment job_id=1046733640844175.
11:18 INFO [databricks.labs.ucx.install] Deleting validate-groups-permissions job_id=406530805466473.
11:18 INFO [databricks.labs.ucx.install] Deleting migrate-tables job_id=911355358649536.
11:18 INFO [databricks.labs.ucx.install] Deleting migrate-groups-experimental job_id=325948915976041.
11:18 INFO [databricks.labs.ucx.install] Deleting cluster policy
11:18 INFO [databricks.labs.ucx.install] Deleting secret scope
11:18 INFO [databricks.labs.ucx.install] UnInstalling UCX complete
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] clearing 2 schema fixtures
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] removing schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_srdeg', metastore_id=None, name='ucx_srdeg', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
11:18 DEBUG [databricks.labs.ucx.mixins.fixtures] removing schema fixture: SchemaInfo(browse_only=None, catalog_name='hive_metastore', catalog_type=None, comment=None, created_at=None, created_by=None, effective_predictive_optimization_flag=None, enable_predictive_optimization=None, full_name='hive_metastore.ucx_sybqw', metastore_id=None, name='ucx_sybqw', owner=None, properties=None, storage_location=None, storage_root=None, updated_at=None, updated_by=None)
[gw4] linux -- Python 3.10.14 /home/runner/work/ucx/ucx/.venv/bin/python

Flaky tests:

🤪 test_table_migration_job_cluster_override (1m56.293s)
🤪 test_repair_run_workflow_job (6m35.556s)
🤪 test_running_real_migrate_groups_job (7m4.046s)
🤪 test_running_real_remove_backup_groups_job (6m51.989s)

_{Running from acceptance #1882}

nfx

Fix db name detection

src/databricks/labs/ucx/runtime.py

tests/unit/hive_metastore/test_locations.py

nfx

okay

* Ensure proper sequencing of view migrations ([#1157](#1157)). In this release, we have introduced a `views_migrator` module and corresponding test cases to ensure proper sequencing of view migrations, addressing issue [#1132](#1132). The module contains two main classes: `ViewToMigrate` and `ViewsMigrator`. The former is responsible for parsing a view's SQL text and identifying its dependencies, while the latter sequences views based on their dependencies. The commit also adds a new method, `__hash__`, to the Table class, which returns a hash value of the key of the table, improving the handling of Table objects. Additionally, we have added unit tests and verified the changes on a staging environment. We have also introduced a new file `tables_and_views.json` for unit testing and added a `views_migrator` module that takes a `TablesCrawler` object and returns a sequence of tables (views) that need to be migrated in the correct order. The commit addresses various scenarios such as no views, direct views, indirect views, deep indirect views, invalid SQL, invalid SQL tables, and circular view references. This release is focused on improving the sequencing of view migrations and is accompanied by appropriate tests. * Experimental support for scanning Delta Tables inside Mount Points ([#1095](#1095)). This commit introduces experimental support for scanning Delta Tables located inside mount points using a new `TablesInMounts` crawler. Users can now scan specific mount points using the `--include-mounts` flag and include Parquet files in the scan results with the `--include-parquet-files` flag. Additionally, the `--filter-paths` flag allows for filtering paths in a mount point and the `--max-depth` flag (currently unimplemented) will filter at a specific sub-folder depth in future development. The project dependencies have been updated to use `databricks-labs-lsql~=0.3.0`. This new feature provides a more granular and flexible way to scan Delta Tables, making the project more user-friendly and adaptable to various use cases. * Fixed `NULL` values in `ucx.views.table_format` to have `UNKNOWN` value instead ([#1156](#1156)). This commit includes a fix for handling NULL values in the `table_format` column of Views in the `ucx.views.table_format` module. Previously, NULL values were displayed as-is, but now they will be replaced with the string "UNKNOWN". This change is part of the fix for issue [#115](#115) * Fixing run_workflow functionality for better error handling ([#1159](#1159)). In this release, the `run_workflow` method in the `workflows.py` file has been updated to improve error handling by waiting for the job to terminate or skip before raising an error, allowing for a more detailed error message to be generated. A new method, `job_initial_run`, has been added to initiate a job run and return the run ID, raising a `NotFound` exception if the job run is not found. The `run_workflow` functionality in the `WorkflowsInstall` module has also been enhanced to handle unexpected error types and improve overall error handling during the installation of products. New test cases have been added and existing ones updated to check how the code handles errors when the run ID is not found or when an `OperationFailed` exception is raised during the installation process. These changes improve the robustness and stability of the system. * Use experimental Permissions Migration API also for Legacy Table ACLs ([#1161](#1161)). This release introduces several changes to the group permissions migration functionality and associated tests. The experimental Permissions Migration API is now being utilized for Legacy Table ACLs, which has led to the removal of the verification step from the experimental group migration job. The `TableAclSupport` import and class have been removed, as they are no longer needed. A new `apply_to_renamed_groups` method has been added for production usage, and a `apply_to_groups_with_different_names` method has been added for integration testing, both of which are part of the Permissions Migration API. Additionally, two tests have been added to support the experimental permissions migration for a group with the same name in the workspace and account. The `permission_manager` parameter has been removed from several test functions in the `test_generic.py` file and replaced with the `MigrationState` class, which is used directly with the `WorkspaceClient` object to apply permissions to groups with different names. The `test_some_entitlements` function in the `test_scim.py` file has also been updated to use the `MigratedGroup` class and the `MigrationState` class's `apply_to_groups_with_different_names` method. Finally, new tests for the Permissions Migration API have been added to the `test_tacl.py` file in the `tests/integration/workspace_access` directory to verify the behavior of the Permissions Migration API when migrating different grants.

william-conti and others added 3 commits March 24, 2024 18:29

first impl

05d7dcb

Merge branch 'main' into add_mount_scanning

f302543

small refactor

65f294f

nfx requested changes Mar 24, 2024

View reviewed changes

nfx reviewed Mar 24, 2024

View reviewed changes

william-conti and others added 2 commits March 25, 2024 19:24

Merge branch 'main' into add_mount_scanning

24e3d24

adding more test, fixing cli

e4f7208

nfx reviewed Mar 25, 2024

View reviewed changes

william-conti and others added 2 commits March 25, 2024 22:37

adding parquet support

b30e7be

Merge branch 'main' into add_mount_scanning

0be44c6

nfx reviewed Mar 26, 2024

View reviewed changes

william-conti added 3 commits March 26, 2024 14:42

wip

9e085a7

adding partition support

168df6a

added support for filtering paths in a mount

d1fcd25

nfx requested changes Mar 27, 2024

View reviewed changes

ganeshgirase reviewed Mar 28, 2024

View reviewed changes

william-conti and others added 7 commits March 28, 2024 14:32

finalizing

28866c0

Merge branch 'main' into add_mount_scanning

5af62c0

Merge branch 'main' into add_mount_scanning

5bc5853

pr returns

2966c48

Merge branch 'main' into add_mount_scanning

c1365e0

increasing test cov

ab03f71

fmt oopsie

bc0e564

william-conti marked this pull request as ready for review March 28, 2024 15:28

william-conti requested review from a team and HariGS-DB March 28, 2024 15:28

william-conti had a problem deploying to account-admin March 28, 2024 15:29 — with GitHub Actions Failure

fixing paths

74b7641

william-conti had a problem deploying to account-admin March 28, 2024 19:03 — with GitHub Actions Failure

nfx requested changes Mar 29, 2024

View reviewed changes

src/databricks/labs/ucx/runtime.py Outdated Show resolved Hide resolved

tests/unit/hive_metastore/test_locations.py Outdated Show resolved Hide resolved

william-conti and others added 2 commits March 29, 2024 10:01

Merge branch 'main' into add_mount_scanning

55c3fca

PR review

12a5cbe

william-conti had a problem deploying to account-admin March 29, 2024 10:19 — with GitHub Actions Failure

adding incremental support

e442123

william-conti force-pushed the add_mount_scanning branch from 92847a6 to e442123 Compare March 29, 2024 10:55

william-conti had a problem deploying to account-admin March 29, 2024 10:55 — with GitHub Actions Failure

william-conti and others added 2 commits March 29, 2024 11:56

Update runtime.py

7a8a6cb

fixing format

a0266d0

nfx approved these changes Mar 29, 2024

View reviewed changes

nfx changed the title ~~Added support for scanning Delta Tables inside Mount Points~~ Experimental support for scanning Delta Tables inside Mount Points Mar 29, 2024

nfx merged commit 582c68d into main Mar 29, 2024
7 checks passed

nfx deleted the add_mount_scanning branch March 29, 2024 11:34

nfx mentioned this pull request Mar 29, 2024

Release v0.21.0 #1185

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Experimental support for scanning Delta Tables inside Mount Points #1095

Experimental support for scanning Delta Tables inside Mount Points #1095

william-conti commented Mar 24, 2024 •

edited

Loading

nfx Mar 24, 2024

william-conti Mar 25, 2024

william-conti Mar 25, 2024

nfx Mar 25, 2024

william-conti Mar 25, 2024

nfx Mar 24, 2024

nfx Mar 25, 2024

codecov bot commented Mar 25, 2024 •

edited

Loading

nfx left a comment

ganeshgirase Mar 28, 2024

ganeshgirase Mar 28, 2024

github-actions bot commented Mar 28, 2024 •

edited

Loading

nfx left a comment

nfx left a comment

Experimental support for scanning Delta Tables inside Mount Points #1095

Experimental support for scanning Delta Tables inside Mount Points #1095

Conversation

william-conti commented Mar 24, 2024 • edited Loading

Changes

Functionality

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

codecov bot commented Mar 25, 2024 • edited Loading

Codecov Report

nfx left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

github-actions bot commented Mar 28, 2024 • edited Loading

nfx left a comment

Choose a reason for hiding this comment

nfx left a comment

Choose a reason for hiding this comment

william-conti commented Mar 24, 2024 •

edited

Loading

codecov bot commented Mar 25, 2024 •

edited

Loading

github-actions bot commented Mar 28, 2024 •

edited

Loading