Refactor index and include tests for included columns

axellpadilla · Axell Padilla · commit 97d2bc811cda · 2025-05-13T05:38:35.000Z
diff --git a/tests/functional/adapter/mssql/test_index_config.py b/tests/functional/adapter/mssql/test_index_config.py
@@ -6,37 +6,49 @@
 base_validation = """
 with base_query AS (
 select i.[name] as index_name,
-    substring(column_names, 1, len(column_names)-1) as [columns],
-    case when i.[type] = 1 then 'Clustered index'
-        when i.[type] = 2 then 'Nonclustered unique index'
-        when i.[type] = 3 then 'XML index'
-        when i.[type] = 4 then 'Spatial index'
-        when i.[type] = 5 then 'Clustered columnstore index'
-        when i.[type] = 6 then 'Nonclustered columnstore index'
-        when i.[type] = 7 then 'Nonclustered hash index'
-        end as index_type,
-    case when i.is_unique = 1 then 'Unique'
-        else 'Not unique' end as [unique],
-    schema_name(t.schema_id) + '.' + t.[name] as table_view,
-    case when t.[type] = 'U' then 'Table'
-        when t.[type] = 'V' then 'View'
-        end as [object_type],
+  substring(column_names, 1, len(column_names)-1) as [columns],
+  substring(included_column_names, 1, len(included_column_names)-1) as included_columns,
+  case when i.[type] = 1 then 'clustered'
+    when i.[type] = 2 then 'nonclustered'
+    when i.[type] = 3 then 'xml'
+    when i.[type] = 4 then 'spatial'
+    when i.[type] = 5 then 'clustered columnstore'
+    when i.[type] = 6 then 'nonclustered columnstore'
+    when i.[type] = 7 then 'nonclustered hash'
+    end as index_type,
+  case when i.is_unique = 1 then 'Unique'
+    else 'Not unique' end as [unique],
+  schema_name(t.schema_id) + '.' + t.[name] as table_view,
+  case when t.[type] = 'U' then 'Table'
+    when t.[type] = 'V' then 'View'
+    end as [object_type],
   s.name as schema_name
 from sys.objects t
   inner join sys.schemas s
-    on
-      t.schema_id = s.schema_id
-    inner join sys.indexes i
-        on t.object_id = i.object_id
-    cross apply (select col.[name] + ', '
-                    from sys.index_columns ic
-                        inner join sys.columns col
-                            on ic.object_id = col.object_id
-                            and ic.column_id = col.column_id
-                    where ic.object_id = t.object_id
-                        and ic.index_id = i.index_id
-                            order by key_ordinal
-                            for xml path ('') ) D (column_names)
+  on
+    t.schema_id = s.schema_id
+  inner join sys.indexes i
+    on t.object_id = i.object_id
+  cross apply (select col.[name] + ', '
+          from sys.index_columns ic
+            inner join sys.columns col
+              on ic.object_id = col.object_id
+              and ic.column_id = col.column_id
+          where ic.object_id = t.object_id
+            and ic.index_id = i.index_id
+            and ic.is_included_column = 0
+              order by key_ordinal
+              for xml path ('') ) D (column_names)
+  cross apply (select col.[name] + ', '
+          from sys.index_columns ic
+            inner join sys.columns col
+              on ic.object_id = col.object_id
+              and ic.column_id = col.column_id
+          where ic.object_id = t.object_id
+            and ic.index_id = i.index_id
+            and ic.is_included_column = 1
+              order by key_ordinal
+              for xml path ('') ) E (included_column_names)
 where t.is_ms_shipped <> 1
 and index_id > 0
 )
@@ -46,13 +58,13 @@
     base_validation
     + """
 select
-  index_type,
+  index_type + case when [unique] = 'Unique' then ' unique' else '' end as index_type,
   count(*) index_count
 from
   base_query
 WHERE
   schema_name='{schema_name}'
-group by index_type
+group by index_type + case when [unique] = 'Unique' then ' unique' else '' end
 """
 )
 
@@ -62,6 +74,7 @@
 SELECT
   index_name,
   [columns],
+  [included_columns],
   index_type,
   [unique],
   table_view,
@@ -135,7 +148,26 @@
       {'columns': ['column_b']},
       {'columns': ['column_a', 'column_b']},
       {'columns': ['column_b', 'column_a'], 'type': 'clustered', 'unique': True},
-      {'columns': ['column_a'], 'type': 'nonclustered'}
+      {'columns': ['column_a','column_c'],
+        'type': 'nonclustered',
+        'included_columns': ['column_b']},
+    ]
+  )
+}}
+
+select 1 as column_a, 2 as column_b, 3 as column_c
+
+"""
+
+
+models__table_included_sql = """
+{{
+  config(
+    materialized = "table",
+    as_columnstore = False,
+    indexes=[
+      {'columns': ['column_a'], 'included_columns': ['column_b']},
+      {'columns': ['column_b'], 'type': 'clustered'}
     ]
   )
 }}
@@ -248,6 +280,7 @@ def models(self):
             "table.sql": models__table_sql,
             "incremental.sql": models__incremental_sql,
             "columnstore.sql": models__columnstore_sql,
+            "table_included.sql": models__table_included_sql,
         }
 
     @pytest.fixture(scope="class")
@@ -265,8 +298,12 @@ def project_config_update(self):
             "seeds": {
                 "quote_columns": False,
                 "indexes": [
-                    {"columns": ["country_code"], "unique": False, "type": "nonclustered"},
-                    {"columns": ["country_code", "country_name"], "unique": True},
+                    {"columns": ["country_code"], "unique": False},
+                    {
+                        "columns": ["country_code", "country_name"],
+                        "unique": True,
+                        "type": "clustered",
+                    },
                 ],
             },
             "vars": {
@@ -279,26 +316,85 @@ def test_table(self, project, unique_schema):
         assert len(results) == 1
 
         indexes = self.get_indexes("table", project, unique_schema)
+        indexes = self.sort_indexes(indexes)
         expected = [
-            {"columns": "column_a", "unique": False, "type": "nonclustered"},
-            {"columns": "column_b", "unique": False, "type": "nonclustered"},
-            {"columns": "column_a, column_b", "unique": False, "type": "nonclustered"},
-            {"columns": "column_b, column_a", "unique": True, "type": "clustered"},
-            {"columns": "column_a", "unique": False, "type": "nonclustered"},
+            {
+                "columns": "column_a",
+                "unique": False,
+                "type": "nonclustered",
+                "included_columns": None,
+            },
+            {
+                "columns": "column_a, column_b",
+                "unique": False,
+                "type": "nonclustered",
+                "included_columns": None,
+            },
+            {
+                "columns": "column_a, column_c",
+                "unique": False,
+                "type": "nonclustered",
+                "included_columns": "column_b",
+            },
+            {
+                "columns": "column_b",
+                "unique": False,
+                "type": "nonclustered",
+                "included_columns": None,
+            },
+            {
+                "columns": "column_b, column_a",
+                "unique": True,
+                "type": "clustered",
+                "included_columns": None,
+            },
+        ]
+        assert indexes == expected
+
+    def test_table_included(self, project, unique_schema):
+        results = run_dbt(["run", "--models", "table_included"])
+        assert len(results) == 1
+
+        indexes = self.get_indexes("table_included", project, unique_schema)
+        indexes = self.sort_indexes(indexes)
+        expected = [
+            {
+                "columns": "column_a",
+                "unique": False,
+                "type": "nonclustered",
+                "included_columns": "column_b",
+            },
+            {
+                "columns": "column_b",
+                "unique": False,
+                "type": "clustered",
+                "included_columns": None,
+            },
         ]
-        assert len(indexes) == len(expected)
+        assert indexes == expected
 
     def test_incremental(self, project, unique_schema):
         for additional_argument in [[], [], ["--full-refresh"]]:
             results = run_dbt(["run", "--models", "incremental"] + additional_argument)
             assert len(results) == 1
 
             indexes = self.get_indexes("incremental", project, unique_schema)
+            indexes = self.sort_indexes(indexes)
             expected = [
-                {"columns": "column_a", "unique": False, "type": "nonclustered"},
-                {"columns": "column_a, column_b", "unique": True, "type": "nonclustered"},
+                {
+                    "columns": "column_a",
+                    "unique": False,
+                    "type": "nonclustered",
+                    "included_columns": None,
+                },
+                {
+                    "columns": "column_a, column_b",
+                    "unique": True,
+                    "type": "nonclustered",
+                    "included_columns": None,
+                },
             ]
-            assert len(indexes) == len(expected)
+            assert indexes == expected
 
     def test_columnstore(self, project, unique_schema):
         for additional_argument in [[], [], ["--full-refresh"]]:
@@ -307,49 +403,79 @@ def test_columnstore(self, project, unique_schema):
 
             indexes = self.get_indexes("columnstore", project, unique_schema)
             expected = [
-                {"columns": "column_a", "unique": False, "type": "columnstore"},
+                {
+                    "columns": "column_a",
+                    "unique": False,
+                    "type": "columnstore",
+                    "included_columns": None,
+                },
             ]
-            assert len(indexes) == len(expected)
+            assert len(indexes) == len(
+                expected
+            )  # Nonclustered columnstore indexes meta is different
 
     def test_seed(self, project, unique_schema):
         for additional_argument in [[], [], ["--full-refresh"]]:
             results = run_dbt(["seed"] + additional_argument)
             assert len(results) == 1
 
             indexes = self.get_indexes("seed", project, unique_schema)
+            indexes = self.sort_indexes(indexes)
             expected = [
-                {"columns": "country_code", "unique": False, "type": "nonclustered"},
-                {"columns": "country_code, country_name", "unique": True, "type": "clustered"},
+                {
+                    "columns": "country_code",
+                    "unique": False,
+                    "type": "nonclustered",
+                    "included_columns": None,
+                },
+                {
+                    "columns": "country_code, country_name",
+                    "unique": True,
+                    "type": "clustered",
+                    "included_columns": None,
+                },
             ]
-            assert len(indexes) == len(expected)
+            assert indexes == expected
 
     def test_snapshot(self, project, unique_schema):
         for version in [1, 2]:
             results = run_dbt(["snapshot", "--vars", f"version: {version}"])
             assert len(results) == 1
 
             indexes = self.get_indexes("colors", project, unique_schema)
+            indexes = self.sort_indexes(indexes)
             expected = [
-                {"columns": "id", "unique": False, "type": "nonclustered"},
-                {"columns": "id, color", "unique": True, "type": "clustered"},
+                {
+                    "columns": "id",
+                    "unique": False,
+                    "type": "nonclustered",
+                    "included_columns": None,
+                },
+                {
+                    "columns": "id, color",
+                    "unique": True,
+                    "type": "nonclustered",
+                    "included_columns": None,
+                },
             ]
-            assert len(indexes) == len(expected)
+            assert indexes == expected
 
     def get_indexes(self, table_name, project, unique_schema):
         sql = indexes_def.format(schema_name=unique_schema, table_name=table_name)
         results = project.run_sql(sql, fetch="all")
         return [self.index_definition_dict(row) for row in results]
 
     def index_definition_dict(self, index_definition):
-        is_unique = index_definition[3] == "Unique"
+        is_unique = index_definition[4] == "Unique"
         return {
             "columns": index_definition[1],
+            "included_columns": index_definition[2],
             "unique": is_unique,
-            "type": index_definition[2],
+            "type": index_definition[3],
         }
 
-    def assertCountEqual(self, a, b):
-        assert len(a) == len(b)
+    def sort_indexes(self, indexes):
+        return sorted(indexes, key=lambda x: (x["columns"], x["type"]))
 
 
 class TestSQLServerInvalidIndex:
diff --git a/tests/functional/adapter/mssql/test_index_macros.py b/tests/functional/adapter/mssql/test_index_macros.py
@@ -104,9 +104,9 @@ def test_create_index(self, project):
             )
         schema_dict = {_[0]: _[1] for _ in table.rows}
         expected = {
-            "Clustered columnstore index": 1,
-            "Clustered index": 1,
-            "Nonclustered unique index": 4,
+            "clustered columnstore": 1,
+            "clustered unique": 1,
+            "nonclustered": 4,
         }
         self.drop_artifacts(project)
         assert schema_dict == expected

Original file line number	Diff line number	Diff line change
`@@ -104,9 +104,9 @@ def test_create_index(self, project):`
`104`	`104`	`)`
`105`	`105`	`schema_dict = {_[0]: _[1] for _ in table.rows}`
`106`	`106`	`expected = {`
`107`		`- "Clustered columnstore index": 1,`
`108`		`- "Clustered index": 1,`
`109`		`- "Nonclustered unique index": 4,`
	`107`	`+ "clustered columnstore": 1,`
	`108`	`+ "clustered unique": 1,`
	`109`	`+ "nonclustered": 4,`
`110`	`110`	`}`
`111`	`111`	`self.drop_artifacts(project)`
`112`	`112`	`assert schema_dict == expected`