TST (string dtype): resolve xfail in arrow interface tests

jorisvandenbossche · jorisvandenbossche · commit ee2b58befbbc · 2024-11-08T14:05:44.000+01:00
diff --git a/pandas/tests/frame/test_arrow_interface.py b/pandas/tests/frame/test_arrow_interface.py
@@ -2,18 +2,15 @@
 
 import pytest
 
-from pandas._config import using_string_dtype
-
 import pandas.util._test_decorators as td
 
 import pandas as pd
 
 pa = pytest.importorskip("pyarrow")
 
 
-@pytest.mark.xfail(using_string_dtype(), reason="TODO(infer_string)")
 @td.skip_if_no("pyarrow", min_version="14.0")
-def test_dataframe_arrow_interface():
+def test_dataframe_arrow_interface(using_infer_string):
     df = pd.DataFrame({"a": [1, 2, 3], "b": ["a", "b", "c"]})
 
     capsule = df.__arrow_c_stream__()
@@ -25,7 +22,15 @@ def test_dataframe_arrow_interface():
     )
 
     table = pa.table(df)
-    expected = pa.table({"a": [1, 2, 3], "b": ["a", "b", "c"]})
+    expected = pa.table(
+        {
+            "a": [1, 2, 3],
+            "b": pa.array(
+                ["a", "b", "c"],
+                pa.large_string() if using_infer_string else pa.string(),
+            ),
+        }
+    )
     assert table.equals(expected)
 
     schema = pa.schema([("a", pa.int8()), ("b", pa.string())])
@@ -34,13 +39,20 @@ def test_dataframe_arrow_interface():
     assert table.equals(expected)
 
 
-@pytest.mark.xfail(using_string_dtype(), reason="TODO(infer_string)")
 @td.skip_if_no("pyarrow", min_version="15.0")
-def test_dataframe_to_arrow():
+def test_dataframe_to_arrow(using_infer_string):
     df = pd.DataFrame({"a": [1, 2, 3], "b": ["a", "b", "c"]})
 
     table = pa.RecordBatchReader.from_stream(df).read_all()
-    expected = pa.table({"a": [1, 2, 3], "b": ["a", "b", "c"]})
+    expected = pa.table(
+        {
+            "a": [1, 2, 3],
+            "b": pa.array(
+                ["a", "b", "c"],
+                pa.large_string() if using_infer_string else pa.string(),
+            ),
+        }
+    )
     assert table.equals(expected)
 
     schema = pa.schema([("a", pa.int8()), ("b", pa.string())])