More tests

rushter · rushter · commit 1ae139b28ca4 · 2025-12-05T23:32:09.000+04:00
diff --git a/selectolax/lexbor/node.pxi b/selectolax/lexbor/node.pxi
@@ -664,7 +664,7 @@ cdef class LexborNode:
         if isinstance(value, (str, bytes, unicode)):
             bytes_val = to_bytes(value)
             new_node = <lxb_dom_node_t *> lxb_dom_document_create_text_node(
-                &self.parser.document.dom_document,
+                &self.parser.main_document().dom_document,
                 <lxb_char_t *> bytes_val, len(bytes_val)
             )
             if new_node == NULL:
@@ -673,7 +673,7 @@ cdef class LexborNode:
             lxb_dom_node_remove(<lxb_dom_node_t *> self.node)
         elif isinstance(value, LexborNode):
             new_node = lxb_dom_document_import_node(
-                &self.parser.document.dom_document,
+                &self.parser.main_document().dom_document,
                 <lxb_dom_node_t *> value.node,
                 <bint> True
             )
@@ -717,15 +717,15 @@ cdef class LexborNode:
         if isinstance(value, (str, bytes, unicode)):
             bytes_val = to_bytes(value)
             new_node = <lxb_dom_node_t *> lxb_dom_document_create_text_node(
-                &self.parser.document.dom_document,
+                &self.parser.main_document().dom_document,
                 <lxb_char_t *> bytes_val, len(bytes_val)
             )
             if new_node == NULL:
                 raise SelectolaxError("Can't create a new node")
             lxb_dom_node_insert_before(self.node, new_node)
         elif isinstance(value, LexborNode):
             new_node = lxb_dom_document_import_node(
-                &self.parser.document.dom_document,
+                &self.parser.main_document().dom_document,
                 <lxb_dom_node_t *> value.node,
                 <bint> True
             )
@@ -768,15 +768,15 @@ cdef class LexborNode:
         if isinstance(value, (str, bytes, unicode)):
             bytes_val = to_bytes(value)
             new_node = <lxb_dom_node_t *> lxb_dom_document_create_text_node(
-                &self.parser.document.dom_document,
+                &self.parser.main_document().dom_document,
                 <lxb_char_t *> bytes_val, len(bytes_val)
             )
             if new_node == NULL:
                 raise SelectolaxError("Can't create a new node")
             lxb_dom_node_insert_after(self.node, new_node)
         elif isinstance(value, LexborNode):
             new_node = lxb_dom_document_import_node(
-                &self.parser.document.dom_document,
+                &self.parser.main_document().dom_document,
                 <lxb_dom_node_t *> value.node,
                 <bint> True
             )
@@ -827,7 +827,7 @@ cdef class LexborNode:
             lxb_dom_node_insert_child(self.node, new_node)
         elif isinstance(value, LexborNode):
             new_node = lxb_dom_document_import_node(
-                &self.parser.document.dom_document,
+                &self.parser.main_document().dom_document,
                 <lxb_dom_node_t *> value.node,
                 <bint> True
             )
diff --git a/tests/test_lexbor_fragment.py b/tests/test_lexbor_fragment.py
@@ -2,10 +2,6 @@
 import pytest
 from selectolax.lexbor import LexborHTMLParser
 
-# TODO:
-# 1) .clone on document, .clone on node
-# 2) Any kind of tree modification
-
 
 def clean_doc(text: str) -> str:
     return f"{cleandoc(text)}\n"
@@ -102,3 +98,184 @@ def test_insert_node_fragment_parser():
     p = LexborHTMLParser(html, is_fragment=True)
     p.root.insert_child("text")
     assert p.html == "<div>text</div>"
+
+
+def test_insert_before_fragment_parser():
+    html = "<div><span></span></div>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    span = p.root.css_first("span")
+    span.insert_before("text")
+    assert p.html == "<div>text<span></span></div>"
+
+
+def test_insert_after_fragment_parser():
+    html = "<div><span></span></div>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    span = p.root.css_first("span")
+    span.insert_after("text")
+    assert p.html == "<div><span></span>text</div>"
+
+
+def test_clone_parser_fragment():
+    html = "<div><span>Hello</span><p>World</p></div>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    cloned = p.clone()
+    assert cloned.html == p.html
+    assert cloned is not p
+
+    cloned.root.css_first("span").insert_child("!")
+    assert cloned.html == "<div><span>Hello!</span><p>World</p></div>"
+    assert p.html == "<div><span>Hello</span><p>World</p></div>"
+
+
+def test_clone_node_fragment():
+    html = "<div><span>Hello</span><p>World</p></div>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    span = p.root.css_first("span")
+    cloned_span = span.clone()
+    assert cloned_span.html == span.html
+    assert cloned_span is not span
+
+    cloned_span.insert_child("!")
+    assert cloned_span.html == "<span>Hello!</span>"
+    assert span.html == "<span>Hello</span>"
+
+
+def test_fragment_root_html_serialization():
+    html = "<div>Hello</div><span>World</span>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    assert p.root.html == "<div>Hello</div><span>World</span>"
+    p.root.insert_child("!")
+    assert p.html == "<div>Hello!</div><span>World</span>"
+
+
+def test_fragment_node_properties():
+    html = "<div>Hello</div><span>World</span>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    div = p.root
+    span = p.root.next
+
+    assert div.is_element_node is True
+    assert div.is_text_node is False
+    assert div.is_comment_node is False
+
+    assert span.is_element_node is True
+    assert span.is_text_node is False
+    assert span.is_comment_node is False
+
+    text_node = div.first_child
+    assert text_node.is_element_node is False
+    assert text_node.is_text_node is True
+    assert text_node.is_comment_node is False
+
+
+def test_fragment_text_extraction():
+    html = "<div>Hello <strong>World</strong>!</div>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    div = p.root.css_first("div")
+    assert div.text() == "Hello World!"
+    assert div.text(deep=True, separator=" ", strip=True) == "Hello World !"
+
+
+def test_fragment_traversal():
+    html = "<div><span>Hello</span><p>World</p></div>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    nodes = list(p.root.traverse(include_text=True))
+    assert len(nodes) == 5
+    assert nodes[0].tag == "div"
+    assert nodes[1].tag == "span"
+    assert nodes[2].tag == "-text"
+    assert nodes[3].tag == "p"
+    assert nodes[4].tag == "-text"
+
+
+def test_fragment_inner_html():
+    html = "<div><span>Hello</span><p>World</p></div>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    div = p.root.css_first("div")
+    assert div.inner_html == "<span>Hello</span><p>World</p>"
+    div.inner_html = "<em>New</em> content"
+    assert div.html == "<div><em>New</em> content</div>"
+
+
+def test_fragment_node_operations_combined():
+    html = "<div><span>Hello</span></div>"
+    p = LexborHTMLParser(html, is_fragment=True)
+    span = p.root.css_first("span")
+    span.replace_with("Replaced")
+    assert p.html == "<div>Replaced</div>"
+
+    html2 = "<div><span></span></div>"
+    p2 = LexborHTMLParser(html2, is_fragment=True)
+    span2 = p2.root.css_first("span")
+    span2.insert_before("Before")
+    span2.insert_after("After")
+    assert p2.html == "<div>Before<span></span>After</div>"
+
+
+def test_fragment_replace_with_node():
+    html = "<div><span>Hello</span></div>"
+    parser = LexborHTMLParser(html, is_fragment=True)
+    replacement_html = "<em>Replaced</em>"
+    replacement_parser = LexborHTMLParser(replacement_html, is_fragment=True)
+    span = parser.root.css_first("span")
+    span.replace_with(replacement_parser.root)
+    assert parser.html == "<div><em>Replaced</em></div>"
+
+
+def test_fragment_insert_before_node():
+    base_html = "<div><span></span></div>"
+    base_parser = LexborHTMLParser(base_html, is_fragment=True)
+    before_html = "<strong>Before</strong>"
+    before_parser = LexborHTMLParser(before_html, is_fragment=True)
+    span = base_parser.root.css_first("span")
+    span.insert_before(before_parser.root)
+    assert base_parser.html == "<div><strong>Before</strong><span></span></div>"
+
+
+def test_fragment_insert_after_node():
+    base_html = "<div><span></span></div>"
+    base_parser = LexborHTMLParser(base_html, is_fragment=True)
+    after_html = "<em>After</em>"
+    after_parser = LexborHTMLParser(after_html, is_fragment=True)
+    span = base_parser.root.css_first("span")
+    span.insert_after(after_parser.root)
+    assert base_parser.html == "<div><span></span><em>After</em></div>"
+
+
+def test_fragment_insert_child_node():
+    base_html = "<div></div>"
+    base_parser = LexborHTMLParser(base_html, is_fragment=True)
+    child_html = "<p>Child</p>"
+    child_parser = LexborHTMLParser(child_html, is_fragment=True)
+    div = base_parser.root.css_first("div")
+    div.insert_child(child_parser.root)
+    assert base_parser.html == "<div><p>Child</p></div>"
+
+
+def test_fragment_strip_tags():
+    html = "<div><script>alert('test')</script><p>Hello</p><style>body { color: red; }</style></div>"
+    parser = LexborHTMLParser(html, is_fragment=True)
+    parser.root.strip_tags(["script", "style"])
+    assert parser.html == "<div><p>Hello</p></div>"
+
+
+def test_fragment_decompose():
+    html = "<div><script>alert('test')</script><p>Hello</p></div>"
+    parser = LexborHTMLParser(html, is_fragment=True)
+    script = parser.root.css_first("script")
+    script.decompose()
+    assert parser.html == "<div><p>Hello</p></div>"
+
+
+@pytest.mark.parametrize(
+    "input_html, expected",
+    [
+        ("<html><body><div>test</div></body></html>", "<div>test</div>"),
+        ("<head><title>test</title></head>", "<title>test</title>"),
+        ("<body><p>test</p></body>", "<p>test</p>"),
+    ],
+)
+def test_fragment_strips_top_level_tags(input_html, expected):
+    parser = LexborHTMLParser(input_html, is_fragment=True)
+    assert parser.html == expected