Skip to content

Commit a1a9999

Browse files
committed
fix ut
1 parent 6a0e469 commit a1a9999

File tree

4 files changed

+22
-20
lines changed

4 files changed

+22
-20
lines changed

tests/test_code_extraction.py

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -44,7 +44,7 @@ def test_inline_code(self):
4444
result = BaseMetric._extract_from_markdown(text)
4545
print(result)
4646
self.assertEqual(result['code'], '行内代码')
47-
self.assertEqual(result['text'], '这是一个的例子')
47+
self.assertEqual(result['text'], text)
4848

4949
def test_code_block(self):
5050
"""测试代码块"""
@@ -76,15 +76,15 @@ def test_code_block(self):
7676
How can I get the last four characters and store them in a string using Python?
7777
Like this:
7878
"""
79-
self.assertEqual(result['text'], expected_text.strip())
79+
self.assertEqual(result['text'], text)
8080
self.assertEqual(result['formula'], '')
8181

8282
def test_code_with_leading_trailing_spaces(self):
8383
"""测试代码前后有空格的情况"""
8484
text = "前面 ` code ` 后面"
8585
result = BaseMetric._extract_from_markdown(text)
8686
self.assertEqual(result['code'], 'code') # 应该去除空格
87-
self.assertEqual(result['text'], '前面 后面')
87+
self.assertEqual(result['text'], text)
8888

8989
def test_multiline_inline_code(self):
9090
"""测试多行行内代码(不应该匹配)"""

tests/test_formula_extraction.py

Lines changed: 9 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -41,8 +41,9 @@ def test_inline_formula_extraction(self):
4141
self.assertIn('E = mc^2', result['formula'])
4242

4343
# 验证文本中公式标记被移除
44-
self.assertNotIn('$E = mc^2$', result['text'])
45-
self.assertIn('这是行内公式示例: ,这是普通文本。', result['text'])
44+
# self.assertNotIn('$E = mc^2$', result['text'])
45+
# self.assertIn('这是行内公式示例: ,这是普通文本。', result['text'])
46+
self.assertEqual(result['text'], text)
4647

4748
def test_block_formula_extraction(self):
4849
"""测试行间公式提取"""
@@ -61,7 +62,7 @@ def test_block_formula_extraction(self):
6162
self.assertIn('这是行间公式:', result['text'])
6263
self.assertIn('公式结束', result['text'])
6364
# 检查原始公式位置是否被清空
64-
self.assertNotIn('$$', result['text'])
65+
# self.assertNotIn('$$', result['text'])
6566

6667
def test_escaped_dollar_signs(self):
6768
"""测试转义美元符号不被识别为公式"""
@@ -117,8 +118,9 @@ def test_formula_within_text(self):
117118
self.assertIn('\\nabla \\cdot \\mathbf{E} = \\frac{\\rho}{\\epsilon_0}', result['formula'])
118119

119120
# 修正:允许提取后有多个空格
120-
self.assertIn('根据相对论 ,能量和质量可以互相转换。', result['text'])
121-
self.assertIn('更复杂的情况如 所示。', result['text'])
121+
# self.assertIn('根据相对论 ,能量和质量可以互相转换。', result['text'])
122+
# self.assertIn('更复杂的情况如 所示。', result['text'])
123+
self.assertEqual(result['text'], text)
122124

123125
def test_empty_formulas(self):
124126
"""测试空公式处理"""
@@ -131,8 +133,8 @@ def test_empty_formulas(self):
131133
self.assertTrue(result['formula'].strip() == '')
132134

133135
# 验证空公式标记从文本中移除
134-
self.assertNotIn('$ $', result['text'])
135-
self.assertNotIn('$$ $$', result['text'])
136+
# self.assertNotIn('$ $', result['text'])
137+
# self.assertNotIn('$$ $$', result['text'])
136138

137139
def test_formula_at_document_edges(self):
138140
"""测试文档开头和结尾的公式"""

tests/test_metrics.py

Lines changed: 6 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -164,8 +164,8 @@ def test_text_edit_metric(self):
164164
self.assertTrue(text_result.success)
165165
self.assertIsInstance(text_result.score, float)
166166
# 验证固定内容的确定分数
167-
self.assertAlmostEqual(text_result.score, 0.7692307692307692, places=5,
168-
msg=f"text_edit分数应该是0.7692307692307692,实际: {text_result.score}")
167+
self.assertAlmostEqual(text_result.score, 0.8904109589041096, places=5,
168+
msg=f"text_edit分数应该是0.8904109589041096,实际: {text_result.score}")
169169

170170
# 验证详细信息
171171
self.assertEqual(text_result.details['content_type'], 'text')
@@ -299,8 +299,8 @@ def hello_world():
299299
# 验证文本编辑距离(固定内容应该有确定分数)
300300
self.assertIn("text_edit", results)
301301
self.assertTrue(results["text_edit"].success)
302-
self.assertAlmostEqual(results["text_edit"].score, 1.0, places=5,
303-
msg=f"text_edit分数应该是1.0,实际: {results['text_edit'].score}")
302+
self.assertAlmostEqual(results["text_edit"].score, 0.9552238805970149, places=5,
303+
msg=f"text_edit分数应该是0.9552238805970149,实际: {results['text_edit'].score}")
304304

305305
# 验证代码编辑距离(缺少python标识符导致轻微差异)
306306
self.assertIn("code_edit", results)
@@ -373,8 +373,8 @@ def test_formula_sample_edit_distance(self):
373373
# 验证文本编辑距离(去除公式后的纯文本,也受符号转义影响)
374374
self.assertIn("text_edit", results)
375375
self.assertTrue(results["text_edit"].success)
376-
self.assertAlmostEqual(results["text_edit"].score, 0.31999999999999995, places=5,
377-
msg=f"text_edit分数应该是0.31999999999999995,实际: {results['text_edit'].score}")
376+
self.assertAlmostEqual(results["text_edit"].score, 0.95, places=5,
377+
msg=f"text_edit分数应该是0.95,实际: {results['text_edit'].score}")
378378

379379
def test_overall_score_calculation(self):
380380
"""测试综合分数计算"""

tests/test_table_extraction.py

Lines changed: 4 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -49,7 +49,7 @@ def test_basic_table_extraction(self):
4949
self.assertIn('| 数据1 | 数据2 |', result['table'])
5050

5151
# 验证文本中表格被移除
52-
self.assertNotIn('| 列1 | 列2 |', result['text'])
52+
# self.assertNotIn('| 列1 | 列2 |', result['text'])
5353

5454
def test_no_name_error(self):
5555
"""测试修复后的代码不会出现 'name table_lines is not defined' 错误"""
@@ -87,7 +87,7 @@ def test_html_table_extraction(self):
8787
self.assertIn(expected_table, result['table'])
8888

8989
# 验证文本中HTML表格被移除
90-
self.assertNotIn('<table>', result['text'])
90+
# self.assertNotIn('<table>', result['text'])
9191

9292
def test_complex_markdown_table(self):
9393
"""测试复杂Markdown表格"""
@@ -112,7 +112,7 @@ def test_complex_markdown_table(self):
112112
self.assertIn(expected_table, result['table'])
113113

114114
# 验证文本中表格被移除
115-
self.assertNotIn('| 姓名 | 年龄 | 职业 | 薪资 |', result['text'])
115+
# self.assertNotIn('| 姓名 | 年龄 | 职业 | 薪资 |', result['text'])
116116

117117

118118

@@ -187,7 +187,7 @@ def test_empty_and_whitespace_handling(self):
187187
# 测试只有空白字符
188188
result = self.metric._extract_from_markdown(" \n\n ")
189189
self.assertEqual(result['table'], '')
190-
self.assertEqual(result['text'], '')
190+
self.assertEqual(result['text'], ' \n\n ')
191191

192192
def test_table_with_complex_content(self):
193193
"""测试包含复杂内容的表格"""

0 commit comments

Comments
 (0)