PaddlePaddle
diff --git a/‎examples/machine_reading_comprehension/SQuAD/run_squad.py‎
Lines changed: 10 additions & 7 deletions b/‎examples/machine_reading_comprehension/SQuAD/run_squad.py‎
Lines changed: 10 additions & 7 deletions
diff --git a/‎paddlenlp/transformers/__init__.py‎
Lines changed: 2 additions & 0 deletions b/‎paddlenlp/transformers/__init__.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎paddlenlp/transformers/funnel/__init__.py‎
Lines changed: 2 additions & 0 deletions b/‎paddlenlp/transformers/funnel/__init__.py‎
Lines changed: 2 additions & 0 deletions
@@ -29,14 +29,15 @@
 import paddlenlp as ppnlp
 
 from paddlenlp.data import Pad, Stack, Tuple, Dict
-from paddlenlp.transformers import BertForQuestionAnswering, BertTokenizer, ErnieForQuestionAnswering, ErnieTokenizer
+from paddlenlp.transformers import BertForQuestionAnswering, BertTokenizer, ErnieForQuestionAnswering, ErnieTokenizer, FunnelForQuestionAnswering, FunnelTokenizer
 from paddlenlp.transformers import LinearDecayWithWarmup
 from paddlenlp.metrics.squad import squad_evaluate, compute_prediction
 from paddlenlp.datasets import load_dataset
 
 MODEL_CLASSES = {
     "bert": (BertForQuestionAnswering, BertTokenizer),
-    "ernie": (ErnieForQuestionAnswering, ErnieTokenizer)
+    "ernie": (ErnieForQuestionAnswering, ErnieTokenizer),
+    'funnel':(FunnelForQuestionAnswering, FunnelTokenizer)
 }
 
 
@@ -162,9 +163,9 @@ def evaluate(model, data_loader, args):
     tic_eval = time.time()
 
     for batch in data_loader:
-        input_ids, token_type_ids = batch
+        input_ids, token_type_ids, attention_mask = batch
         start_logits_tensor, end_logits_tensor = model(input_ids,
-                                                       token_type_ids)
+                                                       token_type_ids=token_type_ids, attention_mask=attention_mask)
 
         for idx in range(start_logits_tensor.shape[0]):
             if len(all_start_logits) % 1000 == 0 and len(all_start_logits):
@@ -251,6 +252,7 @@ def run(args):
         train_batchify_fn = lambda samples, fn=Dict({
             "input_ids": Pad(axis=0, pad_val=tokenizer.pad_token_id),
             "token_type_ids": Pad(axis=0, pad_val=tokenizer.pad_token_type_id),
+            'attention_mask': Pad(axis=0, pad_val=tokenizer.pad_token_type_id),
             "start_positions": Stack(dtype="int64"),
             "end_positions": Stack(dtype="int64")
         }): fn(samples)
@@ -288,10 +290,10 @@ def run(args):
         for epoch in range(num_train_epochs):
             for step, batch in enumerate(train_data_loader):
                 global_step += 1
-                input_ids, token_type_ids, start_positions, end_positions = batch
+                input_ids, token_type_ids, attention_mask, start_positions, end_positions = batch
 
                 logits = model(
-                    input_ids=input_ids, token_type_ids=token_type_ids)
+                    input_ids=input_ids, token_type_ids=token_type_ids, attention_mask=attention_mask)
                 loss = criterion(logits, (start_positions, end_positions))
 
                 if global_step % args.logging_steps == 0:
@@ -329,7 +331,8 @@ def run(args):
 
         dev_batchify_fn = lambda samples, fn=Dict({
             "input_ids": Pad(axis=0, pad_val=tokenizer.pad_token_id),
-            "token_type_ids": Pad(axis=0, pad_val=tokenizer.pad_token_type_id)
+            "token_type_ids": Pad(axis=0, pad_val=tokenizer.pad_token_type_id),
+            "attention_mask": Pad(axis=0, pad_val=tokenizer.pad_token_type_id)
         }): fn(samples)
 
         dev_data_loader = DataLoader(
 
@@ -88,3 +88,5 @@
 from .mobilebert.tokenizer import *
 from .chinesebert.modeling import *
 from .chinesebert.tokenizer import *
+from .funnel.modeling import *
+from .funnel.tokenizer import *
@@ -0,0 +1,2 @@
+from .modeling import *
+from .tokenizer import *
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,2 @@`
	`1`	`+from .modeling import *`
	`2`	`+from .tokenizer import *`