Make CRF phase optional

mkardas · mkardas · commit 3c816edf488b · 2019-12-03T16:35:40.000+01:00
diff --git a/sota_extractor2/models/structure/structure_predictor.py b/sota_extractor2/models/structure/structure_predictor.py
@@ -42,15 +42,17 @@ def __init__(self, path, file, crf_path=None, crf_model="crf.pkl",
         self._full_learner = deepcopy(self.learner)
         self.learner.model = cut_ulmfit_head(self.learner.model)
         self.learner.loss_func = None
+
+        #todo: make CRF optional
         crf_path = Path(path) if crf_path is None else Path(crf_path)
         self.crf = load_crf(crf_path / crf_model)
 
         # todo: clean Experiment from older approaches
         self._e = ULMFiTExperiment(remove_num=False, drop_duplicates=False,
                this_paper=True, merge_fragments=True, merge_type='concat',
                evidence_source='text_highlited', split_btags=True, fixed_tokenizer=True,
-               fixed_this_paper=True, mask=False, evidence_limit=None, context_tokens=None,
-               lowercase=True)
+               fixed_this_paper=True, mask=True, evidence_limit=None, context_tokens=None,
+               lowercase=True, drop_mult=0.15, fp16=True, train_on_easy=False)
 
     def preprocess_df(self, raw_df):
         return self._e.transform_df(raw_df)
@@ -169,7 +171,11 @@ def predict_tags(self, raw_evidences, use_crf=True):
         if use_crf:
             preds = self.crf.predict(tables)
         else:
-            preds = [table[..., :n_classes].argmax(axis=-1) for table in tables]
+            preds = []
+            for table in tables:
+                p = table[..., :n_classes].argmax(axis=-1)
+                p[table[..., :n_classes].max(axis=-1) == 0.0] = n_classes
+                preds.append(p)
         return self.format_predictions(preds, ids)
 
     # todo: consider adding sota/ablation information