fix code style

PaddlePaddle · guoshengCS · Mar 25, 2022 · Mar 10, 2022 · Mar 14, 2022 · Mar 14, 2022
commit 3555ff9386f2c1368db03b8bff6bbb99046dca42
diff --git a/examples/model_interpretation/rationale_extraction/sentiment_pred.py b/examples/model_interpretation/rationale_extraction/sentiment_pred.py
@@ -179,7 +179,11 @@ def init_lstm_var(args):
     if args.language == "ch":
         tokenizer = ErnieTokenizer.from_pretrained(args.vocab_path)
         padding_idx = tokenizer.vocab.get('[PAD]')
-        tokenizer.inverse_vocab = [item[0] for item in sorted(tokenizer.vocab.items(), key=lambda x: x[1])]
+        tokenizer.inverse_vocab = [
+            item[0]
+            for item in sorted(
+                tokenizer.vocab.items(), key=lambda x: x[1])
+        ]
     else:
         vocab = Vocab.load_vocabulary(
             args.vocab_path, unk_token='[UNK]', pad_token='[PAD]')

diff --git a/examples/model_interpretation/rationale_extraction/similarity_pred.py b/examples/model_interpretation/rationale_extraction/similarity_pred.py
@@ -164,7 +164,7 @@ def init_roberta_var(args):
         collate_fn=batchify_fn,
         return_list=True)
 
-    return model, tokenizer, dataloader
+    return model, tokenizer, dataloader, dev_ds
 
 
 def init_lstm_var(args):
@@ -197,16 +197,17 @@ def init_lstm_var(args):
         Stack(dtype="int64"),  # title_seq_lens
     ): [data for data in fn(samples)]
 
-    return model, tokenizer, batches, batchify_fn, vocab
+    return model, tokenizer, batches, batchify_fn, vocab, dev_ds
 
 
 if __name__ == "__main__":
     args = get_args()
     if args.base_model.startswith('roberta'):
-        model, tokenizer, dataloader = init_roberta_var(args)
+        model, tokenizer, dataloader, dev_ds = init_roberta_var(args)
 
     elif args.base_model == 'lstm':
-        model, tokenizer, dataloader, batchify_fn, vocab = init_lstm_var(args)
+        model, tokenizer, dataloader, batchify_fn, vocab, dev_ds = init_lstm_var(
+            args)
     else:
         raise ValueError('unsupported base model name.')
 
@@ -255,7 +256,7 @@ def init_lstm_var(args):
                     vocab._idx_to_token[idx] for idx in title_ids.tolist()[0]
                 ]
 
-            result['id'] = dataloader.dataset.data[step]['id']
+            result['id'] = dev_ds.data[step]['id']
 
             probs, atts, embedded = model.forward_interpret(*fwd_args,
                                                             **fwd_kwargs)

diff --git a/examples/model_interpretation/task/senti/run_inter_all.sh b/examples/model_interpretation/task/senti/run_inter_all.sh
@@ -13,7 +13,7 @@ for BASE_MODEL in "lstm" "roberta_base" "roberta_large";
 do
     for INTER_MODE in "attention" "integrated_gradient" "lime";
     do
-        for LANGUAGE in "ch";
+        for LANGUAGE in "ch" "en";
         do
             TASK=senti_${LANGUAGE}
             DATA=../../data/${TASK}

diff --git a/examples/model_interpretation/task/senti/saliency_map/sentiment_interpretable.py b/examples/model_interpretation/task/senti/saliency_map/sentiment_interpretable.py
@@ -171,7 +171,11 @@ def init_lstm_var(args):
     if args.language == "ch":
         tokenizer = ErnieTokenizer.from_pretrained(args.vocab_path)
         padding_idx = tokenizer.vocab.get('[PAD]')
-        tokenizer.inverse_vocab = [item[0] for item in sorted(tokenizer.vocab.items(), key=lambda x: x[1])]
+        tokenizer.inverse_vocab = [
+            item[0]
+            for item in sorted(
+                tokenizer.vocab.items(), key=lambda x: x[1])
+        ]
     else:
         vocab = Vocab.load_vocabulary(
             args.vocab_path, unk_token='[UNK]', pad_token='[PAD]')

diff --git a/examples/model_interpretation/task/similarity/saliency_map/similarity_interpretable.py b/examples/model_interpretation/task/similarity/saliency_map/similarity_interpretable.py
@@ -179,7 +179,7 @@ def init_roberta_var(args):
         collate_fn=batchify_fn,
         return_list=True)
 
-    return model, tokenizer, dataloader
+    return model, tokenizer, dataloader, dev_ds
 
 
 def init_lstm_var(args):
@@ -207,7 +207,7 @@ def init_lstm_var(args):
         Stack(dtype="int64"),  # title_seq_lens
     ): [data for data in fn(samples)]
 
-    return model, tokenizer, batches, batchify_fn, vocab
+    return model, tokenizer, batches, batchify_fn, vocab, dev_ds
 
 
 def get_seq_token_num(language):
@@ -550,9 +550,10 @@ def LIME_error_evaluation(exp_q, pred_label, probs, lime_score_total,
 if __name__ == "__main__":
     args = get_args()
     if args.base_model.startswith('roberta'):
-        model, tokenizer, dataloader = init_roberta_var(args)
+        model, tokenizer, dataloader, dev_ds = init_roberta_var(args)
     elif args.base_model == 'lstm':
-        model, tokenizer, dataloader, batchify_fn, vocab = init_lstm_var(args)
+        model, tokenizer, dataloader, batchify_fn, vocab, dev_ds = init_lstm_var(
+            args)
     else:
         raise ValueError('unsupported base model name.')
 
@@ -598,7 +599,7 @@ def LIME_error_evaluation(exp_q, pred_label, probs, lime_score_total,
                     batchify_fn=batchify_fn,
                     vocab=vocab)
 
-            result['id'] = dataloader.dataset.data[step]['id']
+            result['id'] = dev_ds.data[step]['id']
 
             probs, atts, embedded = model.forward_interpret(*fwd_args,
                                                             **fwd_kwargs)