1.16.25

yangheng95 · yangheng95 · commit ef51ffe37de9 · 2022-10-31T13:57:14.000Z
diff --git a/pyabsa/__init__.py b/pyabsa/__init__.py
@@ -7,7 +7,7 @@
 # Copyright (C) 2021. All Rights Reserved.
 
 
-__version__ = '1.16.24'
+__version__ = '1.16.25'
 
 __name__ = 'pyabsa'
 
diff --git a/pyabsa/functional/dataset/dataset_manager.py b/pyabsa/functional/dataset/dataset_manager.py
@@ -249,17 +249,17 @@ def detect_dataset(dataset_path, task='apc', load_aug=False):
                 dataset_file['valid'] += find_files(search_path, [d, 'dev', task], exclude_key=['.inference', 'train.', 'test.'] + filter_key_words + ['.ignore'])
 
         else:
-            print('Try to load {} dataset from local'.format(dataset_path))
+            print('Try to load {} dataset from local disk'.format(dataset_path))
             if load_aug:
                 dataset_file['train'] += find_files(d, ['train', task], exclude_key=['.inference', 'test.', 'valid.'] + filter_key_words)
                 dataset_file['test'] += find_files(d, ['test', task], exclude_key=['.inference', 'train.', 'valid.'] + filter_key_words)
                 dataset_file['valid'] += find_files(d, ['valid', task], exclude_key=['.inference', 'train.'] + filter_key_words)
                 dataset_file['valid'] += find_files(d, ['dev', task], exclude_key=['.inference', 'train.'] + filter_key_words)
             else:
                 dataset_file['train'] += find_cwd_files([d, 'train', task], exclude_key=['.inference', 'test.', 'valid.'] + filter_key_words + ['.ignore'])
-                dataset_file['test'] += find_cwd_files([d, 'train', task], exclude_key=['.inference', 'train.', 'valid.'] + filter_key_words + ['.ignore'])
-                dataset_file['valid'] += find_cwd_files([d, 'train', task], exclude_key=['.inference', 'train.', 'test.'] + filter_key_words + ['.ignore'])
-                dataset_file['valid'] += find_cwd_files([d, 'train', task], exclude_key=['.inference', 'train.', 'test.'] + filter_key_words + ['.ignore'])
+                dataset_file['test'] += find_cwd_files([d, 'test', task], exclude_key=['.inference', 'train.', 'valid.'] + filter_key_words + ['.ignore'])
+                dataset_file['valid'] += find_cwd_files([d, 'valid', task], exclude_key=['.inference', 'train.', 'test.'] + filter_key_words + ['.ignore'])
+                dataset_file['valid'] += find_cwd_files([d, 'valid', task], exclude_key=['.inference', 'train.', 'test.'] + filter_key_words + ['.ignore'])
 
     # # if we need train a checkpoint using as much data as possible, we can merge train, valid and test set as training sets
     # dataset_file['train'] = dataset_file['train'] + dataset_file['test'] + dataset_file['valid']
diff --git a/pyabsa/utils/pyabsa_utils.py b/pyabsa/utils/pyabsa_utils.py
@@ -215,8 +215,8 @@ def _load_word_vec(path, word2idx=None, embed_dim=300):
 
 
 def build_embedding_matrix(word2idx, embed_dim, dat_fname, opt):
-    if not os.path.exists('run'):
-        os.makedirs('run')
+    if not os.path.exists('run/{}'.format(opt.dataset_name)):
+        os.makedirs('run/{}'.format(opt.dataset_name))
     embed_matrix_path = 'run/{}'.format(os.path.join(opt.dataset_name, dat_fname))
     if os.path.exists(embed_matrix_path):
         print(colored('Loading cached embedding_matrix from {} (Please remove all cached files if there is any problem!)'.format(embed_matrix_path), 'green'))
diff --git a/release-note.json b/release-note.json
@@ -1,7 +1,10 @@
 {
-  "1.16.24": {
+  "1.16.25": {
     "1": "Improves stability of dataset search, this is the final version of the 1.16.x release"
   },
+  "1.16.24": {
+    "1": "Improves stability of dataset search"
+  },
   "1.16.23": {
     "1": "Fix the positions output of ATEPC",
     "2": "Fix a demo bug",