RNN-T loadgen program tidy-up.

G4V · G4V · commit 17b8757b8254 · 2020-09-29T14:51:29.000+01:00
diff --git a/cmdgen/benchmark.speech-recognition-loadgen/.cm/meta.json b/cmdgen/benchmark.speech-recognition-loadgen/.cm/meta.json
@@ -28,13 +28,13 @@
   "build_map": {
     "mode": {
       "accuracy": {
-        "ck_env": "--cmd_key=accuracy-bench",
+        "ck_env": "--cmd_key=accuracy",
         "output_file": "accuracy.txt",
         "recommended_dataset_size": "<<<full_dataset_size>>>",
         "recommended_verbosity": "1"
       },
       "performance": {
-        "ck_env": "--cmd_key=performance-bench",
+        "ck_env": "--cmd_key=performance",
         "output_file": "mlperf_log_summary.txt",
         "recommended_dataset_size": "<<<performance_dataset_size>>>",
         "recommended_verbosity": "0"
@@ -55,16 +55,16 @@
     },
     "scenario": {
       "multistream": {
-        "ck_env": "--env.CK_RNNT_SCENARIO=MultiStream"
+        "ck_env": "--env.CK_LOADGEN_SCENARIO=MultiStream"
       },
       "offline": {
-        "ck_env": "--env.CK_RNNT_SCENARIO=Offline"
+        "ck_env": "--env.CK_LOADGEN_SCENARIO=Offline"
       },
       "singlestream": {
-        "ck_env": "--env.CK_RNNT_SCENARIO=SingleStream"
+        "ck_env": "--env.CK_LOADGEN_SCENARIO=SingleStream"
       },
       "server": {
-        "ck_env": "--env.CK_RNNT_SCENARIO=Server"
+        "ck_env": "--env.CK_LOADGEN_SCENARIO=Server"
       }
     },
     "sut": {
diff --git a/program/speech-recognition-pytorch-loadgen/.cm/meta.json b/program/speech-recognition-pytorch-loadgen/.cm/meta.json
@@ -11,36 +11,19 @@
       "ignore_return_code": "no",
       "run_time": {
         "pre_process_via_ck": {
-          "script_name": "preprocess"
-        },
-        "run_cmd_main": "PYTHONPATH=$PYTHONPATH:$<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch $<<CK_ENV_COMPILER_PYTHON_FILE>>$ $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/run.py --dataset_dir  $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/../ --manifest $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/wav-list.json --pytorch_config_toml $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch/configs/rnnt.toml --pytorch_checkpoint $<<CK_ENV_MODEL_PYTORCH>>$/rnnt.pt  --log_dir $<<PWD>>$ --scenario $<<CK_RNNT_SCENARIO>>$ --backend $<<CK_RNNT_BACKEND>>$ --accuracy"
-      }
-    },
-    "performance": {
-      "ignore_return_code": "no",
-      "run_time": {
-        "pre_process_via_ck": {
-          "script_name": "preprocess"
-        },
-        "run_cmd_main": "PYTHONPATH=$PYTHONPATH:$<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch $<<CK_ENV_COMPILER_PYTHON_FILE>>$ $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/run.py --dataset_dir  $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/../ --manifest $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/wav-list.json --pytorch_config_toml $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch/configs/rnnt.toml --pytorch_checkpoint $<<CK_ENV_MODEL_PYTORCH>>$/rnnt.pt  --log_dir $<<PWD>>$ --scenario $<<CK_RNNT_SCENARIO>>$ --backend $<<CK_RNNT_BACKEND>>$"
-      }
-    },
-    "instr": {
-      "ignore_return_code": "no",
-      "run_time": {
-        "fine_grain_timer_file": "tmp-ck-timer.json",
-        "pre_process_via_ck": {
-          "script_name": "preprocess"
+          "data_uoa": "speech-recognition",
+          "module_uoa": "script",
+          "script_name": "loadgen_preprocess"
         },
         "post_process_via_ck": {
           "data_uoa": "speech-recognition",
           "module_uoa": "script",
           "script_name": "loadgen_postprocess"
         },
-        "run_cmd_main": "$PYTHONPATH=$PYTHONPATH:$<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch <<CK_ENV_COMPILER_PYTHON_FILE>>$ $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/run.py --dataset_dir  $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/../ --manifest $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/wav-list.json --pytorch_config_toml $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch/configs/rnnt.toml --pytorch_checkpoint $<<CK_ENV_MODEL_PYTORCH>>$/rnnt.pt  --log_dir $<<PWD>>$ --scenario $<<CK_RNNT_SCENARIO>>$ --backend $<<CK_RNNT_BACKEND>>$ --instr"
+        "run_cmd_main": "env ; $<<CK_ENV_COMPILER_PYTHON_FILE>>$ $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/run.py --dataset_dir  $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/../ --manifest $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/wav-list.json --pytorch_config_toml $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch/configs/rnnt.toml --pytorch_checkpoint $<<CK_ENV_MODEL_PYTORCH>>$/rnnt.pt  --log_dir $<<PWD>>$ --scenario $<<CK_LOADGEN_SCENARIO>>$ --backend $<<CK_RNNT_BACKEND>>$ --accuracy --mlperf_conf $<<CK_ENV_MLPERF_INFERENCE_MLPERF_CONF>>$ --user_conf $<<CK_LOADGEN_USER_CONF>>$"
       }
     },
-    "accuracy-bench": {
+    "performance": {
       "ignore_return_code": "no",
       "run_time": {
         "pre_process_via_ck": {
@@ -53,23 +36,22 @@
           "module_uoa": "script",
           "script_name": "loadgen_postprocess"
         },
-        "run_cmd_main": "PYTHONPATH=$PYTHONPATH:$<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch $<<CK_ENV_COMPILER_PYTHON_FILE>>$ $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/run.py --dataset_dir  $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/../ --manifest $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/wav-list.json --pytorch_config_toml $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch/configs/rnnt.toml --pytorch_checkpoint $<<CK_ENV_MODEL_PYTORCH>>$/rnnt.pt  --log_dir $<<PWD>>$ --scenario $<<CK_RNNT_SCENARIO>>$ --backend $<<CK_RNNT_BACKEND>>$ --accuracy --mlperf_conf $<<CK_ENV_MLPERF_INFERENCE_MLPERF_CONF>>$ --user_conf $<<CK_LOADGEN_USER_CONF>>$"
+        "run_cmd_main": "$<<CK_ENV_COMPILER_PYTHON_FILE>>$ $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/run.py --dataset_dir  $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/../ --manifest $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/wav-list.json --pytorch_config_toml $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch/configs/rnnt.toml --pytorch_checkpoint $<<CK_ENV_MODEL_PYTORCH>>$/rnnt.pt  --log_dir $<<PWD>>$ --scenario $<<CK_LOADGEN_SCENARIO>>$ --backend $<<CK_RNNT_BACKEND>>$ --mlperf_conf $<<CK_ENV_MLPERF_INFERENCE_MLPERF_CONF>>$ --user_conf $<<CK_LOADGEN_USER_CONF>>$"
       }
     },
-    "performance-bench": {
+    "instr": {
       "ignore_return_code": "no",
       "run_time": {
+        "fine_grain_timer_file": "tmp-ck-timer.json",
         "pre_process_via_ck": {
-          "data_uoa": "speech-recognition",
-          "module_uoa": "script",
           "script_name": "loadgen_preprocess"
         },
         "post_process_via_ck": {
           "data_uoa": "speech-recognition",
           "module_uoa": "script",
           "script_name": "loadgen_postprocess"
         },
-        "run_cmd_main": "PYTHONPATH=$PYTHONPATH:$<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch $<<CK_ENV_COMPILER_PYTHON_FILE>>$ $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/run.py --dataset_dir  $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/../ --manifest $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/wav-list.json --pytorch_config_toml $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch/configs/rnnt.toml --pytorch_checkpoint $<<CK_ENV_MODEL_PYTORCH>>$/rnnt.pt  --log_dir $<<PWD>>$ --scenario $<<CK_RNNT_SCENARIO>>$ --backend $<<CK_RNNT_BACKEND>>$ --mlperf_conf $<<CK_ENV_MLPERF_INFERENCE_MLPERF_CONF>>$ --user_conf $<<CK_LOADGEN_USER_CONF>>$"
+        "run_cmd_main": "<<CK_ENV_COMPILER_PYTHON_FILE>>$ $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/run.py --dataset_dir  $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/../ --manifest $<<CK_ENV_DATASET_AUDIO_PREPROCESSED_DIR>>$/wav-list.json --pytorch_config_toml $<<CK_ENV_MLPERF_INFERENCE>>$/speech_recognition/rnnt/pytorch/configs/rnnt.toml --pytorch_checkpoint $<<CK_ENV_MODEL_PYTORCH>>$/rnnt.pt  --log_dir $<<PWD>>$ --scenario $<<CK_LOADGEN_SCENARIO>>$ --backend $<<CK_RNNT_BACKEND>>$ --instr"
       }
     }
   },
@@ -246,14 +228,15 @@
   "run_vars": {
     "CK_RNNT_DATASET": "dev-clean",
     "CK_RNNT_BACKEND": "pytorch",
-    "CK_RNNT_SCENARIO": "Offline",
     "CK_RNNT_PRE_BACKEND": "pytorch",
     "CK_RNNT_PRE": "orig",
     "CK_RNNT_POST_BACKEND": "pytorch",
     "CK_RNNT_POST": "orig",
     "CK_RNNT_DEC_BACKEND": "pytorch",
     "CK_RNNT_DEC": "orig",
+    "CK_LOADGEN_SCENARIO": "Offline",
     "CK_LOADGEN_USER_CONF": "user.conf",
+    "CK_ENV_MLPERF_INFERENCE_MLPERF_CONF": "$<<CK_ENV_MLPERF_INFERENCE>>$/mlperf.conf",
     "CK_MLPERF_PRE_USER_CONF_AND_AUDIT_CONFIG": "YES"
   },
   "tags": [
diff --git a/program/speech-recognition-pytorch-loadgen/preprocess.py b/program/speech-recognition-pytorch-loadgen/preprocess.py
diff --git a/script/speech-recognition/loadgen_preprocess.py b/script/speech-recognition/loadgen_preprocess.py
@@ -45,7 +45,7 @@ def dep_env(dep, var): return i['deps'][dep]['dict']['env'].get(var)
 
     model_name = "rnnt"
     print('\n-=-=-=-=-= Generating user.conf for model "{}" ...'.format(model_name))
-    scenario            = "-"
+    scenario            = env['CK_LOADGEN_SCENARIO']
     user_conf_rel_path  = env['CK_LOADGEN_USER_CONF']
     user_conf           = []
     env_to_conf         = {
@@ -90,42 +90,7 @@ def dep_env(dep, var): return i['deps'][dep]['dict']['env'].get(var)
     return {'return':0}
 
 
-def schindler(i):
-    print('\n-=-=-=-=-= Generating a list of files to be processed...')
-    def has_env(var): return var in i['env']
-    def my_env(var): return i['env'].get(var)
-    def dep_env(dep, var): return i['deps'][dep]['dict']['env'].get(var)
-    def has_dep_env(dep, var): return var in i['deps'][dep]['dict']['env']
-
-    image_list_filename = dep_env('images', 'CK_ENV_DATASET_IMAGENET_PREPROCESSED_SUBSET_FOF')
-    source_dir          = dep_env('images', 'CK_ENV_DATASET_IMAGENET_PREPROCESSED_DIR')
-    preprocessed_ext    = dep_env('images', 'CK_ENV_DATASET_IMAGENET_PREPROCESSED_NEW_EXTENSION')
-
-    image_count         = int(my_env('CK_LOADGEN_DATASET_SIZE')) if has_env('CK_LOADGEN_DATASET_SIZE') else int(my_env('CK_BATCH_SIZE')) * int(my_env('CK_BATCH_COUNT'))
-    images_offset       = int(my_env('CK_SKIP_IMAGES') or '0')
-
-    sorted_filenames    = [filename for filename in sorted(os.listdir(source_dir)) if filename.lower().endswith('.' + preprocessed_ext) ]
-
-    selected_filenames  = sorted_filenames[images_offset:images_offset+image_count] if image_count else sorted_filenames[images_offset:]
-
-    selected_var_paths  = [ os.path.join("$<<CK_ENV_DATASET_IMAGENET_PREPROCESSED_DIR>>$", filename) for filename in selected_filenames ]
-
-    with open(image_list_filename, 'w') as f:
-        for filename in selected_filenames:
-            f.write(filename + '\n')
-
-    print('=-=-=-=-=- done.\n')
-
-    return {
-        'return': 0,
-        'new_env': {},
-        'run_input_files': [ '$<<>>$' + image_list_filename ] + selected_var_paths,
-        'run_output_files': [],
-    }
-
-
-# This preprocessing subroutine is a combination of several sequential processes,
-# but the only non-trivial output is the output of schindler(), so we call it last:
+# This preprocessing subroutine is a combination of several sequential processes.
 #
 def ck_preprocess(i):
     env=i['env']
@@ -138,8 +103,19 @@ def ck_preprocess(i):
     if env.get('CK_MLPERF_PRE_USER_CONF_AND_AUDIT_CONFIG','').lower() in ('yes', 'on', 'true', '1'):
         ret_dict = user_conf_and_audit_config(i)
 
-    if env.get('CK_MLPERF_PRE_SCHINDLER','').lower() in ('yes', 'on', 'true', '1'):
-        ret_dict = schindler(i)
+    def dep_env(dep, var): return i['deps'][dep]['dict']['env'].get(var)
+
+    inferencepath = dep_env('mlperf-inference', 'CK_ENV_MLPERF_INFERENCE')
+
+    try:
+      pythonpath = os.environ['PYTHONPATH'] + ":"
+    except KeyError:
+      pythonpath = ""
+
+    os.environ['PYTHONPATH'] = pythonpath + \
+                                 os.path.join(inferencepath,"speech_recognition/rnnt") + ":" + \
+                                 os.path.join(inferencepath,"speech_recognition/rnnt/pytorch")
+
 
     return ret_dict