PaddlePaddle · sijunhe · May 8, 2024 · Apr 30, 2024 · Apr 30, 2024
diff --git a/pipelines/utils/offline_ann.py b/pipelines/utils/offline_ann.py
@@ -13,6 +13,7 @@
 # limitations under the License.
 
 import argparse
+import time
 
 from pipelines.document_stores import (
     BaiduElasticsearchDocumentStore,
@@ -139,7 +140,12 @@ def offline_ann(index_name, doc_dir):
         use_gpu=use_gpu,
         embed_title=args.embed_title,
     )
-
+    # Writing docs may take a while. so waitting until writing docs to be completed.
+    document_count = document_store.get_document_count()
+    while document_count == 0:
+        time.sleep(1)
+        print("Waiting for writing docs to be completed.")
+        document_count = document_store.get_document_count()
     # 建立索引库
     document_store.update_embeddings(retriever)
 

diff --git a/pipelines/utils/offline_ann_mm.py b/pipelines/utils/offline_ann_mm.py
@@ -14,6 +14,7 @@
 
 import argparse
 import os
+import time
 
 from pipelines.document_stores import ElasticsearchDocumentStore, MilvusDocumentStore
 from pipelines.nodes import MultiModalRetriever
@@ -93,7 +94,12 @@ def offline_ann(index_name, doc_dir):
             query_type="image",
             document_embedding_models={"text": args.document_embedding_model},
         )
-
+    # Writing docs may take a while. so waitting until writing docs to be completed.
+    document_count = document_store.get_document_count()
+    while document_count == 0:
+        time.sleep(1)
+        print("Waiting for writing docs to be completed.")
+        document_count = document_store.get_document_count()
     # 建立索引库
     document_store.update_embeddings(retriever_mm)