diff --git a/docs/source/en/model_doc/speech_to_text.mdx b/docs/source/en/model_doc/speech_to_text.mdx
index 9d855fceb480..95efc5504ff8 100644
--- a/docs/source/en/model_doc/speech_to_text.mdx
+++ b/docs/source/en/model_doc/speech_to_text.mdx
@@ -57,7 +57,7 @@ be installed as follows: `apt install libsndfile1-dev`
 >>> inputs = processor(ds[0]["audio"]["array"], sampling_rate=ds[0]["audio"]["sampling_rate"], return_tensors="pt")
 >>> generated_ids = model.generate(inputs["input_features"], attention_mask=inputs["attention_mask"])
 
->>> transcription = processor.batch_decode(generated_ids)
+>>> transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)
 >>> transcription
 ['mister quilter is the apostle of the middle classes and we are glad to welcome his gospel']
 ```
@@ -87,9 +87,9 @@ be installed as follows: `apt install libsndfile1-dev`
 ...     forced_bos_token_id=processor.tokenizer.lang_code_to_id["fr"],
 ... )
 
->>> translation = processor.batch_decode(generated_ids)
+>>> translation = processor.batch_decode(generated_ids, skip_special_tokens=True)
 >>> translation
-["<lang:fr> (Vidéo) Si M. Kilder est l'apossible des classes moyennes, et nous sommes heureux d'être accueillis dans son évangile."]
+["(Vidéo) Si M. Kilder est l'apossible des classes moyennes, et nous sommes heureux d'être accueillis dans son évangile."]
 ```
 
 See the [model hub](https://huggingface.co/models?filter=speech_to_text) to look for Speech2Text checkpoints.
diff --git a/docs/source/en/model_doc/t5.mdx b/docs/source/en/model_doc/t5.mdx
index 966d7ebd3c85..a03d02d9e464 100644
--- a/docs/source/en/model_doc/t5.mdx
+++ b/docs/source/en/model_doc/t5.mdx
@@ -285,7 +285,7 @@ The predicted tokens will then be placed between the sentinel tokens.
 >>> sequence_ids = model.generate(input_ids)
 >>> sequences = tokenizer.batch_decode(sequence_ids)
 >>> sequences
-['<pad> <extra_id_0> park offers<extra_id_1> the<extra_id_2> park.</s>']
+['<pad><extra_id_0> park offers<extra_id_1> the<extra_id_2> park.</s>']
 ```
 
 
diff --git a/src/transformers/models/speech_to_text/modeling_speech_to_text.py b/src/transformers/models/speech_to_text/modeling_speech_to_text.py
index 730e130b2f3a..0444d7ddb4eb 100755
--- a/src/transformers/models/speech_to_text/modeling_speech_to_text.py
+++ b/src/transformers/models/speech_to_text/modeling_speech_to_text.py
@@ -1334,7 +1334,7 @@ def forward(
 
         >>> generated_ids = model.generate(inputs=input_features)
 
-        >>> transcription = processor.batch_decode(generated_ids)[0]
+        >>> transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
         >>> transcription
         'mister quilter is the apostle of the middle classes and we are glad to welcome his gospel'
         ```"""
diff --git a/src/transformers/utils/doc.py b/src/transformers/utils/doc.py
index 9e3c7fce7094..a5610a32ba6b 100644
--- a/src/transformers/utils/doc.py
+++ b/src/transformers/utils/doc.py
@@ -201,7 +201,7 @@ def _prepare_output_docstrings(output_type, config_class, min_indent=None):
     >>> answer_end_index = outputs.end_logits.argmax()
 
     >>> predict_answer_tokens = inputs.input_ids[0, answer_start_index : answer_end_index + 1]
-    >>> tokenizer.decode(predict_answer_tokens)
+    >>> tokenizer.decode(predict_answer_tokens, skip_special_tokens=True)
     {expected_output}
     ```