add viterbi_decode and ViterbiDecoder cn docs (PaddlePaddle#3974)

* add crf_decode and ViterbiDecoder cn docs * fix doc for viterbi include_start_end_tag * remove line * sequence_length->lengths * crf_decode->viterbi_decode; include_start_end_tag->include_bos_eos_tag * paddle.text.ops.viterbi_decode->paddle.text.viterbi_decode * fix reference
haohongxiang · Oct 21, 2021 · f0d0e50 · f0d0e50
1 parent fe064df
commit f0d0e50
Show file tree

Hide file tree

Showing 2 changed files with 78 additions and 0 deletions.
diff --git a/docs/api/paddle/text/ViterbiDecoder_cn.rst b/docs/api/paddle/text/ViterbiDecoder_cn.rst
@@ -0,0 +1,41 @@
+.. _cn_api_paddle_text_ViterbiDecoder:
+
+ViterbiDecoder
+-------------------------------
+.. py:class:: paddle.text.ViterbiDecoder(transitions, include_bos_eos_tag=True, name=None)
+
+该接口用于构建一个 ``ViterbiDecoder`` 类的可调用对象。请参见 :ref:`cn_api_paddle_text_viterbi_decode` API。
+
+参数
+:::::::::
+    - **transitions (Tensor)** 转移概率。形状为[num_tags, num_tags]，数据类型为float32或float64。
+    - **include_bos_eos_tag (bool, 可选)** 是否包含前置、后置标签。如果设为True，**transition_params** 中倒数第一列为前置标签的转移概率，倒数第二列为后置标签的转移概率。默认值为True。
+    - **name (str, 可选）** 默认值为None。一般用户无需设置，具体用法请参见 :ref:`api_guide_Name` 。
+
+形状
+:::::::::
+    - **potentials (Tensor)** 发射概率。形状为[batch_size, sequence_length, num_tags]，数据类型为float32或float64。
+    - **lengths (Tensor)** 序列真实长度。形状为[batch_size]，数据类型为int64。
+
+返回
+:::::::::
+    - **scores (Tensor)** Viterbi路径的最高得分。形状为[batch_size]，数据类型为float32或float64。
+    - **paths (Tensor)** Viterbi路径。形状为[batch_size, sequence_length]，数据类型为int64。
+
+代码示例
+:::::::::
+
+.. code-block:: python
+
+   import numpy as np
+   import paddle
+   paddle.seed(102)
+   batch_size, seq_len, num_tags = 2, 4, 3
+   emission = paddle.rand((batch_size, seq_len, num_tags), dtype='float32')
+   length = paddle.randint(1, seq_len + 1, [batch_size])
+   tags = paddle.randint(0, num_tags, [batch_size, seq_len])
+   transition = paddle.rand((num_tags, num_tags), dtype='float32')
+   decoder = paddle.text.ViterbiDecoder(transition, include_bos_eos_tag=False)
+   scores, path = decoder(emission, length)
+   # scores: Tensor(shape=[2], dtype=float32, place=CUDAPlace(0), stop_gradient=True, [3.37089300, 1.56825531])
+   # path: Tensor(shape=[2, 3], dtype=int64, place=CUDAPlace(0), stop_gradient=True, [[1, 0, 0], [1, 1, 0]])
diff --git a/docs/api/paddle/text/viterbi_decode_cn.rst b/docs/api/paddle/text/viterbi_decode_cn.rst
@@ -0,0 +1,37 @@
+.. _cn_api_paddle_text_viterbi_decode:
+
+viterbi_decode
+-------------------------------
+.. py:function:: paddle.text.viterbi_decode(potentials, transition_params, lengths, include_bos_eos_tag=True, name=None)
+
+该层利用输入的发射概率和转移概率进行解码。通过用Viterbi算法，动态地寻找隐藏状态最可能的序列，该序列也被称为 Viterbi 路径（Viterbi path），从而得到观察标签 (tags) 序列。
+
+参数
+:::::::::
+    - **potentials (Tensor)** 发射概率。形状为[batch_size, lengths, num_tags]，数据类型为float32或float64。
+    - **transition_params (Tensor)** 转移概率。形状为[num_tags, num_tags]，数据类型为float32或float64。
+    - **lengths (Tensor)** 序列真实长度。形状为[batch_size]，数据类型为int64。
+    - **include_bos_eos_tag (bool, 可选)** 是否包含前置、后置标签。如果设为True，**transition_params** 中倒数第一列为前置标签的转移概率，倒数第二列为后置标签的转移概率。默认值为True。
+    - **name (str, 可选）** 默认值为None。一般用户无需设置，具体用法请参见 :ref:`api_guide_Name` 。
+
+返回
+:::::::::
+    - **scores (Tensor)** Viterbi路径的最高得分。形状为[batch_size]，数据类型为float32或float64。
+    - **paths (Tensor)** Viterbi路径。形状为[batch_size, lengths]，数据类型为int64。
+
+代码示例
+:::::::::
+
+..  code-block:: python
+
+    import numpy as np
+    import paddle
+    paddle.seed(102)
+    batch_size, seq_len, num_tags = 2, 4, 3
+    emission = paddle.rand((batch_size, seq_len, num_tags), dtype='float32')
+    length = paddle.randint(1, seq_len + 1, [batch_size])
+    tags = paddle.randint(0, num_tags, [batch_size, seq_len])
+    transition = paddle.rand((num_tags, num_tags), dtype='float32')
+    scores, path = paddle.text.viterbi_decode(emission, transition, length, False)
+    # scores: Tensor(shape=[2], dtype=float32, place=CUDAPlace(0), stop_gradient=True, [3.37089300, 1.56825531])
+    # path: Tensor(shape=[2, 3], dtype=int64, place=CUDAPlace(0), stop_gradient=True, [[1, 0, 0], [1, 1, 0]])