Skip to content

Commit

Permalink
[update][docs] improve the document
Browse files Browse the repository at this point in the history
  • Loading branch information
wgzhao committed Aug 30, 2024
1 parent 69bb958 commit 9176bcb
Show file tree
Hide file tree
Showing 33 changed files with 335 additions and 341 deletions.
4 changes: 2 additions & 2 deletions docs/writer/accesswriter.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
# Access Writer

AccessWriter 插件实现了写入数据到 [Access][1] 目的表的功能。
Access Writer 插件实现了写入数据到 [Access](https://en.wikipedia.org/wiki/Microsoft_Access) 目的表的功能。

## 示例

Expand Down Expand Up @@ -30,4 +30,4 @@ bin/addax.sh job/stream2access.json

## 参数说明

AccessWriter 基于 [rdbmswriter](../rdbmswriter) 实现,因此可以参考 rdbmswriter 的所有配置项。
该插件基于 [RDBMS Writer](../rdbmswriter) 实现,因此可以参考 RDBMS Writer 的所有配置项。
38 changes: 23 additions & 15 deletions docs/writer/cassandrawriter.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
# Cassandra Writer

CassandraWriter 插件用于向 [Cassandra](https://cassandra.apache.org) 写入数据。
Cassandra Writer 插件用于向 [Cassandra](https://cassandra.apache.org) 写入数据。

## 配置样例

Expand All @@ -14,20 +14,28 @@ CassandraWriter 插件用于向 [Cassandra](https://cassandra.apache.org) 写入

## 参数说明

| 配置项 | 是否必须 | 默认值 | 描述 |
| :---------------------- | :------: | ------------ | --------------------------------------------------------------------------------------------------------------------------- |
| host ||| Cassandra 连接点的域名或 ip,多个 node 之间用逗号分隔 |
| port || 9042 | Cassandra 端口 |
| username ||| 数据源的用户名 |
| password ||| 数据源指定用户名的密码 |
| useSSL || false | 是否使用 SSL 连接 |
| connectionsPerHost || 8 | 客户端连接池配置:与服务器每个节点建多少个连接 |
| maxPendingPerConnection || 128 | 客户端连接池配置:每个连接最大请求数 |
| keyspace ||| 需要同步的表所在的 keyspace |
| table ||| 所选取的需要同步的表 |
| column ||| 所配置的表中需要同步的列集合,内容可以是列的名称或 `writetime()`。如果将列名配置为 `writetime()`,会将这一列的内容作为时间戳 |
| consistancyLevel || LOCAL_QUORUM | 数据一致性级别, 可选 `ONE, QUORUM, LOCAL_QUORUM, EACH_QUORUM, ALL, ANY, TWO, THREE, LOCAL_ONE` |
| batchSize || 1 | 一次批量提交(UNLOGGED BATCH)的记录数大小(条数) |
| 配置项 | 是否必须 | 数据类型 | 默认值 | 描述 |
| :---------------------- | :------: | -------- | -------------- | ------------------------------------------------ |
| host || string || 连接点的域名或 ip,多个 node 之间用逗号分隔 |
| port || int | 9042 | Cassandra 端口 |
| username || string || 数据源的用户名 |
| password || string || 数据源指定用户名的密码 |
| useSSL || boolean | false | 是否使用 SSL 连接 |
| connectionsPerHost || int | 8 | 客户端连接池配置:与服务器每个节点建多少个连接 |
| maxPendingPerConnection || int | 128 | 客户端连接池配置:每个连接最大请求数 |
| keyspace || string || 需要同步的表所在的 keyspace |
| table || string || 所选取的需要同步的表 |
| column || list || 所配置的表中需要同步的列集合 |
| consistancyLevel || string | `LOCAL_QUORUM` | 数据一致性级别, |
| batchSize || int | 1 | 一次批量提交(UNLOGGED BATCH)的记录数大小(条数) |

### column

内容可以是列的名称或 `writetime()`。如果将列名配置为 `writetime()`,会将这一列的内容作为时间戳

### consistancyLevel

可选 `ONE, QUORUM, LOCAL_QUORUM, EACH_QUORUM, ALL, ANY, TWO, THREE, LOCAL_ONE`

## 类型转换

Expand Down
4 changes: 2 additions & 2 deletions docs/writer/clickhousewriter.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
# ClickHouse Writer

ClickHouseWriter 插件用于向 [ClickHouse](https://clickhouse.tech) 写入数据。
ClickHouse Writer 插件用于向 [ClickHouse](https://clickhouse.tech) 写入数据。

## 示例

Expand Down Expand Up @@ -42,4 +42,4 @@ bin/addax.sh job/clickhouse2clickhouse.json

## 参数说明

ClickHouseWriter 基于 [rdbmswriter](../rdbmswriter) 实现,因此可以参考 rdbmswriter 的所有配置项。
该插件基于 [RDBMS Writer](../rdbmswriter) 实现,因此可以参考 RDBMS Writer 的所有配置项。
13 changes: 6 additions & 7 deletions docs/writer/databendwriter.md
Original file line number Diff line number Diff line change
Expand Up @@ -36,17 +36,16 @@ bin/addax.sh job/stream2Databend.json

## 参数说明

DatabendWriter 基于 [rdbmswriter](../rdbmswriter) 实现,因此可以参考 rdbmswriter 的所有配置项并增加了如下配置项:
该插件基于 [RDBMS Writer](../rdbmswriter) 实现,因此可以参考 RDBMS Writer 的所有配置项, 并增加了如下配置项:

| 配置项 | 是否必须 | 类型 | 默认值 | 描述 |
| :--------------- | :------: | ------ | -------- | ------------------------------------------------------------------------ |
| writeMode || string | `insert` | 写入模式,支持 insert 和 replace 两种模式,默认为 insert。 |
| onConflictColumn || string || 冲突列,当 writeMode 为 replace 时,必须指定冲突列,否则会导致写入失败。 |
| 配置项 | 是否必须 | 类型 | 默认值 | 描述 |
| :--------------- | :------: | ------ | -------- | -------------------------------------------------------------------------- |
| writeMode || string | `insert` | 写入模式,支持 `insert``replace` 两种模式 |
| onConflictColumn || string || 冲突列,当 writeMode 为 `replace` 时,必须指定冲突列,否则会导致写入失败。 |

### writeMode

该参数为 `4.1.2` 版本引入,用来支持 Databend 的 `replace into` 语法,当该参数设定为 `replace`
时,必须同时指定 `onConflictColumn` 参数,用来判断数据是插入还是更新的依据。
用来支持 Databend 的 `replace into` 语法,当该参数设定为 `replace` 时,必须同时指定 `onConflictColumn` 参数,用来判断数据是插入还是更新的依据。

两个参数的示例如下:

Expand Down
20 changes: 10 additions & 10 deletions docs/writer/dbfwriter.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
# DBF Writer

DbfWriter 提供了向本地文件写入类dbf格式的一个或者多个表文件。
Dbf Writer 提供了向本地文件写入类dbf格式的一个或者多个表文件。

## 配置样例

Expand All @@ -10,15 +10,15 @@ DbfWriter 提供了向本地文件写入类dbf格式的一个或者多个表文

## 参数说明

| 配置项 | 是否必须 | 默认值 | 描述 |
| :--------- | :------: | ------ | ------------------------------------------------------------------------------------------------ |
| path || | DBF文件目录,注意这里是文件夹,不是文件 |
| column || | 所配置的表中需要同步的列集合, 是 `{type: value}``{type: index}` 的集合 |
| fileName || | DbfFileWriter写入的文件名 |
| writeMode ||| DbfFileWriter写入前数据清理处理模式,支持 `truncate`, `append`, `nonConflict` 三种模式,详见如下 |
| encoding || UTF-8 | DBF文件编码,比如 `GBK`, `UTF-8` |
| nullFormat || `\N` | 定义哪个字符串可以表示为null, |
| dateFormat ||| 日期类型的数据序列化到文件中时的格式,例如 `"dateFormat": "yyyy-MM-dd"` |
| 配置项 | 是否必须 | 数据类型 | 默认值 | 描述 |
| :--------- | :------: | ----------- | ------ | --------------------------------------------------------- |
| path || string | | 文件目录,注意这里是文件夹,不是文件 |
| column || `list<map>` | | 所配置的表中需要同步的列集合,详见示例配置 |
| fileName || string | | 写入的文件名 |
| writeMode || string | | 写入前数据清理处理模式,详见下面描述 |
| encoding || string | UTF-8 | 文件编码,比如 `GBK`, `UTF-8` |
| nullFormat || string | `\N` | 定义哪个字符串可以表示为null, |
| dateFormat || string | | 日期类型的数据序列化到文件中时的格式,例如 `"yyyy-MM-dd"` |

### writeMode

Expand Down
33 changes: 17 additions & 16 deletions docs/writer/doriswriter.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@ DorisWriter 插件用于向 [Doris](http://doris.incubator.apache.org/master/zh-
Doris http 连接(8030),然后通过 [stream load](http://doris.incubator.apache.org/master/zh-CN/administrator-guide/load-data/stream-load-manual.html)
加载数据到数据中,相比 `insert into` 方式效率要高不少,也是官方推荐的生产环境下的数据加载方式。

Doris 是一个兼容 MySQL 协议的数据库后端,因此 Doris 读取可以使用 [MySQLReader](../../reader/mysqlreader) 进行访问。
Doris 是一个兼容 MySQL 协议的数据库后端,因此 Doris 读取可以使用 [MySQL Reader](../../reader/mysqlreader) 进行访问。

## 示例

Expand Down Expand Up @@ -46,21 +46,22 @@ bin/addax.sh job/stream2doris.json

## 参数说明

| 配置项 | 是否必须 | 类型 | 默认值 | 描述 |
|:-----------------|:----:|--------|-------|-----------------------------------------------------|
| loadUrl || string || Stream Load 的连接目标 | |
| username || string || 访问Doris数据库的用户名 |
| password || string || 访问Doris数据库的密码 |
| flushInterval || int | 3000 | 数据写入到目标表的间隔时间,单位为毫秒,即每隔多少毫秒写入一次数据 |
| flushQueueLength || int | 1 | 上传数据的队列长度 |
| table || string || 所选取的需要同步的表名 |
| column || list || 所配置的表中需要同步的列名集合,详细描述见 [rdbmswriter](../rdbmswriter) |
| batchSize || int | 2048 | 每批次导入数据的最大行数 |
| loadProps || map | `csv` | streamLoad 的请求参数,详情参照[StreamLoad介绍页面][1] |
| preSqL || list | | 写入数据到目标表前要执行的 SQL 语句 |
| postSqL || list | | 数据写完后要执行的 SQL 语句 |

[1]: https://github.com/apache/doris-streamloader/tree/master
| 配置项 | 是否必须 | 类型 | 默认值 | 描述 |
| :--------------- | :------: | ------ | ------ | ------------------------------------------------------------------ |
| loadUrl || string || Stream Load 的连接目标 | |
| username || string || 访问Doris数据库的用户名 |
| password || string || 访问Doris数据库的密码 |
| flushInterval || int | 3000 | 数据写入到目标表的间隔时间,单位为毫秒,即每隔多少毫秒写入一次数据 |
| flushQueueLength || int | 1 | 上传数据的队列长度 |
| table || string || 所选取的需要同步的表名 |
| column || list || 所配置的表中需要同步的列名集合,详细描述见 [RBDMS Writer][1] |
| batchSize || int | 2048 | 每批次导入数据的最大行数 |
| loadProps || map | `csv` | streamLoad 的请求参数,详情参照[StreamLoad介绍页面][2] |
| preSql || list | | 写入数据到目标表前要执行的 SQL 语句 |
| postSql || list | | 数据写完后要执行的 SQL 语句 |

[1]: ../rdbmswriter
[2]: https://github.com/apache/doris-streamloader/tree/master

## loadUrl

Expand Down
Loading

0 comments on commit 9176bcb

Please sign in to comment.