-
Notifications
You must be signed in to change notification settings - Fork 310
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
[update][doc] Add description for item
ignoreError
- Loading branch information
Showing
1 changed file
with
25 additions
and
19 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -10,25 +10,26 @@ HDFS Writer 提供向 HDFS 文件系统指定路径中写入 `TextFile` , `ORC | |
|
||
## 参数说明 | ||
|
||
| 配置项 | 是否必须 | 数据类型 | 默认值 | 说明 | | ||
|:-----------------------| :------: |-------------| ------- | -------------------------------------------------------------------------------------------- | | ||
| path | 是 | string | 无 | 要读取的文件路径 | | ||
| defaultFS | 是 | string | 无 | 详述见下 | | ||
| fileType | 是 | string | 无 | 文件的类型,详述见下 | | ||
| fileName | 是 | string | 无 | 要写入的文件名,用于当作前缀 | | ||
| column | 是 | `list<map>` | 无 | 写入的字段列表 | | ||
| writeMode | 是 | string | 无 | 写入模式,详述见下 | | ||
| skipTrash | 否 | boolean | false | 是否跳过垃圾回收站,和 `writeMode` 配置相关详见下面描述 | | ||
| fieldDelimiter | 否 | string | `,` | 文本文件的字段分隔符,二进制文件不需要指定该项 | | ||
| encoding | 否 | string | `utf-8` | 文件的编码配置, 目前仅支持 `utf-8` | | ||
| nullFormat | 否 | string | 无 | 定义表示为空的字符,例如如果用户配置: `"\\N"` ,那么如果源头数据是 `"\N"` ,视作 `null` 字段 | | ||
| haveKerberos | 否 | boolean | false | 是否启用 Kerberos 认证,如果启用,则需要同时配置以下两项 | | ||
| kerberosKeytabFilePath | 否 | string | 无 | 用于 Kerberos 认证的凭证文件路径, 比如 `/your/path/addax.service.keytab` | | ||
| kerberosPrincipal | 否 | string | 无 | 用于 Kerberos 认证的凭证主体, 比如 `addax/[email protected]` | | ||
| compress | 否 | string | 无 | 文件的压缩格式,详见下文 | | ||
| hadoopConfig | 否 | map | 无 | 里可以配置与 Hadoop 相关的一些高级参数,比如HA的配置 | | ||
| preShell | 否 | `list` | 无 | 写入数据前执行的shell命令,比如 `hive -e "truncate table test.hello"` | | ||
| postShell | 否 | `list` | 无 | 写入数据后执行的shell命令,比如 `hive -e "select count(1) from test.hello"` | | ||
| 配置项 | 是否必须 | 数据类型 | 默认值 | 说明 | | ||
|:-----------------------| :------: |-------------| ------- |------------------------------------------------------------------------------| | ||
| path | 是 | string | 无 | 要读取的文件路径 | | ||
| defaultFS | 是 | string | 无 | 详述见下 | | ||
| fileType | 是 | string | 无 | 文件的类型,详述见下 | | ||
| fileName | 是 | string | 无 | 要写入的文件名,用于当作前缀 | | ||
| column | 是 | `list<map>` | 无 | 写入的字段列表 | | ||
| writeMode | 是 | string | 无 | 写入模式,详述见下 | | ||
| skipTrash | 否 | boolean | false | 是否跳过垃圾回收站,和 `writeMode` 配置相关详见下面描述 | | ||
| fieldDelimiter | 否 | string | `,` | 文本文件的字段分隔符,二进制文件不需要指定该项 | | ||
| encoding | 否 | string | `utf-8` | 文件的编码配置, 目前仅支持 `utf-8` | | ||
| nullFormat | 否 | string | 无 | 定义表示为空的字符,例如如果用户配置: `"\\N"` ,那么如果源头数据是 `"\N"` ,视作 `null` 字段 | | ||
| haveKerberos | 否 | boolean | false | 是否启用 Kerberos 认证,如果启用,则需要同时配置以下两项 | | ||
| kerberosKeytabFilePath | 否 | string | 无 | 用于 Kerberos 认证的凭证文件路径, 比如 `/your/path/addax.service.keytab` | | ||
| kerberosPrincipal | 否 | string | 无 | 用于 Kerberos 认证的凭证主体, 比如 `addax/[email protected]` | | ||
| compress | 否 | string | 无 | 文件的压缩格式,详见下文 | | ||
| hadoopConfig | 否 | map | 无 | 里可以配置与 Hadoop 相关的一些高级参数,比如HA的配置 | | ||
| preShell | 否 | `list` | 无 | 写入数据前执行的shell命令,比如 `hive -e "truncate table test.hello"` | | ||
| postShell | 否 | `list` | 无 | 写入数据后执行的shell命令,比如 `hive -e "select count(1) from test.hello"` | | ||
| ignoreError | 否 | boolean | false | 是否忽略`preShell`, `postShell` 命令的错误 | | ||
|
||
### path | ||
|
||
|
@@ -130,6 +131,11 @@ Hadoop hdfs 文件系统 namenode 节点地址。格式:`hdfs://ip:port` ; | |
引入 `preShell` 与 `postShell` 的目的是为了在写入数据前后执行一些额外的操作,比如在写入数据前清空表,写入数据后查询表的行数等。一个典型的生产环境场景时,采集的数据按日分区保存在 HDFS 上, | ||
采集之前需要创建分区,这样就可以通过配置 `preShell` 来实现,比如 `hive -e "alter table test.hello add partition(dt='${logdate}')"` | ||
|
||
### ignoreError | ||
|
||
该配置项用于控制是否忽略 `preShell` 和 `postShell` 命令的错误,如果配置为 `true`,则在执行 `preShell` 和 `postShell` 命令时,如果命令执行失败,不会导致任务失败,而是会打印错误日志,继续执行任务。 | ||
否则,如果配置为 `false`,则在执行 `preShell` 和 `postShell` 命令时,如果命令执行失败,会导致任务失败。 | ||
|
||
## 类型转换 | ||
|
||
| Addax 内部类型 | HIVE 数据类型 | | ||
|