从此文件加载数据。 (加载为 EXCEL 或 CSV)
Load data from this file. (load as EXCEL or CSV)
EmpId Name
----------------------
E0008 Mary _Jane
EMP0009 PeterParker
10 Jack roger
EMP 0012 Mark Todd
EMP0011 John Smith
EMP13 *Peter Parker
需满足以下条件
从此文件加载数据(加载为 EXCEL 或 CSV)
加载数据时创建多个批次
加载数据时,应用以下规则
- (a) 删除名称列中多余的 space 并替换为单个 space
- (b) 在名字和姓氏之间没有 space 的地方添加 space
- (c) 在名称中,删除任何特殊字符
- (d) 在名称中,更改为标题大小写
- 在 EmpID 上删除所有特殊字符,EmpID 应为 EMP0011 格式。
下面是我的控件
load data
infile 'E:\A\Book2.csv'
TRUNCATE
PRESERVE BLANKS
into table dummy
fields terminated by ','
optionally enclosed by '"'AND'"'
(
EMPID "CASE WHEN SUBSTR(:EMPID,1,1)='E' THEN 'EMP00'||SUBSTR(:EMPID,-2) ELSE
'EMP00'||SUBSTR(:EMPID,-2) END",
NAME "INITCAP(REGEXP_REPLACE(:NAME,'[^A-Z a-z]'))"
)
我无法满足条件 2、3b、3d
看看下面的例子。
控制文件:
load data
infile *
replace
into table dummy
fields terminated by ";"
trailing nullcols
(
empid "'EMP' || lpad(regexp_substr(:empid, '[[:digit:]]+$'), 4, '0')",
name "trim(initcap(regexp_replace(regexp_replace(regexp_replace(:name, '[^[:alnum:] ]'), '([[:upper:]])', ' \1'), ' +', ' ')))"
)
begindata
E0008;Mary _Jane
EMP0009;PeterParker
10;Jack roger
EMP 0012;Mark Todd
EMP0011;John Smith
EMP13;*Peter Parker
加载会话和结果:
SQL> $sqlldr scott/tiger@kc11gt control=test32.ctl log=test32.log
SQL*Loader: Release 11.2.0.1.0 - Production on Uto Ruj 1 10:18:01 2020
Copyright (c) 1982, 2009, Oracle and/or its affiliates. All rights reserved.
Commit point reached - logical record count 5
Commit point reached - logical record count 6
SQL> select * from dummy;
EMPID NAME
---------- --------------------
EMP0008 Mary Jane
EMP0009 Peter Parker
EMP0010 Jack Roger
EMP0012 Mark Todd
EMP0011 John Smith
EMP0013 Peter Parker
6 rows selected.
SQL>
控制文件有什么作用?
对于EMPID
:因为它必须以EMP
开头,所以它被设置为一个常量。输入数据中的数字用零填充,长度最多为 4 个字符。
对于NAME
:
- 最里面的正则表达式
[^[:alnum:] ]
删除除字母数字和 spaces 之外的任何内容
- 上一级正则表达式
'([[:upper:]])', ' \1'
在每个大写字母前添加 space
- 再升级一个正则表达式
' +', ' '
将多个 space 替换为单个 space
INITCAP
将每个单词的首字母大写
TRIM
删除前导(和尾随)spaces
EmpId Name
----------------------
E0008 Mary _Jane
EMP0009 PeterParker
10 Jack roger
EMP 0012 Mark Todd
EMP0011 John Smith
EMP13 *Peter Parker
需满足以下条件
从此文件加载数据(加载为 EXCEL 或 CSV)
加载数据时创建多个批次
加载数据时,应用以下规则
- (a) 删除名称列中多余的 space 并替换为单个 space
- (b) 在名字和姓氏之间没有 space 的地方添加 space
- (c) 在名称中,删除任何特殊字符
- (d) 在名称中,更改为标题大小写
- 在 EmpID 上删除所有特殊字符,EmpID 应为 EMP0011 格式。
下面是我的控件
load data
infile 'E:\A\Book2.csv'
TRUNCATE
PRESERVE BLANKS
into table dummy
fields terminated by ','
optionally enclosed by '"'AND'"'
(
EMPID "CASE WHEN SUBSTR(:EMPID,1,1)='E' THEN 'EMP00'||SUBSTR(:EMPID,-2) ELSE
'EMP00'||SUBSTR(:EMPID,-2) END",
NAME "INITCAP(REGEXP_REPLACE(:NAME,'[^A-Z a-z]'))"
)
我无法满足条件 2、3b、3d
看看下面的例子。
控制文件:
load data
infile *
replace
into table dummy
fields terminated by ";"
trailing nullcols
(
empid "'EMP' || lpad(regexp_substr(:empid, '[[:digit:]]+$'), 4, '0')",
name "trim(initcap(regexp_replace(regexp_replace(regexp_replace(:name, '[^[:alnum:] ]'), '([[:upper:]])', ' \1'), ' +', ' ')))"
)
begindata
E0008;Mary _Jane
EMP0009;PeterParker
10;Jack roger
EMP 0012;Mark Todd
EMP0011;John Smith
EMP13;*Peter Parker
加载会话和结果:
SQL> $sqlldr scott/tiger@kc11gt control=test32.ctl log=test32.log
SQL*Loader: Release 11.2.0.1.0 - Production on Uto Ruj 1 10:18:01 2020
Copyright (c) 1982, 2009, Oracle and/or its affiliates. All rights reserved.
Commit point reached - logical record count 5
Commit point reached - logical record count 6
SQL> select * from dummy;
EMPID NAME
---------- --------------------
EMP0008 Mary Jane
EMP0009 Peter Parker
EMP0010 Jack Roger
EMP0012 Mark Todd
EMP0011 John Smith
EMP0013 Peter Parker
6 rows selected.
SQL>
控制文件有什么作用?
对于EMPID
:因为它必须以EMP
开头,所以它被设置为一个常量。输入数据中的数字用零填充,长度最多为 4 个字符。
对于NAME
:
- 最里面的正则表达式
[^[:alnum:] ]
删除除字母数字和 spaces 之外的任何内容
- 上一级正则表达式
'([[:upper:]])', ' \1'
在每个大写字母前添加 space - 再升级一个正则表达式
' +', ' '
将多个 space 替换为单个 space INITCAP
将每个单词的首字母大写TRIM
删除前导(和尾随)spaces