从此文件加载数据。 (加载为 EXCEL 或 CSV)

Load data from this file. (load as EXCEL or CSV)

EmpId      Name
----------------------                                                                                 
E0008      Mary _Jane
EMP0009    PeterParker
10         Jack roger
EMP 0012   Mark Todd
EMP0011    John Smith
EMP13      *Peter Parker

需满足以下条件

  1. 从此文件加载数据(加载为 EXCEL 或 CSV)

  2. 加载数据时创建多个批次

  3. 加载数据时,应用以下规则

    • (a) 删除名称列中多余的 space 并替换为单个 space
    • (b) 在名字和姓氏之间没有 space 的地方添加 space
    • (c) 在名称中,删除任何特殊字符
    • (d) 在名称中,更改为标题大小写
    • 在 EmpID 上删除所有特殊字符,EmpID 应为 EMP0011 格式。

下面是我的控件

load data

infile 'E:\A\Book2.csv'

TRUNCATE

PRESERVE BLANKS

into table dummy

fields terminated by ',' 

optionally enclosed by '"'AND'"'

(

 EMPID "CASE WHEN SUBSTR(:EMPID,1,1)='E' THEN 'EMP00'||SUBSTR(:EMPID,-2) ELSE 
'EMP00'||SUBSTR(:EMPID,-2) END",

 NAME "INITCAP(REGEXP_REPLACE(:NAME,'[^A-Z a-z]'))"

)

我无法满足条件 2、3b、3d

看看下面的例子。

控制文件:

load data 
infile *
replace
into table dummy
fields terminated by ";" 
trailing nullcols
(
empid "'EMP' || lpad(regexp_substr(:empid, '[[:digit:]]+$'), 4, '0')",
name  "trim(initcap(regexp_replace(regexp_replace(regexp_replace(:name, '[^[:alnum:] ]'), '([[:upper:]])', ' \1'), ' +', ' ')))"
)

begindata
E0008;Mary _Jane
EMP0009;PeterParker
10;Jack roger
EMP 0012;Mark  Todd
EMP0011;John Smith
EMP13;*Peter Parker

加载会话和结果:

SQL> $sqlldr scott/tiger@kc11gt control=test32.ctl log=test32.log

SQL*Loader: Release 11.2.0.1.0 - Production on Uto Ruj 1 10:18:01 2020

Copyright (c) 1982, 2009, Oracle and/or its affiliates.  All rights reserved.

Commit point reached - logical record count 5
Commit point reached - logical record count 6

SQL> select * from dummy;

EMPID      NAME
---------- --------------------
EMP0008    Mary Jane
EMP0009    Peter Parker
EMP0010    Jack Roger
EMP0012    Mark Todd
EMP0011    John Smith
EMP0013    Peter Parker

6 rows selected.

SQL>

控制文件有什么作用?

对于EMPID:因为它必须以EMP开头,所以它被设置为一个常量。输入数据中的数字用零填充,长度最多为 4 个字符。

对于NAME

  • 最里面的正则表达式 [^[:alnum:] ] 删除除字母数字和 spaces
  • 之外的任何内容
  • 上一级正则表达式 '([[:upper:]])', ' \1' 在每个大写字母前添加 space
  • 再升级一个正则表达式 ' +', ' ' 将多个 space 替换为单个 space
  • INITCAP 将每个单词的首字母大写
  • TRIM 删除前导(和尾随)spaces