数据类型格式化函数

OushuDB 格式化函数提供了一套有效的工具用于将多种数据类型(日期/时间,整型,浮点数,数值)转换为格式化的字符串和将格式化的字符串转换成特定数据类型。下表列出了它们,这些函数都遵循一个常用的调用习惯:第一个参数是要被格式化的值,第二个参数是定义输入或输出格式的模版。

to_timestamp 函数接受一个double precision 参数,并从Unix 纪元转化为timestamp with time zone.(Integer类型的Unix纪元隐含的转换为double precision类型。)

表.格式化函数

函数 返回类型 描述 例子
to_char(timestamp, text) text 把时间戳转换成字符串 to_char(current_timestamp, ‘HH12:MI:SS’)
to_char(interval, text) text 把时间间隔转为字符串 to_char(interval ‘15h 2m 12s’, ‘HH24:MI:SS’)
to_char(int, text) text 把整数转换成字符串 to_char(125, ‘999’)
to_char(double precision, text) text 把实数/双精度数转换成字符串 to_char(125.8::real, ‘999D9’)
to_char(numeric, text) text 把数字转换成字符串 to_char(-125.8, ‘999D99S’)
to_date(text, text) date 把字符串转换成日期 to_date(‘05 Dec 2000’, ‘DD Mon YYYY’)
to_number(text, text) numeric 把字符串转换成数字 to_number(‘12,454.8-‘, ‘99G999D9S’)
to_timestamp(text, text) timestamp with time zone 把字符串转换成时间戳 to_timestamp(‘05 Dec 2000’, ‘DD Mon YYYY’)
to_timestamp(double precision) timestamp with time zone 把 Unix 纪元转换成时间戳 to_timestamp(200120400)

在to_char输出模板字符串里,该函数族可以识别一些特定的模式, 并且把给定的数值正确地格式化成相应的数据。任何不属于模板模式的文本都简单地逐字拷贝。 同样,在一个输入模板字符串里(除to_char外的其他函数),模板模式标识数值由输入数据字符串提供。

下表显示了可以用于格式化日期和时间值的模版。

表.用于日期/时间格式化的模式

模版 描述
HH 一天的小时数(01-12)
HH12 一天的小时数(01-12)
HH24 一天的小时数(00-23)
MI 分钟(00-59)
SS 秒(00-59)
MS 毫秒(000-999)
US 微秒(000000-999999)
SSSS 午夜后的秒(0-86399)
AM or A.M. or PM or P.M 正午指示器(大写)
am or a.m. or pm or p.m. 正午指示器(小写)
Y,YYY 带逗号的年(4 和更多位)
YYYY 年(4 和更多位)
YYY 年的后三位
YY 年的后两位
Y 年的最后一位
IYYY ISO年(4 位或更多位)
IYY ISO年的最后三位
IY ISO年的最后两位
I ISO年的最后一位
BC or B.C. or AD or A.D. 纪元标识(大写)
bc or b.c. or ad or a.d. 纪元标识(小写)
MONTH 全长大写月份名(空白填充为 9 字符)
Month 全混合大小写月份名(空白填充为 9 字符)
month 全长小写月份名(空白填充为 9 字符)
MON 大写缩写月份名(英文3 字符,本地化的长度不同)
Mon 混合大小写缩写月份名(英文3 字符,本地化的长度不同)
mon 小写缩写月份名(英文3 字符,本地化的长度不同)
MM 月份数(01-12)
DAY 全长大写日期名(空白填充为 9 字符)
Day 全长混合大小写日期名(空白填充为 9 字符
day 全长小写日期名(空白填充为 9 字符)
DY 缩写大写日期名(英文3 字符,本地化长度不同)
Dy 缩写混合大小写日期名(英文3 字符,本地化长度不同)
dy 缩写小写日期名(英文3 字符,本地化长度不同)
DDD 一年里的日(001-366)
IDDD ISO一年里的日(001-371;年的第一天是第一个ISO周的星期一)
DD 一个月里的日(01-31)
D 一周里的日,星期日(1)到星期六(7)
W 一个月里的周数(1-5)(第一周从该月第一天开始)
WW 一年里的周数(1-53)(第一周从该年的第一天开始)
IW ISO一年里的周数(01-53;第一个星期四在第一周里)
CC 世纪(2 位)(20 世纪从 2001-01-01 开始)
J 儒略日(自公元前 4714 年 11 月 24日午夜来的天数)
Q 季度
RM 罗马数字的月份(I-XII ;I=January)(大写)
rm 罗马数字的月份(i-xii ;i=January)(小写)
TZ 时区名(大写)
tz 时区名(小写)

有一些修饰词可以应用于模板来修改它们的行为。比如,FMMonth 就是带着FM前缀的Month模式。下表显示了用于日期/时间格式化的修饰词模式。

表.日期/时间格式化的模板模式修饰词

修饰词 描述 例子
FM 前缀 填充模式(抑制填充空白和尾随零) FMMonth
TH 后缀 大写顺序数后缀 DDTH
th 后缀 小写顺序数后缀 DDth
FX 前缀 固定格式全局选项(见用法须知) FX Month DD Day
TM 前缀 翻译模式(基于lc_time显示本地化的日期和月份名) TMMonth
SP 后缀 拼写模式(尚未实现) DDSP

日期/时间格式化的用法须知:

  • FM抑制前导的零或尾随的空白。如果没有使用它的话, 会在输出中增加这些填充最终把输出变成固定宽度的模式。

  • TM不包含结尾空白。

  • 如果没有使用FX,to_timestamp和to_date 在转换字符串的时候忽略多个空白。FX必须做为模板里的第一个项声明。

  • 在to_char模板里可以有普通文本,并且它们会被逐字输出。你可以把一个字符串放到双引号里强迫它解释成一个文本,即使它里面包含模式关键字也如此。 比如‘“Hello Year “YYYY’中的YYYY将被年份数据代替, 但是Year里单独的Y不会。

  • 如果你想在输出里有双引号,那么你必须在它们前面放反斜杠,比如E’\ "YYYY Month\ "’. (两个反斜杠是必要的,因为反斜杠在转义语法中已经有特殊的含义了。)

  • 如果你使用的年份长于4位字符,那么用YYYY从字符串向timestamp 或date做转换时要受到限制。你必须在YYYY 后面使用一些非数字字符或者模板,否则年份总是解释为 4 位数字。比如对于 20000 年: to_date(‘200001131’, ‘YYYYMMDD’)将会被解释成一个 4 位数字的年份, 最好在年后面使用一个非数字的分隔符,像to_date(‘20000-1131’, ‘YYYY-MMDD’) 或to_date(‘20000Nov31’, ‘YYYYMonDD’)。

  • 在从字符串向timestamp或date转换的时候,如果有YYY, YYYY或Y,YYY字段,那么CC字段会被忽略。 如果CC与YY或Y一起使用, 那么年份按照(CC-1)*100+YY 计算。

  • 将字符串转化为timestamp时,毫秒(MS)和微秒(US) 都是用小数点后面的位数转换的。比如to_timestamp(‘12:3’, ‘SS:MS’)中的‘3’不是 3 毫秒, 而是 300 毫秒,因为转换把它看做 12+0.3 秒。这意味着对于格式SS:MS 而言,输入值12:3,12:30,12:300 声明了相同的毫秒数。对于 3 毫秒,你必须使用12:003, 那么转换会把它看做 12+0.003 = 12.003 秒。

    这个更复杂的例子to_timestamp(‘15:12:02.020.001230’, ‘HH:MI:SS.MS.US’) 是 15小时、12分钟、2秒+20毫秒+1230微秒 = 2.021230秒。

  • to_char 的星期编号(见’D’ 格式化模版)与extract 函数不同。

  • to_char(interval)将HH 和HH12 格式化为一天的小时,然而HH24 能够输出超过一天的小时数,例如> 24.

下表显示了用于数值格式化的模板模式。

表.数值格式化的模板模式

模式 描述
9 带有指定数值位数的值
0 带前导零的值
.(句号) 小数点
,(逗号) 分组(千)分隔符
PR 尖括号内负值
S 带符号的数值(使用区域设置)
L 货币符号(使用区域设置)
D 小数点(使用区域设置)
G 分组分隔符(使用区域设置)
MI 在指明的位置的负号(如果数字 < 0)
PL 在指明的位置的正号(如果数字 > 0)
SG 在指明的位置的正/负号
RN 罗马数字(输入在 1 和 3999 之间)
TH or th 序数后缀
V 移动指定位(小数)(参阅注解)
EEEE 科学计数法(尚未实现)

数值格式化的用法须知:

  • 使用SG, PL, MI 生成的符号并不挂在数字上面;比如,to_char(-12, ‘MI9999’) 生成’-12’;但是to_char(-12, ‘S9999’) ‘-12’。Oracle里的实现不允许在9 前面使用MI,而是要求9在MI前面。
  • 9声明和9的个数相同的数字位数的数值。 如果某个数值位没有数字,则输出一个空白。
  • TH不会转换小于零的数值,也不会转换小数。
  • PL, SG, TH 是OushuDB 的扩展。
  • V方便地把输入值乘以 10^n, 这里n是跟在V后面的数字位数。to_char不支持把V 与一个小数点组合在一起使用(也就是说99.9V99是不允许的)。

下表显示了使用to_char 函数的一些例子。

表.to_char 示例

表达式 结果
to_char(current_timestamp, ‘Day, DD HH12:MI:SS’) ‘Tuesday , 06 05:39:18’
to_char(current_timestamp, ‘FMDay, FMDD HH12:MI:SS’) ‘Tuesday, 6 05:39:18’
to_char(-0.1, ‘99.99’) ‘ -.10’
to_char(-0.1, ‘FM9.99’) ‘-.1’
to_char(0.1, ‘0.9’) ‘ 0.1’
to_char(12, ‘9990999.9’) ‘ 0012.0’
to_char(12, ‘FM9990999.9’) ‘0012.’
to_char(485, ‘999’) ‘ 485’
to_char(-485, ‘999’) ‘-485’
to_char(485, ‘9 9 9’) ‘ 4 8 5’
to_char(1485, ‘9,999’) ‘ 1,485’
to_char(1485, ‘9G999’) ‘ 1,485’
to_char(148.5, ‘999.999’) ‘ 148.500’
to_char(148.5, ‘FM999.999’) ‘148.5’
to_char(148.5, ‘FM999.990’) ‘148.500’
to_char(148.5, ‘999D999’) ‘ 148,500’
to_char(3148.5, ‘9G999D999’) ‘ 3 148,500’
to_char(-485, ‘999S’) ‘485-‘
to_char(-485, ‘999MI’) ‘485-‘
to_char(485, ‘999MI’) ‘485 ‘
to_char(485, ‘FM999MI’) ‘485’
to_char(485, ‘PL999’) ‘+485’
to_char(485, ‘SG999’) ‘+485’
to_char(-485, ‘SG999’) ‘-485’
to_char(-485, ‘9SG99’) ‘4-85’
to_char(-485, ‘999PR’) ‘<485>’
to_char(485, ‘L999’) ‘DM 485
to_char(485, ‘RN’) ‘ CDLXXXV’
to_char(485, ‘FMRN’) ‘CDLXXXV’
to_char(5.2, ‘FMRN’) ‘V’
to_char(482, ‘999th’) ‘ 482nd’
to_char(485, ‘“Good number:”999’) Good number: 485
to_char(485.8, ‘“Pre:”999” Post:” .999’) Pre: 485 Post: .800
to_char(12, ‘99V999’) ‘ 12000’
to_char(12.4, ‘99V999’) ‘ 12400’
to_char(12.45, ‘99V9’) ‘ 125’