整数类型

注意: 这些类型的是严格区分大小写的

Int Ranges
Int8 - [-128 : 127]
Int16 - [-32768 : 32767]
Int32 - [-2147483648 : 2147483647]
Int64 - [-9223372036854775808 : 9223372036854775807]

Uint Ranges
UInt8 - [0 : 255]
UInt16 - [0 : 65535]
UInt32 - [0 : 4294967295]
UInt64 - [0 : 18446744073709551615]

浮点类型

存在精度问题
Float32 - float
Float64 - double

Decimal类型

浮点数精度不够, Decimal可以替代浮点型

Decimal32(s),相当于Decimal(9-s,s)
Decimal64(s),相当于Decimal(18-s,s)
Decimal128(s),相当于Decimal(38-s,s)

说明:
1. s 表示小数位数
例如:
decimal(20,2) 20 —整数最多20位,小数后2位

Boolean类型

没有单独的类型来存储布尔值。可以使用 UInt8 类型,取值限制为 0 或 1

字符串

String(类似于varchar)
可变任意长度字符

Fixedstring(N) (char(n))
固定长度 N 的字符串,N 必须是严格的正自然数。当服务端读取长度小于 N 的字符串时候,通过在字符串末尾添加空字节来达到 N 字节长度。 当服务端读取长度大于 N 的字符串时候,将返回错误消息。
与String相比,极少会使用FixedString,因为使用起来不是很方便。

枚举类型

包括 Enum8 和 Enum16 类型。Enum 保存 ‘string’= integer 的对应关系。
Enum8 用 ‘String’= Int8 对描述。
Enum16 用 ‘String’= Int16 对描述
等号左边是需求值,等号右边是底层存的值,这样更节省存储空间!
案例:
建表

CREATE TABLE t_enum
(
x Enum(‘hello’ = 1, ‘world’ = 2)
)
ENGINE = TinyLog

插入数据

INSERT INTO t_enum VALUES (‘hello’), (‘world’), (‘hello’) // ok

INSERT INTO t_enum values(‘a’) // error Unknown element ‘a’ for type Enum8(‘hello’ = 1, ‘world’ = 2)

使用场景:
对一些状态、类型的字段算是一种空间优化,也算是一种数据约束。但是实际使用中往往因为一些数据内容的变化增加一定的维护成本,甚至是数据丢失问题。所以谨慎使用。

时间类型

目前clickhouse 有三种时间类型

1. Date 接受 年-月-日的字符串比如 ‘2019-12-16’
2. Datetime 接受 年-月-日时:分:秒 的字符串比如 ‘2019-12-16 20:50:10’
3. Datetime64 接受 年-月-日时:分:秒.亚秒(0-99) 的字符串比如 ‘2019-12-16 20:50:10.66’

数组

Array(T):由 T 类型元素组成的数组, T 可以是任意类型,包含数组类型。

但不推荐使用多维数组,ClickHouse 对多维数组的支持有限。例如,不能在 MergeTree 表中存储多维数组。1. 使用Array函数

hadoop102 :) SELECT array(1, 2) AS x, toTypeName(x) ;

SELECT
[1, 2] AS x,
toTypeName(x)

使用[ ] 语法索引从1开始
每个元素有两套索引: 基于1的和基于-1,如果是0返回默认值如int类型默认值是0

hadoop102 :) SELECT array(1, 2000) AS x, x[2] ;

其他数据类型

参考官网: https://clickhouse.tech/docs/en/sql-reference/data-types/