源数据处理
假如要处理csv数据,只取某些列,可以使用cut命令:
从order.csv里读取,以逗号(-d,)为分隔符,取1、3列输出到geo.csv里
cut -d, -f1,3 < order.csv > geo.csv
建表
CREATE TABLE `default`.idinfo (id UInt64 COMMENT '自增ID',IDENTITY String,NAME String ,PHONE String,AUT_TIME DateTime)engine =ReplacingMergeTree(AUT_TIME)primary key (id)order by (id, IDENTITY);
导入
clickhouse-client -h 127.0.0.1 -format_csv_delimiter=',' -q 'insert into default.idinfo FORMAT CSVWithNames ' < /opt/data.csv
实测600w数据10s导入完毕,不得不说是真的快。
