静态数据
很少更改的数据可以使用COPY
轻松导入到 PostgresML 中。您只需将数据导出为 CSV文件,在 Postgres 中创建一个表来存储它,然后使用命令行导入它。
让我们以一个包含 3 列的简单 CSV 文件为例:
列 | 数据类型 | 示例 |
---|---|---|
name | text | John |
age | integer | 30 |
is_paying_user | boolean | true |
将数据导出为CSV
如果您已经使用 Postgres 数据库,只需一个命令就可以将任何表导出为 CSV:
psql -c "\copy your_table TO '~/Desktop/your_table.csv' CSV HEADER"
如果您使用其他数据存储,它几乎总是提供CSV导出功能,因为CSV是机器学习中最常用的数据格式。
在Postgres中创建表
在Postgres中创建带有正确模式的表非常简单:
CREATE TABLE your_table (
name TEXT,
age INTEGER,
is_paying_user BOOLEAN
);
使用命令行导入数据
一旦您有了一个表并将数据导出为CSV,导入数据也可以使用一个命令完成:
psql -c "\copy your_table FROM '~/Desktop/your_table.csv' CSV HEADER"
我们只是将导出命令中的 TO 更改为 FROM,就是这样。确保在导入数据时连接到您的PostgresML数据库。
刷新数据
如果您的数据发生更改,请再次执行此过程。为了避免在表中出现重复的条目,您可以在此之前截断(或删除)所有行:
TRUNCATE your_table;