静态数据

    很少更改的数据可以使用COPY轻松导入到 PostgresML 中。您只需将数据导出为 CSV文件,在 Postgres 中创建一个表来存储它,然后使用命令行导入它。

    让我们以一个包含 3 列的简单 CSV 文件为例:

    数据类型 示例
    name text John
    age integer 30
    is_paying_user boolean true

    将数据导出为CSV

    如果您已经使用 Postgres 数据库,只需一个命令就可以将任何表导出为 CSV:

    1. psql -c "\copy your_table TO '~/Desktop/your_table.csv' CSV HEADER"

    如果您使用其他数据存储,它几乎总是提供CSV导出功能,因为CSV是机器学习中最常用的数据格式。

    在Postgres中创建表

    在Postgres中创建带有正确模式的表非常简单:

    1. CREATE TABLE your_table (
    2. name TEXT,
    3. age INTEGER,
    4. is_paying_user BOOLEAN
    5. );

    使用命令行导入数据

    一旦您有了一个表并将数据导出为CSV,导入数据也可以使用一个命令完成:

    1. psql -c "\copy your_table FROM '~/Desktop/your_table.csv' CSV HEADER"

    我们只是将导出命令中的 TO 更改为 FROM,就是这样。确保在导入数据时连接到您的PostgresML数据库。

    刷新数据

    如果您的数据发生更改,请再次执行此过程。为了避免在表中出现重复的条目,您可以在此之前截断(或删除)所有行:

    1. TRUNCATE your_table;