根据我们的稳定承诺,Prometheus 2.0版本包含许多向后不兼容的更改。 本文档提供了从Prometheus 1.8迁移到Prometheus 2.0的指导。

一、标志

Prometheus命令行标志的格式已更改。现在所有标志都使用双破折号而不是单个破折号。公共标志(--config.file--web.listen-address--web.external-url)仍然相同,但除此之外,几乎所有与存储相关的标志都已被删除。

一些值得注意的标志已删除:

  • -alertmanager.url在Prometheus 2.0中,已删除用于配置静态Alertmanager URL的命令行标志。现在必须通过服务发现来发现Alertmanager,请参阅Alertmanager服务发现。

  • -log.format在Prometheus 2.0中,日志只能流式传输到标准错误。

  • -query.staleness-delta已重命名为--query.lookback-delta; Prometheus 2.0引入了一种处理陈旧性的新机制,请参见陈旧性。

  • -storage.local.* Prometheus 2.0引入了一个新的存储引擎,因此删除了与旧引擎相关的所有标志。有关新引擎的信息,请参阅存储。

  • -storage.remote.* Prometheus 2.0删除了已经弃用的远程存储标志,如果提供它们将无法启动。要写入InfluxDB,Graphite或OpenTSDB,请使用相关的存储适配器。

二、Alertmanager服务发现

在Prometheus 1.4中引入了Alertmanager服务发现,允许Prometheus使用与刮擦目标相同的机制动态发现Alertmanager复制品。 在Prometheus 2.0中,已删除静态Alertmanager配置的命令行标志,因此以下命令行标志:

./prometheus -alertmanager.url=http://alertmanager:9093/

将在prometheus.yml配置文件中替换为以下内容:

  1. alerting:
  2. alertmanagers:
  3. - static_configs:
  4. - targets:
  5. - alertmanager:9093

您还可以在Alertmanager配置中使用所有常用的Prometheus服务发现集成和重新标记。 此代码段指示Prometheus使用name: alertmanger:alertmanager和非空端口在default命名空间中搜索Kubernetes pod。

  1. alerting:
  2. alertmanagers:
  3. - kubernetes_sd_configs:
  4. - role: pod
  5. tls_config:
  6. ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
  7. bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
  8. relabel_configs:
  9. - source_labels: [__meta_kubernetes_pod_label_name]
  10. regex: alertmanager
  11. action: keep
  12. - source_labels: [__meta_kubernetes_namespace]
  13. regex: default
  14. action: keep
  15. - source_labels: [__meta_kubernetes_pod_container_port_number]
  16. regex:
  17. action: drop
三、记录规则和报警

配置警报和录制规则的格式已更改为YAML。 旧格式的录制规则和警报示例:

  1. job:request_duration_seconds:histogram_quantile99 =
  2. histogram_quantile(0.99, sum(rate(request_duration_seconds_bucket[1m])) by (le, job))
  3. ALERT FrontendRequestLatency
  4. IF job:request_duration_seconds:histogram_quantile99{job="frontend"} > 0.1
  5. FOR 5m
  6. ANNOTATIONS {
  7. summary = "High frontend request latency",
  8. }

看起来像这样:

  1. groups:
  2. - name: example.rules
  3. rules:
  4. - record: job:request_duration_seconds:histogram_quantile99
  5. expr: histogram_quantile(0.99, sum(rate(request_duration_seconds_bucket[1m]))
  6. BY (le, job))
  7. - alert: FrontendRequestLatency
  8. expr: job:request_duration_seconds:histogram_quantile99{job="frontend"} > 0.1
  9. for: 5m
  10. annotations:
  11. summary: High frontend request latency

为了帮助进行更改,promtool工具具有自动执行规则转换的模式。 给定.rules文件,它将以新格式输出.rules.yml文件。 例如:

  1. $ promtool update rules example.rules

请注意,您需要使用2.0中的promtool,而不是1.8。

四、存储

Prometheus 2.0中的数据格式已完全改变,并且不向后兼容1.8。 为了保持对历史监控数据的访问,我们建议您运行至少与Prometheus 2.0实例并行运行至少版本1.8.1的非刮擦Prometheus实例,并让新服务器通过远程读取协议从旧服务器读取现有数据。

您的Prometheus 1.8实例应该使用以下标志和仅包含external_labels设置(如果有)的配置文件启动:

$ ./prometheus-1.8.1.linux-amd64/prometheus -web.listen-address “:9094” -config.file old.yml

然后可以使用以下标志启动Prometheus 2.0(在同一台机器上):

$ ./prometheus-2.0.0.linux-amd64/prometheus —config.file prometheus.yml

除了完整的现有配置之外,prometheus.yml还包含哪些节:

  1. remote_read:
  2. - url: "http://localhost:9094/api/v1/read"
五、PromQL

从PromQL中删除了以下功能:

  • drop_common_labels函数 - 应该使用不使用聚合修饰符。
  • keep_common聚合修饰符 - 应该使用修饰符。
  • count_scalar函数 - absent()或在操作中正确传播标签可以更好地处理用例。
  • 有关详细信息,请参阅issue#3060
六、杂项
6.1 普罗米修斯非root用户

Prometheus Docker镜像现在可以作为非root用户运行Prometheus。 如果您希望Prometheus UI / API侦听低端口号(例如,端口80),则需要覆盖它。 对于Kubernetes,您将使用以下YAML:

  1. apiVersion: v1
  2. kind: Pod
  3. metadata:
  4. name: security-context-demo-2
  5. spec:
  6. securityContext:
  7. runAsUser: 0
  8. ...

有关更多详细信息,请参阅为Pod或容器配置安全上下文

如果您使用的是Docker,则会使用以下代码段:

  1. docker run -u root -p 80:80 prom/prometheus:v2.0.0-rc.2 --web.listen-address :80
6.2 普罗米修斯生命周期

如果您使用Prometheus /-/reload加载HTTP端点在更改时自动重新加载Prometheus配置,则出于安全原因,默认情况下会禁用这些端点,这是Prometheus 2.0中的。 要启用它们,请设置--web.enable-lifecycle标志。