百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 博客教程 > 正文

在 FastAPI 应用程序中进行监控和日志记录:Prometheus 和 Grafana

connygpt 2024-12-16 11:38 8 浏览

监控和日志记录是维护健康且性能良好的 FastAPI 应用程序的关键组件。在本博客中,我们将探讨如何使用 Prometheus 和 Grafana(两种用于跟踪和可视化指标的流行工具)设置监控。我们还将介绍如何集成日志记录以跟踪应用程序行为和错误。

监控和日志记录为何重要

  1. 性能洞察:识别瓶颈并优化性能。
  2. 错误检测:快速检测和诊断问题。
  3. 用户体验:确保应用程序为最终用户顺利运行。
  4. 维护:促进更轻松的调试和维护。

先决条件

  1. FastAPI 的基本知识。
  2. 您的机器上安装了 Docker。
  3. 要监控的 FastAPI 应用程序。

使用 Docker 设置 Prometheus 和 Grafana

我们将使用 Docker 快速设置 Prometheus 和 Grafana。

  1. 创建 Docker Compose 文件
  2. 创建 docker-compose.yml 文件来设置 Prometheus 和 Grafana。
  3. version: '3.7'
    services:
    prometheus:
    image: prom/prometheus
    volumes:
    - ./prometheus.yml:/etc/prometheus/prometheus.yml
    ports:
    - "9090:9090"
    grafana:
    image: grafana/grafana
    ports:
    - "3000:3000"
  4. 配置 Prometheus

创建 prometheus.yml 文件来配置 Prometheus。

global:
  scrape_interval: 15s
scrape_configs:
  - job_name: 'fastapi'
    scrape_interval: 5s
    static_configs:
      - targets: ['host.docker.internal:8000']

将 Prometheus 与 FastAPI 集成

  1. 安装依赖项
  2. pip install prometheus_client
  3. 修改您的 FastAPI 应用程序
  4. from fastapi import FastAPI
    from prometheus_client import start_http_server, Summary
    import time


    app = FastAPI()


    # Create a metric to track time spent and requests made.
    REQUEST_TIME = Summary('request_processing_seconds', 'Time spent processing request')


    @REQUEST_TIME.time()
    def process_request():
    time.sleep(2)


    @app.get("/")
    def read_root():
    process_request()
    return {"Hello": "World"}


    if __name__ == "__main__":
    start_http_server(8000)
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)
  5. 运行 Docker Compose
  6. docker-compose up

设置 Grafana

  1. 访问 Grafana
    1. 打开浏览器并导航至 http://localhost:3000。默认登录名为 admin/admin。
  2. 将 Prometheus 添加为数据源
    1. 导航至配置 > 数据源。
    2. 添加 Prometheus 并将 URL 设置为 http://prometheus:9090。
  3. 创建仪表板
    1. 导航到创建 >仪表板。
    2. 添加新面板并选择您的 Prometheus 数据源。
    3. 使用 Prometheus 查询(如 request_processing_seconds_count)来可视化指标。

将日志记录与 FastAPI 集成

  1. 安装依赖项
  2. pip install loguru
  3. 修改您的 FastAPI 应用程序
  4. from fastapi import FastAPI
    from loguru import logger


    app = FastAPI()


    @app.get("/")
    def read_root():
    logger.info("Root endpoint was called")
    return {"Hello": "World"}


    if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)
  5. 配置 Loguru
  6. Loguru 具有高度可配置性。您可以自定义日志格式、记录到文件等。
  7. from loguru import logger


    logger.add("file_{time}.log", rotation="1 day")

以下是一些其他演示,深入介绍如何使用 Prometheus 和 Grafana 监控 FastAPI 应用程序。

演示 1:监控 FastAPI 中的自定义指标

步骤 1:定义自定义指标

定义自定义指标以跟踪 FastAPI 应用程序中的特定事件或数据点。

from fastapi import FastAPI
from prometheus_client import Counter, Histogram, start_http_server
import random


app = FastAPI()


# Create custom metrics
REQUEST_COUNT = Counter('request_count', 'Total number of requests')
REQUEST_LATENCY = Histogram('request_latency_seconds', 'Request latency in seconds')


@app.get("/random")
def random_number():
    REQUEST_COUNT.inc()  # Increment the request count
    latency = random.random()
    REQUEST_LATENCY.observe(latency)  # Observe latency
    return {"number": random.randint(1, 100)}


if __name__ == "__main__":
    start_http_server(8000)
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)

第 2 步:更新Prometheus 配置

确保 Prometheus 抓取 FastAPI 指标端点。

scrape_configs:
  - job_name: 'fastapi'
    scrape_interval: 5s
    static_configs:
      - targets: ['host.docker.internal:8000']

步骤 3:在 Grafana 中可视化自定义指标

  1. 通过 http://localhost:3000 访问 Grafana。
  2. 如果尚未完成,请添加 Prometheus 作为数据源。
  3. 创建新的仪表板和面板。
  4. 使用 Prometheus 查询 request_count 和 request_latency_seconds 可视化自定义指标。

演示 2:使用 Prometheus 和 Grafana 发出警报

根据 Prometheus 指标在 Grafana 中设置警报,以便在满足某些条件时通知您。

步骤 1:在 Prometheus 中定义警报规则

在名为 alert_rules.yml 的文件中创建警报规则。

groups:
  - name: example_alert
    rules:
    - alert: HighRequestLatency
      expr: request_latency_seconds_bucket{le="1"} > 0.5
      for: 1m
      labels:
        severity: warning
      annotations:
        summary: "High request latency"
        description: "Request latency is greater than 1 second for more than 1 minute."

更新 prometheus.yml 以包含警报规则。

rule_files:
  - "alert_rules.yml"

步骤 2:配置 Alertmanager

设置 Alertmanager 来处理警报。创建 alertmanager.yml 配置文件。

global:
  resolve_timeout: 5m


route:
  receiver: 'email'


receivers:
  - name: 'email'
    email_configs:
      - to: 'your-email@example.com'
        from: 'alertmanager@example.com'
        smarthost: 'smtp.example.com:587'
        auth_username: 'user'
        auth_password: 'password'

更新 docker-compose.yml 以包含 Alertmanager。

version: '3.7'
services:
  prometheus:
    image: prom/prometheus
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
      - ./alert_rules.yml:/etc/prometheus/alert_rules.yml
    ports:
      - "9090:9090"
  grafana:
    image: grafana/grafana
    ports:
      - "3000:3000"
  alertmanager:
    image: prom/alertmanager
    volumes:
      - ./alertmanager.yml:/etc/alertmanager/alertmanager.yml
    ports:
      - "9093:9093"

步骤 3:在 Grafana 中创建警报

  1. 通过 http://localhost:3000 访问 Grafana。
  2. 导航到警报部分。
  3. 根据您的 Prometheus 指标创建新警报。

演示 3:使用 Grafana 仪表板监控 FastAPI 应用程序性能

步骤 1:在 Grafana 中创建仪表板

  1. 通过 http://localhost:3000 访问 Grafana。
  2. 如果尚未完成,请添加 Prometheus 作为数据源。
  3. 创建新仪表板。
  4. 添加各种指标的面板,例如请求数、延迟和错误率。

步骤 2:示例面板配置

请求数面板

  1. 查询:rate(request_count[1m])
  2. 可视化:图表
  3. 根据需要配置时间范围和刷新间隔。

请求延迟面板

  • 查询:histogram_quantile(0.95, sum(rate(request_latency_seconds_bucket[1m])) by (le))
  • 可视化:图表
  • 根据需要配置时间范围和刷新间隔。

错误率面板

  • 在 FastAPI 中定义错误计数器。
  • ERROR_COUNT = Counter('error_count', 'Total number of errors')


    @app.get("/error")
    def error_endpoint():
    ERROR_COUNT.inc()
    # Increment the error count
    raise ValueError("This is an error")
  • 查询:rate(error_count[1m])
  • 可视化:图表
  • 根据需要配置时间范围和刷新间隔。

演示 4:使用 Grafana 注释进行事件跟踪

Grafana 中的注释可以帮助将指标与特定事件或部署关联起来。

步骤 1:在 Grafana 中创建注释

  1. 访问您的 Grafana 仪表板。
  2. 单击“添加注释”按钮(顶部栏上的铅笔图标)。
  3. 添加有关事件的详细信息,例如部署、错误修复或事件。

步骤 2:使用 API 自动注释

使用 Grafana 的 API 自动注释。例如,在部署后添加注释。

curl -X POST \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_GRAFANA_API_KEY" \
  -d '{
    "dashboardId": 1,
    "time": 1609459200000,
    "tags": ["deployment"],
    "text": "Deployed version 2.0"
  }' \
  http://localhost:3000/api/annotations

YOUR_GRAFANA_API_KEY 替换为您的 Grafana API 密钥,并根据需要调整时间和文本。

这些演示提供了有关使用 Prometheus 和 Grafana 监控 FastAPI 应用程序的更多见解。通过定义自定义指标、设置警报、创建全面的仪表板和利用注释,您可以维护强大的监控和日志记录系统,以确保应用程序的健康和性能。

通过将 Prometheus 和 Grafana 与您的 FastAPI 应用程序集成,您可以监控其性能并可视化重要指标。此外,使用像 Loguru 这样的日志库有助于跟踪应用程序行为和错误,从而更轻松地维护和调试应用程序。使用这些工具,您将拥有一个强大的设置,以确保您的 FastAPI 应用程序顺利高效地运行。

写在最后:

  1. Prometheus 和 Grafana,只是相对流行的监控工具组合,还有很多类似的工具可供选择。大家感兴趣的话,可以了解一些,例如:InfluxDB,Zabbix,Graphite, OpenTSDB 和 VictoriaMetrics,这些可替换PrometheusKibanna,Chronograf,Dash(Plotly),Redash和Datadog可替换Grafana
  2. 如你所见,Prometheus 和 Grafana是一个组合套装,那么,有没有其他单一的组合套装呢,真的有如:New Relic,Splunk和Nagios等。如上所述,感兴趣的同学可以自行了解

相关推荐

3分钟让你的项目支持AI问答模块,完全开源!

hello,大家好,我是徐小夕。之前和大家分享了很多可视化,零代码和前端工程化的最佳实践,今天继续分享一下最近开源的Next-Admin的最新更新。最近对这个项目做了一些优化,并集成了大家比较关注...

干货|程序员的副业挂,12个平台分享

1、D2adminD2Admin是一个完全开源免费的企业中后台产品前端集成方案,使用最新的前端技术栈,小于60kb的本地首屏js加载,已经做好大部分项目前期准备工作,并且带有大量示例代码,助...

Github标星超200K,这10个可视化面板你知道几个

在Github上有很多开源免费的后台控制面板可以选择,但是哪些才是最好、最受欢迎的可视化控制面板呢?今天就和大家推荐Github上10个好看又流行的可视化面板:1.AdminLTEAdminLTE是...

开箱即用的炫酷中后台前端开源框架第二篇

#头条创作挑战赛#1、SoybeanAdmin(1)介绍:SoybeanAdmin是一个基于Vue3、Vite3、TypeScript、NaiveUI、Pinia和UnoCSS的清新优...

搭建React+AntDeign的开发环境和框架

搭建React+AntDeign的开发环境和框架随着前端技术的不断发展,React和AntDesign已经成为越来越多Web应用程序的首选开发框架。React是一个用于构建用户界面的JavaScrip...

基于.NET 5实现的开源通用权限管理平台

??大家好,我是为广大程序员兄弟操碎了心的小编,每天推荐一个小工具/源码,装满你的收藏夹,每天分享一个小技巧,让你轻松节省开发效率,实现不加班不熬夜不掉头发,是我的目标!??今天小编推荐一款基于.NE...

StreamPark - 大数据流计算引擎

使用Docker完成StreamPark的部署??1.基于h2和docker-compose进行StreamPark部署wgethttps://raw.githubusercontent.com/a...

教你使用UmiJS框架开发React

1、什么是Umi.js?umi,中文可发音为乌米,是一个可插拔的企业级react应用框架。你可以将它简单地理解为一个专注性能的类next.js前端框架,并通过约定、自动生成和解析代码等方式来辅助...

简单在线流程图工具在用例设计中的运用

敏捷模式下,测试团队的用例逐渐简化以适应快速的发版节奏,大家很早就开始运用思维导图工具比如xmind来编写测试方法、测试点。如今不少已经不少利用开源的思维导图组件(如百度脑图...)来构建测试测试...

【开源分享】神奇的大数据实时平台框架,让Flink&Spark开发更简单

这是一个神奇的框架,让Flink|Spark开发更简单,一站式大数据实时平台!他就是StreamX!什么是StreamX大数据技术如今发展的如火如荼,已经呈现百花齐放欣欣向荣的景象,实时处理流域...

聊聊规则引擎的调研及实现全过程

摘要本期主要以规则引擎业务实现为例,陈述在陌生业务前如何进行业务深入、调研、技术选型、设计及实现全过程分析,如果你对规则引擎不感冒、也可以从中了解一些抽象实现过程。诉求从硬件采集到的数据提供的形式多种...

【开源推荐】Diboot 2.0.5 发布,自动化开发助理

一、前言Diboot2.0.5版本已于近日发布,在此次发布中,我们新增了file-starter组件,完善了iam-starter组件,对core核心进行了相关优化,让devtools也支持对IAM...

微软推出Copilot Actions,使用人工智能自动执行重复性任务

IT之家11月19日消息,微软在今天举办的Ignite大会上宣布了一系列新功能,旨在进一步提升Microsoft365Copilot的智能化水平。其中最引人注目的是Copilot...

Electron 使用Selenium和WebDriver

本节我们来学习如何在Electron下使用Selenium和WebDriver。SeleniumSelenium是ThoughtWorks提供的一个强大的基于浏览器的开源自动化测试工具...

Quick 'n Easy Web Builder 11.1.0设计和构建功能齐全的网页的工具

一个实用而有效的应用程序,能够让您轻松构建、创建和设计个人的HTML网站。Quick'nEasyWebBuilder是一款全面且轻巧的软件,为用户提供了一种简单的方式来创建、编辑...