AMDGPU_TOP

https://github.com/Umio-Yasuno/amdgpu_top

amdgpu_top這是一個用來顯示 AMD GPU 利用率的工具,類似umrclbr/radeontopintel_gpu_top
該工具顯示從效能計數器(GRBM、GRBM2)、感測器、fdinfo 和 AMDGPU 驅動程式收集的資訊。

GRBM (主要圖形管道狀態)
這一組通常反映了 3D 渲染 的即時負載。

  • Graphics Pipe (圖形管道): 整體圖形處理狀態。如果這個值很高,說明 GPU 正在處理大量的圖形指令。
  • Texture Pipe (紋理管道): 負責處理貼圖(Texture Mapping)。在遊戲中,如果開啟高解析度貼圖或大量過濾(Anisotropy),此項負載會上升。
  • Shader Export (著色器輸出): 著色器運算完成後,將數據導出到下一個階段(如記憶體或像素後端)。
  • Shader Processor Interpolator (著色器插值器): 負責處理頂點之間的屬性插值(如顏色、座標的平滑過渡)。
  • Primitive Assembly (圖元裝配): 將頂點組合建構成三角形、線條等基礎圖形。如果場景中的多邊形(Polygons)數量極多,此項會顯著上升。
  • Depth Block (深度區塊/Z-Buffer): 處理物體的遮擋關係(哪些在前,哪些在後)。高解析度或複雜場景會頻繁使用。
  • Color Block (顏色區塊/ROP): 負責將像素顏色寫入緩衝區。這是渲染的最後幾步,與反鋸齒(MSAA)和解析度高度相關。
  • Geometry Engine (幾何引擎): 處理幾何轉換與運算(如 Tessellation 鑲嵌)。

GRBM2 (輔助與系統管理狀態)
這一組更多涉及數據傳輸、快取管理與通用計算 (Compute)。

  • Ring List Controller (RLC): 負責管理 GPU 的電源狀態和微代碼調度。它是管理硬體「睡眠」與「喚醒」的核心。
  • Texture Cache per Pipe (每管線紋理快取): 顯示紋理快取的使用/繁忙程度。如果這項很高但 FPS 很低,可能存在紋理頻寬瓶頸。
  • Unified Translation Cache Level-2 (L2 快取): GPU 的二級緩衝區。所有的計算與渲染數據最後都會經過這裡與顯存交換。
  • Efficiency Arbiter (效率仲裁器): 協調不同任務之間的優先順序,確保硬體資源分配最優化。
  • Render Backend Memory Interface (渲染後端記憶體介面): 渲染單元與顯存之間的通道。
  • SDMA (System DMA): 負責系統記憶體與顯存之間的數據直接搬運(Direct Memory Access),不經過圖形管線。
  • Command Processor (指令處理器 – Fetcher/Compute/Graphics): * Fetcher: 負責從記憶體抓取待處理的指令。
  • Compute: 處理通用計算任務(如 AI 運算、物理模擬)。
  • Graphics: 處理繪圖專用的指令流。

Memory Usage (顯存使用情況)
這部分顯示 GPU 如何分配和使用記憶體。

  • VRAM (Video RAM): 專用顯存。這是板載於顯卡上的高速記憶體(或 APU 預留的固定顯存),用於存放當前正在使用的貼圖、緩衝區和著色器代碼。
  • GTT (Graphics Translation Tables): 圖形轉換表(系統共享記憶體)。當 VRAM 不足或需要交換數據時,GPU 會使用一部分系統內存(RAM)。對於 APU (如筆電內顯) 而言,GTT 是實現「統一內存」擴展的關鍵。
  • Activity (引擎活動率)
  • 顯示 GPU 核心單元的即時負載百分比。
  • GFX: 圖形引擎負載。反映 3D 渲染、遊戲運算的忙碌程度。
  • Media: 媒體引擎負載。反映影片編碼(Encode)或解碼(Decode)的運作狀態(例如看 4K 影片或進行直播串流時此值會上升)。

fdinfo (分進程監控)
顯示每個調用 GPU 資源的具體進程及其佔用詳情。

  • KFD: 指該進程是否正在使用 AMDKFD 驅動(通常用於 ROCm 或 AI 計算任務)。
  • VRAM / GTT: 該進程分別佔用的專用顯存與系統共享內存量。
  • GFX / COMP: 該進程佔用的 圖形 (GFX) 與 計算 (COMP/Compute) 引擎比例。
  • DMA: 該進程使用的直接內存訪問(數據搬運)頻寬。
  • VCNU: 影片編解碼單元使用率(Video Core Next Usage)。

Sensors (感測器數據)
監控硬體的物理狀態,如頻率、功耗與溫度。

  • GFX_SCLK: GPU 核心時脈。數值越高代表運算速度越快。
  • GFX_MCLK: 顯存時脈。在高負載遊戲或多螢幕輸出時通常會維持在高頻。
  • FCLK: Fabric 時脈。AMD 架構中連接內核與內存控制器的數據匯流排頻率。
  • VDDGFX / VDDNB: 分別為 GPU 核心電壓與北橋(SoC)電壓。
  • GPU Power: 顯示目前 GPU 的功耗(瓦特)。
  • Edge Temp: 顯卡邊緣溫度(通常作為主溫度參考)。
  • CPU Tctl / Core freq: 對於帶內顯的 CPU,也會同時顯示 CPU 的封裝溫度與各個核心的即時頻率。

GPU Metrics v3.0 & XDNA (進階與 AI 監控)
展示了更新一代架構(通常是 Ryzen 處理器或具備 NPU 的設備)的詳細數據。

  • UMC (Unified Memory Controller): 內存控制器的負載,反映數據讀寫的忙碌程度。
  • DRAM Reads/Writes: 系統記憶體每秒的實際讀寫流量(MB/s)。
  • IPU / IPUCLK: 影像處理單元(或與 NPU 相關),負責影像增強。
  • XDNA fdinfo (RyzenAI-npu4): 這是最特別的部分,顯示 NPU (神經網絡處理單元) 的進程佔用。這代表您的設備支援 Ryzen AI,專門用於加速本地 AI 任務(如背景模糊、噪音消除等)。