# 如何使用 Rapids.ai 套件

Rapids.ai 為 NVIDIA 最新提出之資料處理及機器學習方案。針對 python 語言,目前許多機器學習演算法、資料處理皆整合在 pandas 及 scikit-learn 套件中,這些運算僅使用CPU,部分演算法甚至只能使用單核心運算,在大量資料處理時將耗費大量時間。Rapids.ai 提供利用 GPU 加速,當使用者需要及時處理及分析時可達到更高效率。

目前 Rapids.ai 主要提供以下功能:cudf 作為資料表處理,功能上類似 pandas 套件;cuml 提供機器學習演算法,使用方法及功能上類似 scikit-learn。由於 GPU 運算與 CPU 運算的特性差異,並非所有既有 pandas 及 scikit-learn 功能皆可被 Rapids.ai 取代,除此之外,目前 Rapids.ai 提供之 cudf 及 cuml 上處於開發階段,近期將陸續提供新運算功能。

關於 cudf 及 cuml 之使用方法,使用者可登入 jupyterhub 後進入 RAPIDSExample 目錄觀看並執行範例,目前提供 principle component analysis (PCA)、truncated singularvalue decomposition (TSVD)、k-nearest neighbor (KNN)、DBSCAN 分群,並展示如何搭配 cudf 達到高速資料處理及分析。

Last Updated: 9/26/2022, 11:18:34 AM