Data Science

RAPIDS cuDF、コード変更ゼロで pandas を約 150 倍高速化

2023 年 11 月 8 日

By Jay Rodge, Nick Becker and Ashwin Srinath

Reading Time: 2 minutes

NVIDIA は、RAPIDS cuDF が 950 万人の pandas ユーザーに、コードを変更することなく GPU アクセラレーションを提供できるようになったと発表しました。

NVIDIA が先日開催した AI and Data Science Virtual Summit の「基調講演の動画 (英語)」をご覧ください。

pandas は、Python 用の柔軟かつパワフルなデータ解析およびデータ操作ライブラリです。API を容易に使用できることから、データサイエンティストには最高の選択肢と言えます。ただし CPU のみのシステムでは、データセットのサイズが大きくなるほど処理速度と効率が低下します。

RAPIDS は、データサイエンスと分析パイプラインの向上を目的に設計された GPU アクセラレーテッド Python ライブラリのオープンソーススイートです。RAPIDS cuDF は、データのロード、フィルタリング、操作に使用できる pandas のような API を提供する GPU DataFrame ライブラリです。cuDF の以前のリリースでは、GPU のみの開発ワークフローを対象としていました。

RAPIDS の最新リリース RAPIDS v23.10 では、cuDF は、新しい pandas アクセラレータモードにより、コードを変更することなく、統合された CPU/GPU ユーザー体験を提供し、pandas ワークフローにアクセラレーテッドコンピューティングをもたらします。現在、オープンソースの RAPIDS v23.10 リリースでオープンベータ版として提供されており、まもなく NVIDIA AI Enterprise でサポート開始予定です。

動画 1. Accelerate Pandas by Nearly 150X with RAPIDS cuDF (RAPIDS cuDF で pandas が約 150 倍高速化)

この動画では、同一の pandas ワークフローが並列して実行されている様子を視聴することができます。1 つは CPU のみで pandas を使用し、もう 1 つは RAPIDS cuDF の pandas アクセラレータモードを使用しています。

統合 CPU/GPU エクスペリエンスを pandas ワークフローで実現

cuDF は、pandas のような API を利用して、DataFrame ライブラリでの最高のパフォーマンスをユーザーに常に提供してきました。しかし、cuDF を採用するにあたっては以下のような回避策が必要になる場合があります。

cuDF で未実装または未サポートの pandas 機能について対処する。
異種ハードウェアでの実行が必要なコードベースで CPU と GPU の実行用に別々のコードパスを設計する。
pandas 用に設計された他の PyData ライブラリまたは組織特化のツールとやり取りさせるときは、cuDF と pandas を手動で切り替える。

cuDF は、RAPIDS v23.10 のリリースから、既存の GPU のみのエクスペリエンスに加えて、上記のような課題に対処する pandas アクセラレータモードの提供を開始しました。

この機能は、データサイズがギガバイト単位に増加して pandas のパフォーマンスが低下しても pandas の使用を継続したいデータサイエンティスト向けに開発されました。cuDF の pandas アクセラレータモードでは、演算は可能であれば GPU で、そうでない場合は CPU (pandas を使用) で実行され、必要に応じて内部で同期されます。これにより、CPU/GPU エクスペリエンスの統合が実現し、pandas のワークフローに最高クラスのパフォーマンスがもたらされます。

最新リリースで、cuDF は以下の機能を新たに提供します。

コード変更ゼロのアクセラレーション: cuDF Jupyter Notebook 拡張機能をロードするか、cuDF Python モジュールオプションを使用するだけで利用可能です。
サードパーティライブラリの互換性: pandas アクセラレータモードは、pandas オブジェクトで動作するほとんどのサードパーティライブラリと互換性があります。これらのライブラリ内では pandas の操作も高速化されます。
CPU/GPU ワークフローの統合: ハードウェアに関係なく、単一のコードパスを使用して実稼働環境で開発、テスト、実行できます。

Jupyter Notebook の pandas ワークフローに GPU アクセラレーションを導入するには、cudf.pandas 拡張機能を読み込みます。

%load_ext cudf.pandas
import pandas as pd

Python スクリプトの実行時にアクセスするには、cudf.pandas モジュールオプションを使用します。

python -m cudf.pandas script.py

pandas ワークフローに最高のパフォーマンスをもたらす

データサイズがギガバイト単位の規模になると、パフォーマンスの低下により pandas の使用が困難になることが多く、データサイエンティストの中には愛用していた pandas API を諦める人もいます。新しい RAPIDS cuDF を使用すると、pandas を主要なツールとして使用し続けることができ、最高のパフォーマンスを獲得できます。

H2o.ai が開発した、一般に使用されている DuckDB データベースに似た Ops ベンチマークの pandas 部分を実行すると、pandas API が実際に動作している様子を確認できます。DuckDB のベンチマーク設定では、データの結合やグループ毎の統計的尺度の計算といった一連の一般的な解析タスクに関して、一般的な CPU ベースの DataFrame エンジンと SQL エンジンを比較します。

データが 5GB になると、pandas のパフォーマンスが最低になり、結合や高度な groupby の一連の操作を実行するのに数分かかります。

これまで、このベンチマークを pandas ではなく cuDF で実行するには、コードを変更し、足りない機能に関する対処を行う必要がありました。cuDF の新しい pandas アクセラレータモードでは、この問題が解決されました。pandas のベンチマークコードを変更せずに実行することができ、ワークフローが成功するように GPU を演算の大部分に使用し、CPU をごく一部に使用することで、大幅な高速化が実現します。

結果は素晴らしいものになっています。cuDF の統合された CPU/GPU エクスペリエンスは、コード変更が不要になり、数分間の処理がわずか 1、2 秒に短縮されます (図 1)。

これらのベンチマーク結果とその再現方法の詳細については、cuDF のドキュメントをお読みください。

結論

pandas は Python エコシステムで最もよく使われる DataFrame ライブラリですが、CPU ではデータサイズが大きくなると速度が低下します。

cuDF の pandas アクセラレータモードが RAPIDS v23.10 リリースの一環としてオープンベータ版で利用可能になったことで、コードを変更することなく、pandas ワークフローにアクセラレーテッドコンピューティングを導入できるようになりました。5GB データセットを処理する解析ベンチマークを根拠にすれば、処理時間を 150 倍高速化することができます。

Google Colab の無料 GPU 環境にあるこちらの詳細なウォークスルーノートブックを使用して、cuDF の新しい pandas アクセラレータモードをお試しください。詳細については、RAPIDS の Web サイト cuDF pandas アクセラレータモードのページをご参照ください。

About the Authors

About Jay Rodge
Jay Rodge は大規模言語モデル (LLM) の開発者アドボケイトとして、開発者コミュニティで広く使用されているツールとフレームワークを使用して、開発者が LLM プロセスで GPU アクセラレーションを活用する方法を実証しています。以前は、NVIDIA でデータサイエンスとディープラーニング製品の製品マーケティングマネージャーを務め、製品の立ち上げや製品マーケティングの取り組みを推進していました。シカゴのイリノイ工科大学でコンピュータサイエンスの修士号を取得。NVIDIA に入社する前は、BMW Group で AI 研究のインターンとして、BMW 最大の製造工場におけるコンピュータービジョンを使用した問題解決に取り組んでいました。

View all posts by Jay Rodge

About Nick Becker
Nick Becker は、NVIDIA の RAPIDS チームのシニアテクニカルプロダクトマネージャーで、GPU アクセラレーテッドデータサイエンスエコシステムの構築に注力しています。彼は、テクノロジと政府の両方の専門家としての経歴を持っています。NVIDIA に入社する前は、データサイエンスのスタートアップである Enigma Technologies に勤務。その前は、米国の中央銀行である連邦準備制度理事会 (FRB) で経済調査と予測を行っていました。

View all posts by Nick Becker

About Ashwin Srinath
Ashwin Srinath は、NVIDIA のシニアソフトウェアエンジニアであり、RAPIDS の開発チームの一員です。NVIDIA に入社する前は、クレムソン大学の計算科学者として、研究者の HPC アプリケーションの開発と最適化を支援していました。クレムソン大学で機械工学の修士号を取得。

View all posts by Ashwin Srinath