Rohan Varma

Rohan Varma は NVIDIA の AI DevTech エンジニアです。Dynamo、Grove、TensorRT-LLM などの NVIDIA 推論ソリューションの最適化を中心に取り組んでいます。ミシガン大学アナーバー校でコンピューター サイエンスの修士号を取得しました。趣味はレーシング ゲーム、ピアノ、そしてラケットを使うほとんどのスポーツです。

Posts by Rohan Varma

Generative AI

NVIDIA Grove で Kubernetes 上の複雑な AI 推論を合理化する

Kubernetes クラスタ上で最新の ML 推論ワークロードを実行するための Kubernetes API である NVIDIA Grove が NVIDIA Dynamo 内でモジュール型コンポーネントとして利用できるようになりました。 3 MIN READ