2024年9月10日火曜日

VMware Deep Learning VM 1.1

 最近はVMware関連製品にかかわることが少なくなってしまったのですが、AI関連については興味もあるし情報は集めるようにしています。Private AI Foundationが発表されたときは、個人的にも期待が大きかったのですが、まだまだな感じがあるのは残念です。

Deep Learning VMの使い方はVMUGで発表あったりするので他の情報源にお任せして、ここでは、VMware Depp Learning VMも1.1が7月にリリースされたので内容を見てみます。

VMware Deep Learning VM イメージリソースノート

DL VMもいつのまにか1.1になっていました。。。 *公開日は2024年7月23日


互換性とアップグレード

デプロイ済みのDeep Learning VMのアップグレードはできないようなので、新しいバージョンを利用する場合は再デプロイする必要があるようです。なので旧Deep Learning VMで必要なデータは別途うつしておく必要があります。


新機能

イメージリソースノートには以下機能が追加されたと記載があります。

  • ディープ ラーニング仮想マシン イメージに、組み込みの Miniconda インストールが含まれるようになりました。

  • ディープ ラーニング仮想マシン イメージに、検証済みの PyTorch Conda 環境マニフェストが含まれるようになりました。

  • Conda Environment Install OVF パラメータを使用して、仮想マシンのデプロイ中に自動的にインストールする Conda 環境のカンマ区切りのリストを指定できます。現在、pytorch2.3_py3.12 環境をインストールできます。

  • 初期化スクリプトの詳細なログについては、/var/log/vgpu-install.log を参照してください。


おおむね追加された機能としてはPython実行環境の強化であるconda関係の機能が追加されたようです。

Pythonの仮想環境はAnacondaやventv、pyenvなどいくつかありますが、Minicondaが含まれるようになったようです。Anacondaに比べると軽量なところが選定された理由なのかもしれないです。


サポート対象GPU
NVIDIAのA100、L40s、H100のサポートで、前バージョンの1.0.1との変更は無いようです。
できればH200とか、H100NVLとかサポートしてほしかったです。


コンポーネント
こちらも1.0.1と変更なしです。
Canonical Ubuntu 22.04
NVIDIA Container Toolkit 1.15.0
Docker Community Engine 26.0.2
Miniconda 24.4.0-0 Python 3.12 *今回から追加
PyTorch Conda 2.3.0 Python 3.12 *今回から追加


Ubuntuも22.04なので最新ではないものの安定はしているバージョンなので問題はないものの、次回もしくは1.1になるタイミングでUbuntu24になるとか、サポートされるGPUが追加されるといったところを期待したいです。