2023年4月7日金曜日

EoA for Bitfusion

そのうちなるだろうと思ってましたが、思ってたよりもずっと早くBitfudionのEoLが発表になりました。

https://kb.vmware.com/s/article/91138

とても面白くて使い勝手も良かったし、面白い技術だったのですが、、、

せめてProject Radium出たあとならばと思ってましたがProject Radiumもまだリリースが決まってないみたいです。

自宅のbitfusionは行けるとこまで使い続けます!

2023年3月10日金曜日

Openshift4.12 on vSphere8

 久しぶりにOpenshiftをvSphereにIPIで構築しました。

バージョンはどちらも最新で、Openshiftは4.12でvSphereとvSANは8です。


初めてvSphereにOpenshiftを構築したときはIPIに対応していなくてUPIのみで回りを作るのに苦労しましたが、IPI対応になってからとても簡単になりました。


基本的な手順はドキュメント通りですが大まかにいうと、、、

・DNSへapiVIPとIngressVIPのAレコード追加

・DHCPサーバ構築(あれば不要)

・install-config.yamlの作成

・Clusterの作成


これだけでvSphereにOpenshift環境が構築できちゃいます。

ちょっとだけひっかかったところは、#openshift-install create install-configコマンドでinstall-config.yamlの作成中のパラメータ。apiVIPの設定でデフォルトの10.0.0.0/16以外のIPレンジを受け付けなかった。。。

古いバージョンでは同様のバグがあって、改修されたと思っていたけど4.12でもまだ発生しました。

まぁ、これもinstall-config.yaml作成後に、直接machineNetworkとapiVIP、ingressVIPを修正してしまえばいいので問題はありません。



仮想上に作るのはオーバーヘッドがー、リソースがーということは理解していますが、Openshiftの動作確認や勉強などなどで利用するには十分ですね。





vExpert 2023 Award

 発表から少し時間が経ってしまいましたが、今年も無事にvExpertを受賞することができました。


仕事内容がHCIや仮想環境から少し離れてしまったのでなかなか活動できていないですが、

今年はできることを少しずつ活動していきたいと思います。



2022年12月13日火曜日

Windows(Docker)+Bitfusion

Bitfusionの話しは聞かなくなってきたけど、自宅で使うにはBitfusionってすごい便利なんで私はまだまだBitfusion使っています。


今回はWindow11のDocker Desktopでコンテナ動かして、Bitfusionを使ってみました。

vCenterで管理されているホストではないのでvCenterでTokenを作る必要がありますが、動かすことができました。


とりあえず認識だけですが、bitfusion smiも、Bitfusion list_gpusも問題なく動いています。 しかも自宅のWifi環境経由で。



もう少しいじってみてからパフォーマンス系のツールも動かしてみようかと思います。

2022年11月8日火曜日

bitfusion usage Command

 Bitfusion4.5.2のRelease Noteに記載されていたこちらの文言。

 

vSphere Bitfusion クライアントは、vSphere Bitfusion コマンドライン インターフェイスで現在の GPU の割り当てと使用率を表示できます。

 

じゃぁ、どんなコマンドなんだ!ってことで調べて試してみたところ、bitfusion usageというコマンドが追加されていました。


自宅のBitfusion環境でgpu_burnでGPUに負荷をかけつつコマンド実行してみました。

 

 

負荷をかけた状態でvCenterで確認すると、Allocation-1、Core Utilization-1、MemoryUtilization -0.85でしっかりGPUに負荷がかかっていることがわかります。


負荷をかけた状態でnvidia usageコマンドを実行してみました。

どのBitfusion Serverを利用して、どの程度のメモリが割り当てられているか確認することができます。

4.5.1のバージョンまではvCenterでしか利用状況がわからなかったので、CLIで確認できるのでGPUが利用中でジョブがキューにはいったのか、トラブルなのかの切り分けにも使えそうです。

 



 


 

2022年9月8日木曜日

vSphere + Project Radium

 

 VMware Exploreもおわり、vSphere8やvSAN8の発表がありました。

個人的に期待していたAI / ML系のアップデートは仮想マシンへのGPU割当数が拡張されたというくらいで、Project Radium関連の発表はありませんでした。

Bitfusionは特にないだろうし、セッションもないだろうなぁ。。。と思っていましたが、思ったとおりやはりありませんでした。

ですが、YoutubeにProject Radiumのデモ動画がアップされました!




 

NVIDIAとAMDのGPUでTensorflow動かしていますね。リリースされるのが楽しみです!

2022年9月1日木曜日

Bitfusion + Yolox

 自宅Bitfusionを利用して色々と試し中。

公式ドキュメントでは、Yolov3での利用サンプルが記載されています。

vSphere Bitfusion サンプルガイド 

 

このYolov3でも全く問題なく動作したのですが、Yoloxでも動作を試してみました。

 

特に変わった設定もせずに実行することができました。

 

 

ただ、vCenterのBitfusionタブを見ていて気づいたのが、GPUがOverCommit(でいいのかな?)できてる!


最近若干アップデートの間隔が長くなってきた気がしますが、着実に進化していますね。

Project Radiumのリリースも楽しみです。