Job No.5981

【フルリモ/出勤頻度相談可能】研究機関向け大規模GPUクラスタの設計・構築

【フルリモ/出勤頻度相談可能】研究機関向け大規模GPUクラスタの設計・構築
月額報酬
210〜240万円
稼働日数
週5日
作業場所
フルリモート (東京都 )
募集職種
データベース・サーバ・ネットワークエンジニア ー サーバ設計・構築
稼働開始
2024年11月1日
精算時間
月140~160時間

仕事内容

【概要】
通信会社の研究所向け大規模GPUクラスタの構築PJ
(顧客向けに独自にGPU構築をし、ホスティングサービスのようにサービス提供するサービス)

【プロジェクト詳細】
大規模GPUクラスタPJのPL(中心メンバー)として、以下の業務を遂行いただく想定です。

規模:サーバー128台・GPU1024台(1サーバーに8GPU刺さっている構成前提)

■要件定義フェーズ
既に提案フェーズで着手中、データセンターの選定やGPUの選定・見積・調達。

■設計フェーズ
GPUクラスタの基本設計・詳細設計。
稼働環境の整備、周辺機器とのチューニング、ノード間通信を高速化するためのインターコネクトやストレージ、計算リソースやジョブを管理するためのマネジメントツールの検討。
ハードウェアからソフトウェア、ネットワークまでを組み合わせ、チューニングも視野に入れて、最大限にパフォーマンスが出力できるよう設計する必要あり。

■構築フェーズ→テストフェーズ

【PC貸与】あり

必須スキル

【MUST】
・大規模GPUクラスタ(目安:32GPU以上)の設計・構築経験
・GPU32個以上の大規模PJの中心で動いてい経験
※TSUBAMEプロジェクトのような大型案件に参画していた方がイメージとなります。

稼働日数

週5日

祝日

※上記は標準の報酬であり、ご経験・スキルにより異なる場合があります。