Skip to content

Latest commit

 

History

History
51 lines (50 loc) · 1.49 KB

pytorch-smmg.md

File metadata and controls

51 lines (50 loc) · 1.49 KB

Pytorch 单机多卡测试

参考:🔗

一、准备数据和代码

1、下载

我们已将数据和代码存储到我公司的FTP服务器上,单击此处下载,并将其上传到服务器上。

2、上传数据

依次单击系统管理->文件管理->文档上传将文件(主要,文件应该是解压后的)上传到服务器。

二、提交作业

JSON文件如下:

{
  "jobName": "pytorch-smmg_16bea75b",
  "image": "sitonholy/ai:16.04-9.0-3.5-pmt",
  "authFile": "",
  "dataDir": "",
  "outputDir": "",
  "codeDir": "",
  "retryCount": 0,
  "taskRoles": [
    {
      "name": "task_1",
      "taskNumber": 1,
      "cpuNumber": 1,
      "memoryMB": 16384,
      "shmMB": 2048,
      "gpuNumber": 2,
      "storageGB": 5,
      "minFailedTaskCount": null,
      "minSucceededTaskCount": null,
      "command": "cd /root/data/framework_benchmark/pytorch && python smmg.py --lr  0.001 --epoch 100 --trainBatchSize 5000 --gpunum 2",
      "portList": []
    }
  ],
  "jobEnvs": {},
  "extras": {
    "virtualGroup": "total"
  },
  "gpuType": "TITANX"
}

三、日志查看


图1

1、查看日志

单击图1中标准输出查看相应日志如下:

2、资源监控

单击图1中前往工作指标页面查看资源利用情况: