namd/doxygen/GlobalGPUMgr_8C_source.html

 #include "CudaRecord.h"
 #include "CudaUtils.h"
 #include "GlobalGPUMgr.decl.h"
 #include "GlobalGPUMgr.h"
 #include "SynchronousCollectives.h"
 #include "Node.h"
 #include "SimParameters.h"
 #include "NamdEventsProfiling.h"

 #include "charm++.h"

 #include <sched.h>
 #include <pthread.h>

 #include "DeviceCUDA.h"

 #if defined(NAMD_CUDA) || defined(NAMD_HIP)
 extern __thread DeviceCUDA *deviceCUDA;

 RunWithAffinity::RunWithAffinity(const bool valid, const int tempCpu) {
   validCpu = valid && (tempCpu >= 0) && (tempCpu < CmiNumCores());

   if (validCpu) {
     current = CPU_ALLOC(CmiNumCores());
     temp    = CPU_ALLOC(CmiNumCores());
     size    = CPU_ALLOC_SIZE(CmiNumCores());

     CPU_ZERO_S(size, current);
     CPU_ZERO_S(size, temp);

     pthread_getaffinity_np(pthread_self(), size, current);

     CPU_SET_S(tempCpu, size, temp);
     pthread_setaffinity_np(pthread_self(), size, temp);
   }
 }

 RunWithAffinity::~RunWithAffinity() {
   if (validCpu) {
     pthread_setaffinity_np(pthread_self(), size, current);

     CPU_FREE(current);
     CPU_FREE(temp);
   }
 }

 GlobalGPUMgr::GlobalGPUMgr(void)
 {
   if (CkpvAccess(GlobalGPUMgr_instance) == NULL) {
     CkpvAccess(GlobalGPUMgr_instance) = this;
   } else {
     NAMD_bug("GlobalGPUMgr instanced twice on same processor!");
   }
 }

 GlobalGPUMgr::~GlobalGPUMgr(void) { }

 void GlobalGPUMgr::initialize() {
   SynchronousCollectives* syncColl = SynchronousCollectives::Object();

   isMasterPe = (CkMyPe() == deviceCUDA->getMasterPe());
   isMasterDevice = deviceCUDA->getIsMasterDevice();

   peToDeviceIDMap.resize(CkNumPes(), -1);
   peToDeviceIndexMap.resize(CkNumPes(), -1);
   syncColl->forceBarrierAll(); //Make sure maps are resized

   const int myDeviceId = (isMasterPe) ? deviceCUDA->getDeviceID() : -1;
   peToDeviceIDMap = syncColl->allGather<int>(myDeviceId, SynchronousCollectiveScope::all);

   // Count number of devices first
   numDevices = 0;
   for (int i = 0; i < CkNumPes(); i++) {
     if (peToDeviceIDMap[i] != -1) {
       numDevices++;
     }
   }

   deviceIndexToPeMap.resize(numDevices, 0);

   // Setup maps
   int current_device = 0;
   for (int i = 0; i < CkNumPes(); i++) {
     if (peToDeviceIDMap[i] != -1) {
       deviceIndexToPeMap[current_device] = i;
       peToDeviceIndexMap[i] = current_device;
       current_device++;
     }
   }

   deviceIndex = peToDeviceIndexMap[CkMyPe()];
 }

 void GlobalGPUMgr::initializeBackends() {
 }

 void GlobalGPUMgr::finalize() {
 }

 bool GlobalGPUMgr::getIsPmeDevice() {
   return deviceCUDA->getPmeDeviceIndex() == deviceIndex;
 }

 #endif  /* NAMD_CUDA || NAMD_HIP */

 #include "GlobalGPUMgr.def.h"

CudaUtils.h

SynchronousCollectives::allGather
std::vector< T > allGather(const T &data, const SynchronousCollectiveScope scope)
Definition: SynchronousCollectives.C:260

NamdEventsProfiling.h

deviceCUDA
__thread DeviceCUDA * deviceCUDA
Definition: DeviceCUDA.C:23

Node.h

GlobalGPUMgr::initialize
void initialize()
Definition: GlobalGPUMgr.C:58

DeviceCUDA::getPmeDeviceIndex
int getPmeDeviceIndex()
Definition: DeviceCUDA.h:167

DeviceCUDA::getMasterPe
int getMasterPe()
Definition: DeviceCUDA.h:137

NAMD_bug
void NAMD_bug(const char *err_msg)
Definition: common.C:195

RunWithAffinity::~RunWithAffinity
~RunWithAffinity()
Definition: GlobalGPUMgr.C:38

SynchronousCollectiveScope::all

GlobalGPUMgr::GlobalGPUMgr
GlobalGPUMgr()
Definition: GlobalGPUMgr.C:47

SynchronousCollectives
Definition: SynchronousCollectives.h:60

GlobalGPUMgr::finalize
void finalize()
Definition: GlobalGPUMgr.C:97

GlobalGPUMgr::initializeBackends
void initializeBackends()
Definition: GlobalGPUMgr.C:94

DeviceCUDA::getDeviceID
int getDeviceID()
Definition: DeviceCUDA.h:144

RunWithAffinity::RunWithAffinity
RunWithAffinity(const bool valid, const int tempCpu)
Definition: GlobalGPUMgr.C:20

DeviceCUDA.h

SynchronousCollectives.h

DeviceCUDA::getIsMasterDevice
bool getIsMasterDevice()
Definition: DeviceCUDA.C:646

GlobalGPUMgr::getIsPmeDevice
bool getIsPmeDevice()
Definition: GlobalGPUMgr.C:100

GlobalGPUMgr::~GlobalGPUMgr
~GlobalGPUMgr()
Definition: GlobalGPUMgr.C:56

GlobalGPUMgr.h

DeviceCUDA
Definition: DeviceCUDA.h:54

SynchronousCollectives::Object
static SynchronousCollectives * Object()
Definition: SynchronousCollectives.h:63

SimParameters.h

SynchronousCollectives::forceBarrierAll
void forceBarrierAll()
Definition: SynchronousCollectives.C:140

CudaRecord.h