namd/doxygen/CudaComputeNonbonded_8h_source.html

 #ifndef CUDACOMPUTENONBONDED_H

 #define CUDACOMPUTENONBONDED_H

 #include <vector>

 #include "Compute.h"

 #include "Box.h"

 #include "PatchTypes.h"

 #include "CudaUtils.h"

 #include "ComputeNonbondedUtil.h"

 #include "CudaNonbondedTables.h"

 #include "CudaTileListKernel.h"

 #include "CudaComputeNonbondedKernel.h"

 #include "CudaComputeGBISKernel.h"

 #include "ComputeMgr.h"

 #if defined(NAMD_CUDA) || defined(NAMD_HIP)

 #ifdef NAMD_CUDA

 #include <cuda.h>

 #endif

 #ifdef NAMD_HIP

 #include <hip/hip_runtime.h>

 #include "HipDefines.h"

 #endif


 // 2^11 ints * 2^5 bits = 2^16 bits = range of unsigned short excl_index

 // 2^27 ints * 2^5 bits = 2^32 bits = range of unsigned int excl_index

 #define MAX_EXCLUSIONS (1<<27)


 class CudaComputeNonbonded : public Compute, public ComputeNonbondedUtil {

 public:

   struct ComputeRecord {

     ComputeID cid;

     PatchID pid[2];

     // Index to patches[] -array

     int patchInd[2];

     Vector offset;

   };


   struct PatchRecord {

     PatchRecord(PatchID patchID) : patchID(patchID) {

       patch = NULL;

       compAtom = NULL;

       results = NULL;

       positionBox = NULL;

       forceBox = NULL;

       intRadBox = NULL;

       psiSumBox = NULL;

       bornRadBox = NULL;

       dEdaSumBox = NULL;

       dHdrPrefixBox = NULL;

     }

     PatchID patchID;

     Patch *patch;

     int numAtoms;

     int numFreeAtoms;

     int atomStart;

     // Pe where the patch was registered

     int pe;

     // For priority sorting

     int reversePriorityRankInPe;

     bool isSamePhysicalNode;

     bool isSameNode;

     // Storage for open positionBox

     CompAtom *compAtom;

     // Storage for open forceBox

     Results *results;

     // Boxes

     Box<Patch,CompAtom> *positionBox;

     Box<Patch,Results> *forceBox;

     Box<Patch,Real>   *intRadBox; //5 GBIS Boxes

     Box<Patch,GBReal> *psiSumBox;

     Box<Patch,Real>   *bornRadBox;

     Box<Patch,GBReal> *dEdaSumBox;

     Box<Patch,Real>   *dHdrPrefixBox;

     Real   *intRad; //5 GBIS arrays

     GBReal *psiSum;

     Real   *bornRad;

     GBReal *dEdaSum;

     Real   *dHdrPrefix;

     bool operator < (const PatchRecord& pr) const {

       return (patchID < pr.patchID);

     }

     bool operator == (const PatchRecord& pr) const {

       return (patchID == pr.patchID);

     }

   };


 private:

   // This variable is set in atomUpdate() by any Pe

   bool atomsChangedIn;

   // This variable is set in doWork() by masterPe

   bool atomsChanged;


   bool computesChanged;


   const int deviceID;

   size_t maxShmemPerBlock;

   cudaStream_t stream;


   // PME and VdW CUDA kernels

   CudaComputeNonbondedKernel nonbondedKernel;


   // GBIS kernel

   CudaComputeGBISKernel GBISKernel;


   // Tile list CUDA kernels

   CudaTileListKernel tileListKernel;


   // Exclusions

   int2 *exclusionsByAtom;


   // VdW-types

   // Pinned host memory

   int* vdwTypes;

   int vdwTypesSize;


   // Maximum number of tiles per tile list

   int maxTileListLen;


   // Pinned host memory

   int2* exclIndexMaxDiff;

   int exclIndexMaxDiffSize;


   // Pinned host memory

   int* atomIndex;

   int atomIndexSize;


   // Required (xyzq, vdwTypes) storage

         int atomStorageSize;


   // Atom and charge storage

   // Pinned host memory

   CudaAtom* atoms;

   int atomsSize;


   // Force storage

   float4* h_forces;

   int h_forcesSize;

   float4* h_forcesSlow;

   int h_forcesSlowSize;


   float4* d_forces;

   int d_forcesSize;

   float4* d_forcesSlow;

   int d_forcesSlowSize;


   // Virial and energy storage

   VirialEnergy* h_virialEnergy;

   VirialEnergy* d_virialEnergy;


   // GBIS storage

   //--------------

   // Pinned host memory

   float* intRad0H;

   int intRad0HSize;

   // Pinned host memory

   float* intRadSH;

   int intRadSHSize;

   // Mapped host memory

   GBReal* psiSumH;

   int psiSumHSize;

   // Pinned host memory

   float* bornRadH;

   int bornRadHSize;

   // Mapped host memory

   GBReal* dEdaSumH;

   int dEdaSumHSize;

   // Pinned host memory

   float* dHdrPrefixH;

   int dHdrPrefixHSize;


   // Event and sanity check flag for making sure event was actually recorded

   cudaEvent_t forceDoneEvent;

   bool forceDoneEventRecord;

   // Check counter for event polling

   int checkCount;


   // Node lock

   CmiNodeLock lock;

   // List of local PEs that have patches

   std::vector<int> pes;

   // List of patch indices on each rank

   std::vector< std::vector<int> > rankPatches;

   // Master Pe = Pe where this Compute and reduction lives

   int masterPe;


   // Are we in skip?

   bool doSkip;


   // Device-wide patch and compute records, and the list of patches

   std::vector<ComputeRecord> computes;

   std::vector<PatchRecord> patches;


   // CUDA versions of patches

   // Pinned host memory

   CudaPatchRecord* cudaPatches;


   SubmitReduction *reduction;


   // Pair lists

   int pairlistsValid;

   float pairlistTolerance;

   int usePairlists;

   int savePairlists;

   float plcutoff2;


   bool reSortDone;


   // Flags

   bool doSlow;

   bool doEnergy;

   bool doVirial;


   // Walltime for force compute start

   double beforeForceCompute;


   static inline void updateVdwTypesExclLoop(int first, int last, void *result, int paraNum, void *param);

   void updateVdwTypesExclSubset(int first, int last);


   static inline void copyAtomsLoop(int first, int last, void *result, int paraNum, void *param);

   void copyAtomsSubset(int first, int last);


   void addPatch(PatchID pid);

   void addCompute(ComputeID cid, PatchID pid1, PatchID pid2, Vector offset);

   void updatePatches();

   int calcNumTileLists();

   void getMaxMovementTolerance(float& maxAtomMovement, float& maxPatchTolerance);

   void updateVdwTypesExcl();

   void buildNeighborlist();

   void skip();

   void doGBISphase1();

   void doGBISphase2();

   void doGBISphase3();

   void doForce();

   void finishSetOfPatchesOnPe(std::vector<int>& patchSet);

   void finishPatches();

   void finishGBISPhase(int i);

   void finishTimers();

   void reSortTileLists();

   void forceDone();

   static void forceDoneCheck(void *arg, double walltime);

   void forceDoneSetCallback();

   void updateComputes();

   void buildExclusions();

   void skipPatch(int i);

   void openBox(int i);

   void reallocateArrays();

   void copyGBISphase(int i);

   void updatePatch(int i);

   int findPid(PatchID pid);

   void assignPatch(int i);

   ComputeMgr* computeMgr;

   int patchesCounter;


   const bool doStreaming;

   int* patchReadyQueue;

   int patchReadyQueueNext, patchReadyQueueLen;


   void finishPatch(int i);

   void unregisterBox(int i);


   // void writeId(const char* filename);

   // void writeXYZ(const char* filename);


 public:

   CudaComputeNonbonded(ComputeID c, int deviceID, CudaNonbondedTables& cudaNonbondedTables, bool doStreaming);

   ~CudaComputeNonbonded();

   void registerComputeSelf(ComputeID cid, PatchID pid);

   void registerComputePair(ComputeID cid, PatchID* pid, int* trans);

   void assignPatches(ComputeMgr* computeMgrIn);

   virtual void initialize();

   virtual void atomUpdate();

   virtual int noWork();

   virtual void doWork();

   void launchWork();

   void finishReductions();

   void unregisterBoxesOnPe();

   void assignPatchesOnPe();

   void openBoxesOnPe();

   void skipPatchesOnPe();

   void finishPatchesOnPe();

   void finishPatchOnPe(int i);

   void messageEnqueueWork();

   virtual void patchReady(PatchID, int doneMigration, int seq);

   virtual void gbisP2PatchReady(PatchID, int seq);

   virtual void gbisP3PatchReady(PatchID, int seq);

 };


 #endif // NAMD_CUDA

 #endif // CUDACOMPUTENONBONDED_H

CudaComputeNonbonded::finishReductions
void finishReductions()
Definition: CudaComputeNonbonded.C:1213

CudaUtils.h

CudaComputeNonbonded::finishPatchOnPe
void finishPatchOnPe(int i)
Definition: CudaComputeNonbonded.C:1386

Results
Definition: PatchTypes.h:58

CudaComputeNonbonded::finishPatchesOnPe
void finishPatchesOnPe()
Definition: CudaComputeNonbonded.C:1379

CudaComputeNonbondedKernel
Definition: CudaComputeNonbondedKernel.h:9

CudaComputeNonbonded::PatchRecord::pe
int pe
Definition: CudaComputeNonbonded.h:56

CudaComputeNonbonded::initialize
virtual void initialize()
Definition: CudaComputeNonbonded.C:608

CudaComputeNonbonded::PatchRecord::dHdrPrefixBox
Box< Patch, Real > * dHdrPrefixBox
Definition: CudaComputeNonbonded.h:72

CudaComputeNonbonded::PatchRecord::intRadBox
Box< Patch, Real > * intRadBox
Definition: CudaComputeNonbonded.h:68

CudaComputeNonbonded::PatchRecord::isSamePhysicalNode
bool isSamePhysicalNode
Definition: CudaComputeNonbonded.h:59

Compute
Definition: Compute.h:28

CudaComputeNonbonded::PatchRecord::patch
Patch * patch
Definition: CudaComputeNonbonded.h:51

ComputeID
int ComputeID
Definition: NamdTypes.h:183

CudaComputeNonbonded::PatchRecord::dEdaSum
GBReal * dEdaSum
Definition: CudaComputeNonbonded.h:76

Vector
Definition: Vector.h:64

HipDefines.h

CudaComputeNonbonded::gbisP2PatchReady
virtual void gbisP2PatchReady(PatchID, int seq)
Definition: CudaComputeNonbonded.C:245

Real
float Real
Definition: common.h:109

CudaTileListKernel
Definition: CudaTileListKernel.h:87

ComputeMgr.h

CudaPatchRecord
Definition: CudaTileListKernel.h:49

CudaComputeNonbonded::PatchRecord
Definition: CudaComputeNonbonded.h:37

CudaComputeNonbonded::messageEnqueueWork
void messageEnqueueWork()
Definition: CudaComputeNonbonded.C:862

CudaComputeNonbonded::PatchRecord::psiSum
GBReal * psiSum
Definition: CudaComputeNonbonded.h:74

CudaComputeNonbonded::PatchRecord::dEdaSumBox
Box< Patch, GBReal > * dEdaSumBox
Definition: CudaComputeNonbonded.h:71

Patch
Definition: Patch.h:35

CudaComputeNonbonded::PatchRecord::patchID
PatchID patchID
Definition: CudaComputeNonbonded.h:50

CudaComputeNonbonded::PatchRecord::bornRadBox
Box< Patch, Real > * bornRadBox
Definition: CudaComputeNonbonded.h:70

VirialEnergy
Definition: CudaTileListKernel.h:78

CudaComputeNonbonded::PatchRecord::intRad
Real * intRad
Definition: CudaComputeNonbonded.h:73

CudaComputeNonbonded::assignPatchesOnPe
void assignPatchesOnPe()
Definition: CudaComputeNonbonded.C:302

CudaComputeNonbonded::gbisP3PatchReady
virtual void gbisP3PatchReady(PatchID, int seq)
Definition: CudaComputeNonbonded.C:251

SubmitReduction
Definition: ReductionMgr.h:304

CudaComputeNonbonded::PatchRecord::isSameNode
bool isSameNode
Definition: CudaComputeNonbonded.h:60

ComputeNonbondedUtil.h

ComputeNonbondedUtil
Definition: ComputeNonbondedUtil.h:243

CudaComputeNonbonded::CudaComputeNonbonded
CudaComputeNonbonded(ComputeID c, int deviceID, CudaNonbondedTables &cudaNonbondedTables, bool doStreaming)
Definition: CudaComputeNonbonded.C:37

CudaComputeNonbonded
Definition: CudaComputeNonbonded.h:27

CudaComputeNonbonded::skipPatchesOnPe
void skipPatchesOnPe()
Definition: CudaComputeNonbonded.C:687

CudaComputeGBISKernel.h

CudaNonbondedTables
Definition: CudaNonbondedTables.h:14

CudaComputeNonbonded::ComputeRecord::patchInd
int patchInd[2]
Definition: CudaComputeNonbonded.h:33

CudaComputeNonbonded::~CudaComputeNonbonded
~CudaComputeNonbonded()
Definition: CudaComputeNonbonded.C:107

ComputeMgr
Definition: ComputeMgr.h:57

CudaComputeNonbonded::doWork
virtual void doWork()
Definition: CudaComputeNonbonded.C:922

CudaComputeNonbonded::PatchRecord::atomStart
int atomStart
Definition: CudaComputeNonbonded.h:54

CudaComputeNonbonded::PatchRecord::numAtoms
int numAtoms
Definition: CudaComputeNonbonded.h:52

CudaComputeNonbonded::unregisterBoxesOnPe
void unregisterBoxesOnPe()
Definition: CudaComputeNonbonded.C:152

CudaComputeNonbonded::PatchRecord::dHdrPrefix
Real * dHdrPrefix
Definition: CudaComputeNonbonded.h:77

CudaComputeNonbonded::openBoxesOnPe
void openBoxesOnPe()
Definition: CudaComputeNonbonded.C:868

PatchID
int PatchID
Definition: NamdTypes.h:182

CudaAtom
Definition: NamdTypes.h:153

CudaTileListKernel.h

CudaComputeNonbondedKernel.h

CudaComputeNonbonded::PatchRecord::PatchRecord
PatchRecord(PatchID patchID)
Definition: CudaComputeNonbonded.h:38

CudaComputeGBISKernel
Definition: CudaComputeGBISKernel.h:5

CudaComputeNonbonded::PatchRecord::results
Results * results
Definition: CudaComputeNonbonded.h:64

CudaComputeNonbonded::registerComputeSelf
void registerComputeSelf(ComputeID cid, PatchID pid)
Definition: CudaComputeNonbonded.C:164

CudaComputeNonbonded::PatchRecord::compAtom
CompAtom * compAtom
Definition: CudaComputeNonbonded.h:62

CudaComputeNonbonded::noWork
virtual int noWork()
Definition: CudaComputeNonbonded.C:887

CudaComputeNonbonded::PatchRecord::forceBox
Box< Patch, Results > * forceBox
Definition: CudaComputeNonbonded.h:67

CudaComputeNonbonded::ComputeRecord::cid
ComputeID cid
Definition: CudaComputeNonbonded.h:30

CudaComputeNonbonded::PatchRecord::operator<
bool operator<(const PatchRecord &pr) const
Definition: CudaComputeNonbonded.h:78

CudaComputeNonbonded::ComputeRecord::pid
PatchID pid[2]
Definition: CudaComputeNonbonded.h:31

CudaComputeNonbonded::patchReady
virtual void patchReady(PatchID, int doneMigration, int seq)
Definition: CudaComputeNonbonded.C:233

CudaComputeNonbonded::PatchRecord::positionBox
Box< Patch, CompAtom > * positionBox
Definition: CudaComputeNonbonded.h:66

Box< Patch, CompAtom >

CudaComputeNonbonded::launchWork
void launchWork()
Definition: CudaComputeNonbonded.C:973

CompAtom
Definition: NamdTypes.h:52

CudaComputeNonbonded::PatchRecord::numFreeAtoms
int numFreeAtoms
Definition: CudaComputeNonbonded.h:53

CudaComputeNonbonded::PatchRecord::psiSumBox
Box< Patch, GBReal > * psiSumBox
Definition: CudaComputeNonbonded.h:69

CudaComputeNonbonded::PatchRecord::bornRad
Real * bornRad
Definition: CudaComputeNonbonded.h:75

CudaComputeNonbonded::PatchRecord::reversePriorityRankInPe
int reversePriorityRankInPe
Definition: CudaComputeNonbonded.h:58

CudaComputeNonbonded::registerComputePair
void registerComputePair(ComputeID cid, PatchID *pid, int *trans)
Definition: CudaComputeNonbonded.C:174

Compute.h

CudaComputeNonbonded::assignPatches
void assignPatches(ComputeMgr *computeMgrIn)
Definition: CudaComputeNonbonded.C:364

CudaNonbondedTables.h

CudaComputeNonbonded::ComputeRecord
Definition: CudaComputeNonbonded.h:29

CudaComputeNonbonded::ComputeRecord::offset
Vector offset
Definition: CudaComputeNonbonded.h:34

Box.h

PatchTypes.h

Compute::cid
const ComputeID cid
Definition: Compute.h:43

CudaComputeNonbonded::atomUpdate
virtual void atomUpdate()
Definition: CudaComputeNonbonded.C:645

GBReal
float GBReal
Definition: ComputeGBIS.inl:17

CudaComputeNonbonded::PatchRecord::operator==
bool operator==(const PatchRecord &pr) const
Definition: CudaComputeNonbonded.h:81