µÚËÄÕÂ: ¼¯ºÏÍ¨ÐÅ

4.9 È«¾Ö¹éÔ¼²Ù×÷(Global Reduction Operations)

±¾½ÚµÄËùÓÐº¯ÊýÔÚ×éÄÚËùÓÐ³ÉÔ±·¶Î§ÄÚÊµÏÖÈ«¾Ö¹éÔ¼²Ù×÷(±ÈÈçÇóºÍ,Çó¼«´óÖµ,Âß¼ÓëµÈ).Õâ¸ö¹éÔ¼²Ù×÷¼´¿ÉÒÔÊÇMPI¶¨ÒåµÄ²Ù×÷,Ò²¿ÉÒÔÊÇÓÃ»§×Ô¶¨ÒåµÄ²Ù×÷.È«¾Ö¹éÔ¼²Ù×÷·Ö³É¼¸ÖÖÀàÐÍ:Èç½«¹éÔ¼½á¹û·µ»Ø¸øÒ»¸ö½ÚµãµÄ¹éÔ¼²Ù×÷¡¢½«½á¹û·µ»Ø¸øËùÓÐ½ÚµãµÄÈ«¾Ö¹éÔ¼²Ù×÷ºÍËÑË÷(»ò³Æ²¢ÐÐÇ°ÖÃ)²Ù×÷.ÁíÍâ,¹éÔ¼-·ÖÉ¢²Ù×÷ÊÇ½«¹éÔ¼ºÍ·ÖÉ¢²Ù×÷µÄ¹¦ÄÜºÏ²¢ÆðÀ´.

4.9.1 ¹éÔ¼(Reduce)

MPI_REDUCE(sendbuf,recvbuf,count,datatype,op,root,comm)
 IN   sendbuf   ·¢ËÍÏûÏ¢»º³åÇøµÄÆðÊ¼µØÖ·(¿É±ä)
 OUT  recvbuf   ½ÓÊÕÏûÏ¢»º³åÇøÖÐµÄµØÖ·(¿É±ä,½ö¶ÔÓÚ¸ù½ø³Ì)
 IN   count     ·¢ËÍÏûÏ¢»º³åÇøÖÐµÄÊý¾Ý¸öÊý(ÕûÐÍ)
 IN   datatype  ·¢ËÍÏûÏ¢»º³åÇøµÄÔªËØÀàÐÍ(¾ä±ú)
 IN   op        ¹éÔ¼²Ù×÷·û(¾ä±ú)
 IN   root      ¸ù½ø³ÌÐòÁÐºÅ(ÕûÐÍ)
 IN   comm      Í¨ÐÅ×Ó(¾ä±ú)

int MPI_Reduce(void* sendbuf, void* recvbuf, int count,
               MPI_Datatype datatype, MPI_Op op, int root,
               MPI_Comm comm)
MPI_REDUCE(SENDBUF, RECVBUF, COUNT, DATATYPE, OP, ROOT, COMM, IERROR)
    <type> SENDBUF(*), RECVBUF(*)
    INTEGER COUNT, DATATYPE, OP, ROOT, COMM, IERROR

MPI_REDUCE½«×éÄÚÃ¿¸ö½ø³ÌÊäÈë»º³åÇøÖÐµÄÊý¾Ý°´op²Ù×÷×éºÏÆðÀ´,²¢½«Æä½á¹û·µ»Øµ½ÐòÁÐºÅÎªrootµÄ½ø³ÌµÄÊä³ö»º³åÇøÖÐ.ÊäÈë»º³åÇøÓÉ²ÎÊýsendbuf¡¢countºÍdatatype¶¨Òå;Êä³ö»º³åÇøÓÉ²ÎÊýrecvbuf¡¢countºÍdatatype¶¨Òå;Á½ÕßµÄÔªËØÊýÄ¿ºÍÀàÐÍ¶¼ÏàÍ¬.ËùÓÐ×é³ÉÔ±¶¼ÓÃÍ¬ÑùµÄ²ÎÊýcount¡¢datatype¡¢op¡¢rootºÍcommÀ´µ÷ÓÃ´ËÀý³Ì,Òò´ËËùÓÐ½ø³Ì¶¼Ìá¹©³¤¶ÈÏàÍ¬¡¢ÔªËØÀàÐÍÏàÍ¬µÄÊäÈëºÍÊä³ö»º³åÇø.Ã¿¸ö½ø³Ì¿ÉÄÜÌá¹©Ò»¸öÔªËØ»òÒ»ÏµÁÐÔªËØ,×éºÏ²Ù×÷Õë¶ÔÃ¿¸öÔªËØ½øÐÐ.ÀýÈç,Èç¹û²Ù×÷ÊÇ MPI_MAX,·¢ËÍ»º³åÇøÖÐ°üº¬Á½¸ö¸¡µãÊý(count=2²¢ÇÒdatatype=MPI_FLOAT),½á¹ûrecvbuf(1)´æ·Å×ÅËùÓÐsendbuf(1)ÖÐµÄ×î´óÖµ,recvbuf(2)´æ·Å×ÅËùÓÐsendbuf(2)ÖÐµÄ×î´óÖµ.

4.9.2½ÚÖÐÁÐ³öÁËMPIÌá¹©µÄ¶¨Òå²Ù×÷,²¢ÇÒÁÐ³öÁËÃ¿ÖÖ²Ù×÷ËùÔÊÐíµÄÊý¾ÝÀàÐÍ. Í¬Ê±ÓÃ»§Ò²¿ÉÒÔ¶¨Òå×Ô¼ºµÄ×÷ÓÃÓÚ¼¸ÖÖÊý¾ÝÀàÐÍµÄ²Ù×÷,¼´¿ÉÒÔÊÇ»ù±¾µÄÒ²¿ÉÒÔÊÇÅÉÉúµÄ.Õâµã½«ÔÚ4.9.4ÖÐ½øÒ»²½½âÊÍ.

²Ù×÷opÊ¼ÖÕ±»ÈÏÎªÊÇ¿É½áºÏµÄ,²¢ÇÒËùÓÐMPI¶¨ÒåµÄ²Ù×÷±»ÈÏÎªÊÇ¿É½»»»µÄ.ÓÃ»§×Ô¶¨ÒåµÄ²Ù×÷±»ÈÏÎªÊÇ¿É½áºÏµÄ,µ«¿ÉÒÔ²»ÊÇ¿É½»»»µÄ.³£¹æµÄ¶Ô¹éÔ¼½á¹ûµÄ¹À¼ÛË³ÐòÓÉ×éÄÚ¸÷½ø³ÌµÄÐòÁÐºÅËù¾ö¶¨,µ«ÔÚÊµÏÖÖÐ¿ÉÒÔ½èÖúÓÚ½áºÏÐÔµÄÓÅµã,»òÕßÀûÓÃ½áºÏÐÔºÍ½»»»ÐÔÀ´¸Ä±ä¶Ô½á¹ûµÄ¹À¼ÛË³Ðò.µ«Õâ¿ÉÄÜ¸Ä±äÓÐÐ©¶Ô½áºÏÐÔºÍ½»»»ÐÔÃ»ÓÐÌØÊâÏÞÖÆµÄ²Ù×÷½á¹û,±ÈÈç¸¡µã¼Ó·¨.

¶ÔÊµÏÖÕßµÄ½¨Òé:Ç¿ÁÒÍÆ¼öÔÚÊµÏÖMPI_REDUCEÊ±,µ±ÓÃÍ¬ÑùµÄ²ÎÊý¡¢Í¬ÑùµÄË³Ðòµ÷ÓÃ´Ëº¯ÊýÊ±,±ØÐëµÃµ½ÏàÍ¬µÄ½á¹û.×¢ÒâÕâ¿ÉÄÜ·Á°¶Ô´¦Àí»úÎïÀíÎ»ÖÃ½øÐÐµÄÓÅ»¯(¶ÔÊµÏÖÕßµÄ½¨Òé½áÎ²)

ÔÚMPI_REDUCEÖÐdatatypeµÄÀàÐÍ±ØÐëºÍopÏà¼æÈÝ.MPIÖÐ¶¨ÒåµÄ²Ù×÷½öÄÜ×÷ÓÃÓÚ4.9.2½ÚºÍ4.9.3½ÚÖÐÁÐ³öµÄÊý¾ÝÀàÐÍ.ÓÃ»§×Ô¶¨ÒåµÄ²Ù×÷¿ÉÒÔ×÷ÓÃÓÚÍ¨³£µÄ»òÅÉÉúµÄÊý¾ÝÀàÐÍ,,ÕâÖÖÇé¿öÏÂ¹éÔ¼²Ù×÷ÖÐÒýÓÃµÄÕâÖÖÊý¾ÝÀàÐÍµÄ²ÎÊý¿ÉÄÜ°üº¬¼¸¸ö»ù±¾Öµ.Õâ½«ÔÚ4.9.4½ÚÖÐ½øÒ»²½ËµÃ÷.

4.9.2 MPI¶¨ÒåµÄ¹éÔ¼²Ù×÷

MPIÖÐÒÑ¾¶¨ÒåºÃµÄÒ»Ð©²Ù×÷,ËüÃÇÊÇÎªº¯ÊýMPI_REDUCEºÍÒ»Ð©ÆäËûµÄÏà¹Øº¯Êý,ÈçMPI_ALLREDUCE¡¢MPI_REDUCE_SCATTERºÍMPI_SCAN¶ø¶¨ÒåµÄ.ÕâÐ©²Ù×÷ÓÃÀ´Éè¶¨ÏàÓ¦µÄop.

        Ãû×Ö              º¬Òå
        MPI_MAX           ×î´óÖµ
        MPI_MIN           ×îÐ¡Öµ
        MPI_SUM           ÇóºÍ
        MPI_PROD          Çó»ý
        MPI_LAND          Âß¼Óë
        MPI_BAND          °´Î»Óë
        MPI_LOR           Âß¼»ò
        MPI_BOR           °´Î»»ò
        MPI_LXOR          Âß¼Òì»ò
        MPI_BXOR          °´Î»Òì»ò
        MPI_MAXLOC        ×î´óÖµÇÒÏàÓ¦Î»ÖÃ
        MPI_MINLOC        ×îÐ¡ÖµÇÒÏàÓ¦Î»ÖÃ

MPI_MINLOCºÍMPI_MAXLOCÕâÁ½¸ö²Ù×÷½«ÔÚ4.9.3½ÚÖÐ·Ö±ðÌÖÂÛ.ÏÂÃæÁÐ³öMPIÖÐ¶¨ ÒåµÄÆäËûÓÐ¹ØÓÚopºÍdatatype²ÎÊýµÄ²Ù×÷ÒÔ¼°ËüÃÇÖ®¼äÔÊÐíµÄ×éºÏ.Ê×ÏÈÁÐ³ö»ù±¾Êý¾ÝÀàÐÍ×é:

        CÓïÑÔÖÐµÄÕûÐÍ          MPI_INT  MPI_LONG  MPI_SHORT
                             MPI_UNSIGNED_SHORT  MPI_UNSIGNED
                             MPI_UNSIGNED_LONG
        FortranÓïÑÔÖÐµÄÕûÐÍ    MPI_INTEGER
        ¸¡µãÊý               MPI_FLOAT  MPI_DOUBLE  MPI_REAL
                             MPI_DOUBLE_PRECISION  MPI_LONG_DOUBLE
        Âß¼ÐÍ               MPI_LOGICAL
        ¸´ÊýÐÍ               MPI_COMPLEX
        ×Ö½ÚÐÍ               MPI_BYTE

¶ÔÃ¿ÖÖ²Ù×÷ÔÊÐíµÄÊý¾ÝÀàÐÍÈçÏÂ:

        ²Ù×÷                         ÔÊÐíµÄÊý¾ÝÀàÐÍ
        MPI_MAX, MPI_MIN             CÕûÊý,FortranÕûÊý,¸¡µãÊý
        MPI_SUM, MPI_PROD            CÕûÊý,FortranÕûÊý,¸¡µãÊý,¸´Êý
        MPI_LAND, MPI_LOR, MPI_LXOR  CÕûÊý,Âß¼ÐÍ
        MPI_BAND, MPI_BOR, MPI_BXOR  CÕûÊý,FortranÕûÊý,×Ö½ÚÐÍ

Àý4.15 ÓÉÒ»×é½ø³Ì·Ö²¼Ê½µØ¼ÆËãÁ½¸öÏòÁ¿µÄµã»ý,È»ºó½«½á¹û·µ»Øµ½0ºÅ½Úµã.

    SUBROUTINE PAR_BLAS1(m, a, b, c, comm)
    REAL a(m), b(m)      ! Êý×éµÄ¾Ö²¿²¿·Ö
    REAL c               ! ½á¹û±äÁ¿(ÔÚ0ºÅ½Úµã)
    REAL sum
    INTEGER m, comm, i, ierr
    ! ¾Ö²¿ºÍ
    sum = 0.0
    DO i = 1, m
       sum = sum + a(i)*b(i)
    END DO

    ! È«¾ÖºÍ
    CALL MPI_REDUCE(sum, c, 1, MPI_REAL, MPI_SUM, 0, comm, ierr)
    RETURN

Àý4.16: ÓÉÒ»×é½ø³Ì·Ö²¼Ê½µØ¼ÆËãÒ»¸öÏòÁ¿ºÍÒ»¸öÊý×éµÄ³Ë»ý,È»ºó½«½á¹û·µ»Øµ½0ºÅ½Úµã.

    SUBROUTINE PAR_BLAS2(m, n, a, b, c, comm)
    REAL a(m), b(m,n)    ! Êý×éµÄ¾Ö²¿²¿·Ö
    REAL c(n)            ! ½á¹û
    REAL sum(n)
    INTEGER n, comm, i, j, ierr
    ! ¾Ö²¿ºÍ
    DO j = 1, n
       sum(j) = 0.0
       DO i = 1, m
          sum(j) = sum(j) + a(i)*b(i,j)
       END DO
    END DO
    ! È«¾ÖºÍ
    CALL MPI_REDUCE(sum, c, n, MPI_REAL, MPI_SUM, 0, comm, ierr)
    ! ½«½á¹û·µ»Ø0ºÅ½Úµã(²¢ÔÚÆäËû½Úµã×÷·ÏÁÏÊÕ¼¯)
    RETURN

4.9.3 MINLOCºÍMAXLOC

MPI_MINLOC²Ù×÷·ûÓÃÓÚ¼ÆËãÈ«¾Ö×îÐ¡ÖµºÍÕâ¸ö×îÐ¡ÖµµÄË÷ÒýºÅ,MPI_MAXLOC²Ù×÷ ·ûÓÃÓÚ¼ÆËãÈ«¾Ö×î´óÖµºÍÕâ¸ö×î´óÖµµÄË÷ÒýºÅ,ÕâÁ½¸öº¯ÊýµÄÒ»¸öÓÃÍ¾ÊÇ¼ÆËãÒ»¸öÈ«¾Ö×îÐ¡Öµ(×î´óÖµ)ºÍÕâ¸öÖµËùÔÚµÄ½ø³ÌÐòÁÐºÅ.

MPI_MAXLOC±»¶¨ÒåÎª:

ÕâÀï ¡¡¡¡w=max(u,v) ÇÒ

MPI_MINLOC±»¶¨ÒåÎª:

ÕâÀï ¡¡¡¡w=min(u,v) ÇÒ

Á½¸ö²Ù×÷¶¼ÊÇ¿É½áºÏ¡¢¿É½»»»µÄ.Èç½«MPI_MAXLOCÓ¦ÓÃÓÚ(u₀,0),(u₁,1),..,(u_n-1,n-1)Õâ¸öÐòÁÐÉÏ½øÐÐ¹éÔ¼,ÄÇÃ´(u,r)½«±»·µ»Ø,ÕâÀïu = max_iu_iÇÒrÊÇµÚÒ»¸öÈ« ¾Ö×î´óÖµËùÔÚµÄÎ»ÖÃ.ÕâÑùÈç¹û×éÄÚµÄÃ¿¸ö½ø³Ì¶¼Ìá¹©Ò»¸öÖµºÍËü×ÔÉíµÄÐòÁÐºÅ,ÄÇÃ´op = MPI_MAXLOCµÄ¹éÔ¼²Ù×÷½«·µ»ØÆäÖÐµÄ×î´óÖµºÍ¾ßÓÐ×î´óÖµµÄµÚÒ»¸ö½ø³ÌµÄÐòÁÐºÅ.Í¬ ÑùMPI_MINLOC¿ÉÒÔ±»ÓÃÓÚ·µ»Ø×îÐ¡ÖµºÍËüËùÔÚµÄÎ»ÖÃ.¸üÒ»°ãµØ½²,MPI_MINLOC¿ÉÒÔ¼ÆËã×ÖµäÐòµÄ×îÐ¡Öµ,ÕâÀïÔªËØÊÇ°´ÕÕÖµ¶ÔÖÐµÄµÚÒ»¸ö×é·Ö½øÐÐÅÅÐò,¶øÆäË÷ÒýºÅÔòÓÉÖµ¶ÔÖÐµÄµÚ¶þ¸ö×é·Ö½øÐÐÇó½â.

ÕâÖÖ¹éÔ¼²Ù×÷×÷ÓÃÓÚÒ»¸öÖµ¶ÔÉÏ,°üÀ¨ÖµºÍÆäË÷ÒýºÅ.ÔÚFortranºÍCÓïÑÔÖÐ,Öµ¶Ô¶¼ÒªÓÐÏàÓ¦µÄÀàÐÍ,ÕâÖÖ²ÎÊýµÄ»ìºÏÀàÐÍ¶ÔFortranÓïÑÔÀ´ËµÊÇ±È½ÏÀ§ÄÑµÄ.ÔÚFortranÖÐµÄ½â¾ö·½°¸ÊÇ:Öµ¶ÔÖÐÖµµÄÀàÐÍÊÇÏàÍ¬µÄ,¶¼²ÉÓÃMPIÖÐËùÌá¹©µÄÀàÐÍ,²¢ÇÒË÷ÒýºÅÒ²±ØÐë¾ßÓÐºÍÖµÏàÍ¬µÄÀàÐÍ;ÔÚCÓïÑÔÖÐ,ÕâÐ©Öµ¶Ô¿ÉÒÔÓÐ²»Í¬µÄÀàÐÍÇÒË÷ÒýºÅ±ØÐëÊÇÕûÐÍ.

ÎªÁËÔÚ¹éÔ¼²Ù×÷ÖÐÊ¹ÓÃMPI_MINLOCºÍMPI_MAXLOC,±ØÐëÌá¹©±íÊ¾Õâ¸öÖµ¶Ô(Öµ¼°ÆäË÷ÒýºÅ)²ÎÊýµÄÀàÐÍ.MPI¶¨ÒåÁËÆß¸öÕâÑùµÄÀàÐÍ,MPI_MAXLOCºÍMPI_MINLOC ¿ÉÒÔ²É ÓÃÏÂÁÐµÄÊý¾ÝÀàÐÍ:

    FortranÓïÑÔÖÐ:

        Ãû×Ö                       ÃèÊö
        MPI_2REAL                  ÊµÐÍÖµ¶Ô
        MPI_2DOUBLE_PRECISION      Ë«¾«¶È±äÁ¿Öµ¶Ô
        MPI_2INTEGER               ÕûÐÍÖµ¶Ô

    CÓïÑÔÖÐ:

        Ãû×Ö                       ÃèÊö
        MPI_FLOAT_INT              ¸¡µãÐÍºÍÕûÐÍ
        MPI_DOUBLE_INT             Ë«¾«¶ÈºÍÕûÐÍ
        MPI_LONG_INT               ³¤ÕûÐÍºÍÕûÐÍ
        MPI_2INT                   ÕûÐÍÖµ¶Ô
        MPI_SHORT_INT              ¶ÌÕûÐÍºÍÕûÐÍ
        MPI_LONG_DOUBLE_INT        ³¤Ë«¾«¶È¸¡µãÐÍºÍÕûÐÍ

ÀàÐÍMPI_2REAL¿ÉÒÔÀí½â³É°´ÏÂÁÐ·½Ê½µÄ¶¨Òå(¼û3.12½Ú)

    MPI_TYPE_CONTIGUOUS(2, MPI_REAL, MPI_2REAL)

MPI_2INTEGER¡¢MPI_2DOUBLE_PRECISIONºÍMPI_2INTµÄ¶¨Òå·½Ê½ºÍMPI_2REAL Ïà·Â,MPI_FLOAT_INTÀàÐÍºÍÏÂÁÐÖ¸ÁîµÈ¼Û:

    type[0] = MPI_FLOAT
    type[1] = MPI_INT
    disp[0] = 0
    disp[1] = sizeof(float)
    block[0] = 1
    block[1] = 1
    MPI_TYPE_STRUCT(2, block, disp, type, MPI_FLOAT_INT)

MPI_LONG_INTºÍMPI_DOUBLE_INTµÄ¶¨Òå·½Ê½ºÍMPI_FLOAT_INTÏà·Â.

Àý4.17: Ã¿¸ö½ø³Ì¶¼ÓÐÒ»30¸öË«¾«¶ÈÊýµÄÊý×é(ÒÔCÓïÑÔÎªÀý),¼ÆËã30¸öÎ»ÖÃÉÏµÄÖµ²¢·µ»Ø°üº¬×î´óÖµµÄ½ø³ÌÐòÁÐºÅ.

    /* Ã¿¸ö½ø³Ì¶¼ÓÐÒ»30¸öË«¾«¶ÈÊý×éain[30] */
    double ain[30],aout[30];
    int ind[30];
    struct {
        double val;
        int rank;
    } in[30], out[30];
    int i, myrank, root;

    MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
    for (i=0; i<30; ++i) {
        in[i].val = ain[i];
        in[i].rank = myrank;
    }
    MPI_Reduce(in, out, 30, MPI_DOUBLE_INT, MPI_MAXLOC, root, comm);
    /* ´ËÊ±½á¹û¹éÔ¼µ½¸ù½ø³Ì */
    if (myrank == root) {
        /* ¶Á³öÆäÖµ */
       for (i=0; i<30; ++i) {
           aout[i] = out[i].val;
           ind[i] = out[i].rank;
       }
    }

Àý4.18: ºÍÉÏÀýÏàÍ¬,Ö»ÊÇÓÃFortranÓïÑÔÊéÐ´.

    ! Ã¿¸ö½ø³Ì¶¼ÓÐÒ»30¸öË«¾«¶ÈÐÍµÄÊý×éain(30)
    DOUBLE PRECISION ain(30), aout(30)
    INTEGER ind(30);
    DOUBLE PRECISION in(2,30), out(2,30)
    INTEGER i, myrank, root, ierr;

    MPI_COMM_RANK(MPI_COMM_WORLD, myrank);
    DO I=1, 30
        in(1,i) = ain(i)
        in(2,i) = myrank    ! myrank±ØÐëÊÇÒ»¸öË«¾«¶ÈÐÍ
    END DO

    MPI_REDUCE(in, out, 30, MPI_2DOUBLE_PRECISION, MPI_MAXLOC, root,
               comm, ierr);
    ! ´ËÊ±½á¹û¹éÔ¼µ½¸ù½ø³Ì
    IF (myrank .EQ. root) THEN
        ! ¶Á³öÆäÖµ
        DO I = 1, 30
             aout(i) = out(1,i)
             ind(i) = out(2,i)    ! rank±»Ç¿ÖÆ×ª»»»ØÕûÐÍ
        END DO
    END IF

Àý4.19: Ã¿¸ö½ø³ÌÓÐÒ»¸ö·Ç¿ÕÊý×é,ÕÒ³öÈ«¾Ö×îÐ¡Öµ¡¢ÓµÓÐ´Ë×îÐ¡ÖµµÄ½ø³ÌÐòÁÐºÅ¼°ÔÚ´Ë½ø³ÌµÄÎ»ÖÃ.

    #define LEN 1000

    float val[LEN];    /* ¾Ö²¿Êý×é */
    int count;         /* ¾Ö²¿Öµ */
    int myrank, minrank, minindex;
    float minval;

    struct {
        float value;
        int index;
    } in, out;
        /* ¾Ö²¿×îÐ¡Öµ¼°ÆäË÷ÒýºÅ */
    in.value = val[0];
    in.index = 0;
    for (i=1; i < count; i++)
        if (in.value > val[i]) {
            in.value = val[i];
            in.index = i;
        }
        /* È«¾Ö×îÐ¡Öµ¼°ÆäË÷ÒýºÅ */
    MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
    in.index = myrank*LEN + in.index;
    MPI_Reduce(in, out, 1, MPI_FLOAT_INT, MPI_MINLOC, root, comm);
        /* ´ËÊ±½á¹û·µ»Øµ½¸ù½ø³Ì */
    if (myrank == root) {
        /* ¶Á³öÆäÖµ */
       minval = out.value;
       minrank = out.index/LEN;
       minindex = out.index%LEN;
    }

ÔÔò: ¶ÔMPI_MINLOCºÍMPI_MAXLOCµÄ¶¨ÒåÌá¹©ÁËÕâÑùÒ»ÖÖºÃ´¦:Ëü¿ÉÒÔ²»¾¹ýÈÎ ºÎÌØÊâ´¦ÀíÍê³ÉÁ½¸ö²Ù×÷,Æä¹ý³ÌºÍÆäËû¹éÔ¼²Ù×÷ºÜÏàÏó.³ÌÐòÔ±¿ÉÒÔ°´ÆäÔ¸Íû¶ÔMPI_MAXLOCºÍMPI_MINLOC ½øÐÐ¶¨Òå.ÆäÈ±ÏÞÊÇÖµºÍË÷ÒýºÅ±ØÐë½»´í·ÅÖÃ,²¢ÇÒÔÚ FortranÓïÑÔÖÐÖµºÍË÷ÒýºÅµÄÀàÐÍ±ØÐëÒ»ÖÂ.(ÔÔò½áÎ²)

4.9.4 ÓÃ»§×Ô¶¨ÒåµÄ²Ù×÷

MPI_OP_CREATE(function, commute, op)
 IN   function   ÓÃ»§×Ô¶¨ÒåµÄº¯Êý(º¯Êý)
 IN   commute    ¿É½»»»ÔòÎªtrue,·ñÔòÎªfalse
 OUT  op         ²Ù×÷(¾ä±ú)

int MPI_Op_create(MPI_User_function *function,int commute,MPI_Op *op)

MPI_OP_CREATE(FUNCTION, COMMUTE, OP, IERROR)
    EXTERNAL FUNCTION
    LOGICAL COMMUTE
    INTEGER OP, IERROR

MPI_OP_CREATE½«ÓÃ»§×Ô¶¨ÒåµÄ²Ù×÷ºÍop°ó¶¨ÔÚÒ»Æð,¿ÉÒÔÓÃÓÚº¯ÊýMPI_REDUCE ¡¢MPI_ALLREDUCE¡¢MPI_REDUCE_SCATTERºÍMPI_SCANÖÐ.ÓÃ»§×Ô¶¨ÒåµÄ²Ù×÷±»ÈÏÎªÊÇ¿ÉÒÔ½áºÏµÄ.Èç¹ûcommute=true,Ôò´Ë²Ù×÷ÊÇ¿É½»»»ÇÒ¿É½áºÏµÄ;Èç¹ûcommute=false,Ôò´Ë²Ù×÷µÄË³ÐòÊÇ¹Ì¶¨µØ°´½ø³ÌÐòÁÐºÅÉýÐò·½Ê½½øÐÐ,¼´´ÓÐòÁÐºÅÎª0µÄ½ø³Ì¿ªÊ¼.

functionÊÇÓÃ»§×Ô¶¨ÒåµÄº¯Êý,±ØÐë¾ß±¸ËÄ¸ö²ÎÊý: invec, inoutvec, lenºÍdatatype.

ÔÚANSI CÖÐÕâ¸öº¯ÊýµÄÔÐÍÊÇ:

    typedef void MPI_User_function(void *invec, void *inoutvec, 
                                   int *len, MPI_Datatype *datatype);

ÔÚFortranÖÐ¶ÔÓÃ»§×Ô¶¨ÒåµÄº¯ÊýÃèÊöÈçÏÂ:

    FUNCTION USER_FUNCTION(INVEC(*), INOUTVEC(*), LEN, TYPE)
       <type> INVEC(LEN), INOUTVEC(LEN)
       INTEGER LEN, TYPE

²ÎÊýdatatypeÓÃÓÚ¿ØÖÆ´«ËÍ¸øMPI_REDUCEµÄÊý¾ÝÀàÐÍ.ÓÃ»§µÄ¹éÔ¼º¯ÊýÓ¦µ±Ð´³ÉÏÂÁÐ·½Ê½:µ±º¯Êý±»¼¤»îÊ±,ÈÃu[0],...,u[len-1]ÊÇÍ¨ÐÅ»º³åÇøÖÐlen¸öÓÉ²ÎÊýinvec¡¢lenºÍdatatypeÃèÊöµÄÔªËØ;ÈÃv[0],...,v[ len- 1]ÊÇÍ¨ÐÅ»º³åÇøÖÐlen¸öÓÉ²ÎÊýinoutvec¡¢lenºÍdatatypeÃèÊöµÄÔªËØ;µ±º¯Êý·µ»ØÊ±,ÈÃw[0],...,w[len-1]ÊÇÍ¨ÐÅ»º³åÇøÖÐlen¸öÓÉ²ÎÊýinoutvec¡¢lenºÍdatatypeÃèÊöµÄÔªËØ;´ËÊ±w[i] = u[i]¡¤v[i] ,i´Ó0µ½len-1,ÕâÀï¡¤ÊÇfunctionËù¶¨ÒåµÄ¹éÔ¼²Ù×÷.

´Ó·ÇÕýÊ½µÄ½Ç¶ÈÀ´¿´,ÎÒÃÇ¿ÉÒÔÈÏÎªinvecºÍinoutvecÊÇº¯ÊýÖÐ³¤¶ÈÎªlenµÄÊý×é,¹éÔ¼µÄ½á¹ûÖØÐ´ÁËinoutvecµÄÖµ.Ã¿´Îµ÷ÓÃ´Ëº¯Êý¶¼µ¼ÖÂÁË¶ÔÕâlen¸öÔªËØÖð¸ö½øÐÐÏàÓ¦µÄ²Ù×÷,ÀýÈç:º¯Êý½«invec[i]¡¤inoutvec[i]µÄ½á¹û·µ»Øµ½inoutvec[i]ÖÐ,i´Ó0 µ½count-1,ÕâÀï¡¤ÊÇÓÉ´Ëº¯ÊýÖ´ÐÐµÄ¹éÔ¼²Ù×÷.

ÔÔò: ²ÎÊýlen¿ÉÒÔÊ¹MPI_REDUCE²»È¥µ÷ÓÃÊäÈë»º³åÇøÖÐµÄÃ¿¸öÔªËØ,Ò²¾ÍÊÇËµ,ÏµÍ³¿ÉÒÔÓÐÑ¡ÔñµØ¶ÔÊäÈë½øÐÐ´¦Àí.ÔÚCÓïÑÔÖÐ,ÎªÁËÓëFortranÓïÑÔ¼æÈÝ,´Ë²ÎÊýÒÔÒýÓÃµÄ·½Ê½´«ËÍ.

Í¨¹ýÄÚ²¿¶ÔÊý¾ÝÀàÐÍ²ÎÊýdatatypeµÄÖµÓëÒÑÖªµÄ¡¢È«¾Ö¾ä±ú½øÐÐ±È½Ï,¾Í¿ÉÄÜ½«Ò»¸öÓÃ»§×Ô¶¨ÒåµÄ²Ù×÷×÷ÓÃÓÚ¼¸ÖÖ²»Í¬µÄÊý¾ÝÀàÐÍ.(ÔÔò½áÎ²)

Í¨³£µÄÊý¾ÝÀàÐÍ¿ÉÒÔ´«¸øÓÃ»§×Ô¶¨ÒåµÄ²ÎÊý,È»¶ø»¥²»ÏàÁÚµÄÊý¾ÝÀàÐÍ¿ÉÄÜ»áµ¼ÖÂµÍÐ§ÂÊ.

ÔÚÓÃ»§×Ô¶¨ÒåµÄº¯ÊýÖÐ²»ÄÜµ÷ÓÃMPIÖÐµÄÍ¨ÐÅº¯Êý.µ±º¯Êý³ö´íÊ±¿ÉÄÜ»áµ÷ÓÃMPI_ABORT.

¶ÔÓÃ»§µÄ½¨Òé:¼ÙÉèÓÃ»§½¨Á¢ÁËÒ»¸ö¿ÉÖØÔØµÄ×Ô¶¨Òå¹éÔ¼º¯Êý¿â:ÔÚÃ¿´Îµ÷ÓÃÊ±,¸ù¾Ý²Ù×÷ÊýµÄÀàÐÍ,²ÎÊýdatatypeÓÃÓÚÑ¡ÔñÕýÈ·µÄÖ´ÐÐÂ·¾¶.ÓÃ»§×Ô¶¨ÒåµÄ¹éÔ¼²Ù×÷²»ÄÜ¶Ô´«ËÍ¸øËüµÄÊý¾ÝÀàÐÍ½øÐÐ"ÒëÂë"²Ù×÷,Ò²²»ÄÜ×Ô¶¯Ê¶±ðÊý¾ÝÀàÐÍ¾ä±úºÍËüËù´ú±íµÄÊý¾ÝÀàÐÍÖ®¼äµÄ¶ÔÓ¦¹ØÏµ.ÕâÖÖ¶ÔÓ¦¹ØÏµÓ¦µ±ÔÚ½¨Á¢Êý¾ÝÀàÐÍÊ±Íê³É.ÔÚÊ¹ÓÃÕâ¸ö¿âÊ±,±ØÐëÏÈÖ´ÐÐ¿â³õÊ¼»¯²Ù×÷,³õÊ¼»¯Ê±½«¶¨Òå¿âÖÐÒªÊ¹ÓÃµÄÊý¾ÝÀàÐÍ,²¢½«Æä¾ä±ú´æ·Åµ½¿ÉÒÔ±»ÓÃ»§´úÂëºÍ³ÌÐò¿â´úÂëÄÜ·ÃÎÊµ½µÄÈ«¾Ö¡¢¾²Ì¬±äÁ¿ÖÐ.

Fortran°æ±¾µÄMPI_REDUCE½«ÓÃFortranÓïÑÔÖÐµ÷ÓÃ·½Ê½À´µ÷ÓÃÒ»¸öÓÃ»§×Ô¶¨ÒåµÄ¹éÔ¼º¯Êý,²¢´«¸øËüÒ»¸öFortranÖÐµÄÊý¾ÝÀàÐÍ;C°æ±¾µÄMPI_REDUCEÒÔCÓïÑÔµÄ·½Ê½ºÍCÓïÑÔÖÐÕâÖÖÊý¾ÝÀàÐÍ¾ä±úÀ´µ÷ÓÃ´Ëº¯Êý.Ó¦ÓÃ»ìºÏÐÍÓïÑÔµÄÓÃ»§Ðë¶¨ÒåÏàÓ¦µÄ¹éÔ¼º¯Êý(¶ÔÓÃ»§µÄ½¨Òé½áÎ²)

¶ÔÊµÏÖÕßµÄ½¨Òé:ÏÂÃæ¸ø³öMPI_REDUCE±¾ÖÊµÄµ«·Ç¸ßÐ§µÄÊµÏÖ¹ý³Ì.

    if (rank > 0) {
        RECV(tempbuf, count, datatype, rank-1,...)
        User_reduce(tempbuf, sendbuf, count, datatype)
    }
    if (rank < groupsize-1) {
        SEND(sendbuf, count, datatype, rank+1,...)
    }
    /* ½á¹ûÎ»ÓÚ½ø³Ìgroupsize-1ÉÏ,ÏÖÔÚ½«Æä·¢ËÍµ½¸ù½ø³Ì */
    if (rank == groupsize-1) {
        SEND(sendbuf, count, datatype, root, ...)
    }
    if (rank == root) {
        RECV(recvbuf, count, datatype, groupsize-1,...)
    }

¹éÔ¼²Ù×÷Ë³ÐòµØ¡¢ÒÀ´ÎµØ´Ó½ø³Ì0¼ÆËãµ½½ø³Ìgroupsize-1.ÕâÑùÑ¡ÔñË³ÐòµÄÔÒòÊÇÎªÁËÕÕ¹ËÓÃ»§×Ô¶¨ÒåµÄUser_reduceº¯ÊýÖÐÓÐÐ©²Ù×÷µÄË³ÐòÊÇ²»¿É½»»»µÄ.¸üÓÐÐ§µÄÊµÏÖ·½·¨ÊÇ²ÉÓÃ¿É½áºÏÐÔµÄÌØµã»òÓ¦ÓÃ¶ÔÊýÊ÷ÐÎ¹éÔ¼·¨.¶ÔÓÚÔÚMPI_OP_CREATE ÖÐ commuteÎªtrueµÄÇé¿ö,»¹¿ÉÒÔÀûÓÃ¿É½»»»ÐÔµÄÌØµã,Ò²¾ÍÊÇËµ¿ÉÒÔ¶Ô»º³åÇøÖÐµÄÒ»²¿·ÖÊý¾Ý½øÐÐ¹éÔ¼²Ù×÷,ÕâÑùÍ¨ÐÅºÍ¼ÆËã¾Í¿ÉÒÔÁ÷Ë®Ö´ÐÐ,¼´¿ÉÒÔ´«ËÍµÄÊý¾Ý¿éµÄ³¤¶Èlen¿ÉÒÔÐ¡ÓÚcount.

MPIÖÐ¶¨ÒåºÃµÄ²Ù×÷¿ÉÒÔ×÷ÎªÓÃ»§×Ô¶¨Òå²Ù×÷µÄÒ»¸ö¿â,µ«Îª»ñµÃ¸üºÃµÄÐÔÄÜ,MPI_REDUCEÓ¦¸ù¾Ý¾ßÌåÇé¿öÌØÊâ´¦Àí(¶ÔÊµÏÖÕßµÄ½¨Òé½áÎ²)

MPI_OP_FREE(op)
 IN  op      ²Ù×÷(¾ä±ú)

int MPI_op_free(MPI_Op *op)

MPI_OP_FREE(OP, IERROR)
    INTEGER OP, IERROR

ÈçÒª½«ÓÃ»§×Ô¶¨ÒåµÄ¹éÔ¼²Ù×÷³·Ïû,½«opÉèÖÃ³ÉMPI_OP_NULL.

Ó¦ÓÃÓÃ»§×Ô¶¨ÒåµÄ¹éÔ¼²Ù×÷µÄÀý×Ó

Àý4.20 ¼ÆËãÒ»¸ö¸´ÊýÊý×éµÄ»ý(ÓÃCÓïÑÔ±à³Ì)

    typedef struct {
        double real,imag;
    } Complex;
    /* ÓÃ»§×Ô¶¨ÒåµÄº¯Êý */
    void myProd(Complex *in, Complex *inout, int *len, MPI_Datatype *dptr)
    {
        int i;
        Complex c;

        for (i=0; i < *len; ++i) {
            c.real = inout->real*in->real - inout->imag*in->imag;
            c.imag = inout->real*in->imag + inout->imag*in->real;
            *inout = c;
            in++; inout++;
        }
    }
    /* È»ºóµ÷ÓÃËü */
    /* Ã¿¸ö½ø³Ì¶¼ÓÐÒ»¸ö100¸öÔªËØµÄ¸´ÊýÊý×é */
    Complex a[100], answer[100];
    MPI_Op myOp;
    MPI_Datatype ctype;

    /* ¸æÖ®MPI¸´Êý½á¹¹ÊÇÈçºÎ¶¨ÒåµÄ */
    MPI_Type_contiguous(2, MPI_DOUBLE, &ctype);
    MPI_Type_commit(&ctype);
    /* Éú³ÉÓÃ»§¶¨ÒåµÄ¸´Êý³Ë»ý²Ù×÷ */
    MPI_Op_create(myProd, True, &myOp);
    MPI_Reduce(a, answer, 100, ctype, myOp, root, comm);
    /* ÕâÊ±½á¹û(Îª100¸ö¸´Êý)¾ÍÒÑ¾´æ·ÅÔÚ¸ù½ø³Ì */

4.9.5 È«¾Ö¹éÔ¼(All-Reduce)

MPIÖÐ»¹°üÀ¨¶ÔÃ¿¸ö¹éÔ¼²Ù×÷µÄ±äÐÎ,¼´½«½á¹û·µ»Øµ½×éÄÚµÄËùÓÐ½ø³Ì.MPIÒªÇó×éÄÚËùÓÐ²ÎÓëµÄ½ø³Ì¶¼¹éÔ¼Í¬Ò»¸ö½á¹û.

MPI_ALLREDUCE(sendbuf, recvbuf, count, datatype, op, comm)
 IN   sendbuf     ·¢ËÍÏûÏ¢»º³åÇøµÄÆðÊ¼µØÖ·(¿É±ä)
 OUT  recvbuf     ½ÓÊÕÏûÏ¢»º³åÇøµÄÆðÊ¼µØÖ·(¿É±ä)
 IN   count       ·¢ËÍÏûÏ¢»º³åÇøÖÐµÄÊý¾Ý¸öÊý(ÕûÐÍ)
 IN   datatype    ·¢ËÍÏûÏ¢»º³åÇøÖÐµÄÊý¾ÝÀàÐÍ(¾ä±ú)
 IN   op          ²Ù×÷(¾ä±ú)
 IN   comm        Í¨ÐÅ×Ó(¾ä±ú)

int MPI_Allreduce(void* sendbuf, void* recvbuf, int count,
                  MPI_Datatype datatype, MPI_Op op, MPI_Comm comm)
MPI_ALLREDUCE(SENDBUF, RECVBUF, COUNT, DATATYPE, OP, COMM, IERROR)
    <type> SENDBUF(*), RECVBUF(*)
    INTEGER COUNT, DATATYPE, OP, COMM, IERROR

³ýÁË½«½á¹û·µ»Ø¸ø×éÄÚµÄËùÓÐ³ÉÔ±Íâ,ÆäËûÍ¬MPI_REDUCE.

¶ÔÊµÏÖÕßµÄ½¨Òé: È«¾Ö¹éÔ¼²Ù×÷(all-reduce)¿ÉÒÔÓÉ¹éÔ¼²Ù×÷reduceºÍ¹ã²¥²Ù×÷(broadcast)À´ÊµÏÖ,µ«Ö±½ÓÊµÏÖ¿ÉÒÔ»ñµÃ¸üºÃµÄÐÔÄÜ.(¶ÔÊµÏÖÕßµÄ½¨Òé½áÎ²)

Àý4.21: ÔÚÒ»×é·Ö²¼Ê½µÄ½ø³ÌÉÏ¼ÆËãÒ»¸öÏòÁ¿ºÍÒ»¸öÊý×éµÄ³Ë»ý,²¢½«½á¹û·µ»Øµ½ËùÓÐ½ÚµãÉÏ(¼ûÀý4.16).

    SUBROUTINE PAR_BLAS2(m, n, a, b, c, comm)
    REAL a(m), b(m,n)   ! ¾Ö²¿Êý×é
    REAL c(n)           ! ½á¹û
    REAL sum(n)
    INTEGER n, comm, i, j, ierr

    ! ¾Ö²¿ºÍ
    DO j = 1 , n
       sum(j) = 0.0
       DO i = 1, m
          sum(j) = sum(j) + a(i)*b(i,j)
       END DO
    END DO

    ! È«¾ÖºÍ
    CALL MPI_ALLREDUCE(sum, c, n, MPI_REAL, MPI_SUM, 0, comm, ierr)

    ! ½«½á¹û·µ»Ø¸øËùÓÐ½Úµã
    RETURN