kml_fft(f)_mpi_local_size_3d_transposed

描述了本地进程数据的大小和位置,以及计算需要分配的空间。

接口定义

C interface:

ptrdiff_t kml_fft_mpi_local_size_3d_transposed(ptrdiff_t n0, ptrdiff_t n1, ptrdiff_t n2, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);

ptrdiff_t kml_fftf_mpi_local_size_3d_transposed(ptrdiff_t n0, ptrdiff_t n1, ptrdiff_t n2, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);

ptrdiff_t kml_ffth_mpi_local_size_3d_transposed(ptrdiff_t n0, ptrdiff_t n1, ptrdiff_t n2, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);

返回值

函数返回一个ptrdiff_t类型的值,表示要分配的元素的数量(复数,对于复数DFT)。当前进程应从索引 local_0_start 开始,存储整个输入数据集的切片的 local_n0。也就是说,则当前进程应存储 local_0_start 到 local_0_start+local_n0-1 的输入数据。当前进程应从索引 local_1_start 开始,存储整个输出数据集的切片的 local_n1。也就是说,则当前进程应存储 local_1_start 到 local_1_start+local_n1-1 的输出数据。

参数

参数名

数据类型

描述

输入/输出

n0

  • ptrdiff_t

待处理数据第1维度大小,约束:n0 ≥ 1。

输入

n1

  • ptrdiff_t

待处理数据第1维度大小,约束:n1 ≥ 1。

输入

n2

  • ptrdiff_t

待处理数据第1维度大小,约束:n2 ≥ 1。

输入

comm

  • MPI_Comm

MPI通信器的句柄。

输入

local_n0

  • ptrdiff_t*

本地进程数据大小。

输出

local_0_start

  • ptrdiff_t*

本地进程数据相对全局数据起点偏移量。

输出

local_n1

  • ptrdiff_t*

本地进程输出数据大小。

输出

local_1_start

  • ptrdiff_t*

本地进程输出数据相对全局数据起点偏移量。

输出

依赖

C: "kfft-mpi.h"

示例

    const ptrdiff_t N0 = 4, N1 = 4, N2 = 4;
    kml_fft_plan plan;
    ptrdiff_t alloc_local, local_n0, local_0_start, local_n1, local_1_start;
 
    MPI_Init(&argc, &argv);
    MPI_Comm comm = MPI_COMM_WORLD;
    kml_fft_mpi_init();
    double *in = NULL;
    double *out = NULL;
 
    /* get local data size and allocate */
    alloc_local = kml_fft_mpi_local_size_3d_transposed(N0, N1, N2, comm, &local_n0, &local_0_start,
                                                         &local_n1, &local_1_start);
    if (alloc_local == -1) {
        printf("[%s][%d] allocate size fail!!!\n", __func__, __LINE__);
    }
    in = (double *)kml_fft_malloc(sizeof(double) * alloc_local * 2);
    if (in == NULL) {
        printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__);
    }
    out = (double *)kml_fft_malloc(sizeof(double) * alloc_local * 2);
    if (out == NULL) {
        printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__);
    }
 
    /* create plan for in-place forward DFT */
    plan = kml_fft_mpi_plan_transpose(N0, N1, in, out, comm, KML_FFT_ESTIMATE);    
            
    /* compute transforms, in-place, as many times as desired */
    kml_fft_execute(plan);
 
    kml_fft_destroy_plan(plan);
    kml_fft_mpi_cleanup();
 
    MPI_Finalize();