描述了本地进程数据的大小和位置,以及计算需要分配的空间。
C interface:
ptrdiff_t kml_fft_mpi_local_size_2d_transposed(ptrdiff_t n0, ptrdiff_t n1, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);
ptrdiff_t kml_fftf_mpi_local_size_2d_transposed(ptrdiff_t n0, ptrdiff_t n1, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);
ptrdiff_t kml_ffth_mpi_local_size_2d_transposed(ptrdiff_t n0, ptrdiff_t n1, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);
函数返回一个ptrdiff_t类型的值,表示要分配的元素的数量。
参数名 |
数据类型 |
描述 |
输入/输出 |
---|---|---|---|
n0 |
|
待处理数据第1维度大小,约束:n0 ≥ 1。 |
输入 |
n1 |
|
待处理数据第1维度大小,约束:n1 ≥ 1。 |
输入 |
comm |
|
MPI通信器的句柄。 |
输入 |
local_n0 |
|
本地进程数据大小。 |
输出 |
local_0_start |
|
本地进程数据相对全局数据起点偏移量。 |
输出 |
local_n1 |
|
本地进程输出数据大小。 |
输出 |
local_1_start |
|
本地进程输出数据相对全局数据起点偏移量。 |
输出 |
C: "kfft-mpi.h"
const ptrdiff_t N0 = 4, N1 = 4; kml_fft_plan plan; ptrdiff_t alloc_local, local_n0, local_0_start, local_n1, local_1_start; MPI_Init(&argc, &argv); MPI_Comm comm = MPI_COMM_WORLD; kml_fft_mpi_init(); double *in = NULL; double *out = NULL; /* get local data size and allocate */ alloc_local = kml_fft_mpi_local_size_2d_transposed(N0, N1, comm, &local_n0, &local_0_start, &local_n1, &local_1_start); if (alloc_local == -1) { printf("[%s][%d] allocate size fail!!!\n", __func__, __LINE__); } in = (double *)kml_fft_malloc(sizeof(double) * alloc_local * 2); if (in == NULL) { printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__); } out = (double *)kml_fft_malloc(sizeof(double) * alloc_local * 2); if (out == NULL) { printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__); } /* create plan for in-place forward DFT */ plan = kml_fft_mpi_plan_transpose(N0, N1, in, out, comm, KML_FFT_ESTIMATE); /* compute transforms, in-place, as many times as desired */ kml_fft_execute(plan); kml_fft_destroy_plan(plan); kml_fft_mpi_cleanup(); MPI_Finalize();