描述了本地进程数据的大小和位置,以及计算需要分配的空间。
C interface:
ptrdiff_t kml_fft_mpi_local_size_many_transposed(int rank, const ptrdiff_t *n, ptrdiff_t howmany, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);
ptrdiff_t kml_fftf_mpi_local_size_many_transposed(int rank, const ptrdiff_t *n, ptrdiff_t howmany, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);
函数返回一个ptrdiff_t类型的值,表示要分配的元素的数量。
参数名 |
数据类型 |
描述 |
输入/输出 |
---|---|---|---|
rank |
|
待处理数据维度数量,约束:rank ≥ 1 |
输入 |
n |
|
n是维度为rank的数组,包含数据序列每一维度的大小,约束:n[i] ≥ 1, for i in 0 to rank - 1。 |
输入 |
howmany |
|
howmany表示要多少个变换。 |
输入 |
comm |
|
MPI通信器的句柄。 |
输入 |
local_n0 |
|
本地进程数据大小。 |
输出 |
local_0_start |
|
本地进程数据相对全局数据起点偏移量。 |
输出 |
local_n1 |
|
本地进程输出数据大小。 |
输出 |
local_1_start |
|
本地进程输出数据相对全局数据起点偏移量。 |
输出 |
C: "kfft-mpi.h"
const ptrdiff_t N0 = 4, N1 = 4; kml_fft_plan plan; ptrdiff_t alloc_local, local_n0, local_0_start, local_n1, local_1_start; MPI_Init(&argc, &argv); MPI_Comm comm = MPI_COMM_WORLD; kml_fft_mpi_init(); ptrdiff_t *n = (ptrdiff_t *)kml_fft_malloc(sizeof(ptrdiff_t) * 2); if (n == NULL) { printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__); } n[0] = N0; n[1] = N1; ptrdiff_t howmany = 1; ptrdiff_t block0 = 0; ptrdiff_t block1 = 0; double *in = NULL; double *out = NULL; /* get local data size and allocate */ alloc_local = kml_fft_mpi_local_size_many_transposed(2, n, howmany, block0, block1, comm, &local_n0, &local_0_start, &local_n1, &local_1_start); if (alloc_local == -1) { printf("[%s][%d] allocate size fail!!!\n", __func__, __LINE__); } in = (double *)kml_fft_malloc(sizeof(double) * alloc_local * 2); if (in == NULL) { printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__); } out = (double *)kml_fft_malloc(sizeof(double) * alloc_local * 2); if (out == NULL) { printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__); } /* create plan for in-place forward DFT */ plan = kml_fft_mpi_plan_many_transpose(n[0], n[1], howmany, block0, block1, in, out, comm, KML_FFT_ESTIMATE); /* compute transforms, in-place, as many times as desired */ kml_fft_execute(plan); kml_fft_destroy_plan(plan); kml_fft_mpi_cleanup(); MPI_Finalize();