1、基础信息设置
HPLinpack benchmark input file Innovative Computing Laboratory, University of Tennessee作用:文件头标识,说明这是HPLinpack基准测试的输入文件
2、输出文件配置
HPL.out output file name (if any) 6 device out (6=stdout,7=stderr,file)HPL.out:指定结果输出文件名
device out:输出设备选择
6 = 标准输出(stdout)- 结果只显示在终端
7 = 标准错误输出(stderr)- 通常不建议使用
0或其他值 = 直接写入文件 - 这才是正确选择
3、测试规模参数
1 # of problems sizes (N) 60000 Ns# of problems sizes (N)
作用:指定要测试的不同矩阵规模的数量
示例值:1 表示只测试一个矩阵规模
实际意义:定义测试的多样性程度
Ns - 矩阵规模值
作用:定义线性方程组Ax=b中矩阵A的维度
示例值:60000表示测试一个60000×60000的稠密矩阵
内存需求计算
对于N=60000的矩阵:
理论内存需求 ≈ N² × 8字节(双精度浮点数)
具体计算:60000² × 8 ≈ 28.8GB
计算复杂度分析
浮点运算次数 ≈ 2/3 × N³
60000规模 ≈ 2/3 × 60000³ ≈ 144万亿次运算
该配置表示将求解一个60000阶的稠密线性方程组,每个进程处理矩阵的部分区块,通过并行计算提高整体性能
4、算法分块设置
1 # of NBs 1024 NBs参数定义
# of NBs:指定要测试的分块大小数量
示例值1表示只测试一个分块大小
NBs:具体的分块大小值
示例值1024表示使用102