deeplearning/dl-op-linalg-batch-matmul-benchmark.json

2025-10-13 07:43:23 UTC

dl-op-linalg-batch-matmul-benchmark.json

Name	Time (ms)	CPU (ms)	Iterations
DL_OPS_BATCH_MATMUL/Scalar/iterations:1	3.63e+03	3.63e+03	1
DL_OPS_BATCH_MATMUL/AutoVectorization/iterations:1	1.01e+03	1.01e+03	1
DL_OPS_BATCH_MATMUL/Vectorization/iterations:1	196	196	1
DL_OPS_BATCH_MATMUL/Tile/iterations:1	112	112	1
DL_OPS_BATCH_MATMUL/SCF/iterations:1	121	121	1
DL_OPS_BATCH_MATMUL/BROADCAST/iterations:1	367	367	1
DL_OPS_BATCH_MATMUL/BROADCAST_OMP/iterations:1	111	22.7	1

Console output

2025-09-07T12:45:54+00:00
Running ./dl-op-linalg-batch-matmul-benchmark
Run on (24 X 5100 MHz CPU s)
CPU Caches:
  L1 Data 48 KiB (x12)
  L1 Instruction 32 KiB (x12)
  L2 Unified 1280 KiB (x12)
  L3 Unified 30720 KiB (x1)
Load Average: 2.41, 3.31, 5.08
***WARNING*** CPU scaling is enabled, the benchmark real time measurements may be noisy and will incur extra overhead.
---------------------------------------------------------------------------------------------
Benchmark                                                   Time             CPU   Iterations
---------------------------------------------------------------------------------------------
DL_OPS_BATCH_MATMUL/Scalar/iterations:1                  3635 ms         3635 ms            1
DL_OPS_BATCH_MATMUL/AutoVectorization/iterations:1       1006 ms         1006 ms            1
DL_OPS_BATCH_MATMUL/Vectorization/iterations:1            196 ms          196 ms            1
DL_OPS_BATCH_MATMUL/Tile/iterations:1                     112 ms          112 ms            1
DL_OPS_BATCH_MATMUL/SCF/iterations:1                      121 ms          121 ms            1
DL_OPS_BATCH_MATMUL/BROADCAST/iterations:1                367 ms          367 ms            1
DL_OPS_BATCH_MATMUL/BROADCAST_OMP/iterations:1            111 ms         22.7 ms            1
[34m---------- Verification ----------[0m
Tile [32mPASS[0m
SCF [32mPASS[0m
BROADCAST [32mPASS[0m
BROADCAST_OMP [32mPASS[0m