Initial commit

2024-03-04 23:04:16 +01:00
commit fbbe34212f
3 changed files with 149 additions and 0 deletions
--- a/config.py
+++ b/config.py
@@ -0,0 +1,9 @@
+from dataclasses import dataclass
+
+@dataclass
+class Configuration:
+	level: str
+
+@dataclass
+class Statistics:
+	runtime: int
--- a/microbenchmarks.py
+++ b/microbenchmarks.py
@@ -0,0 +1,120 @@
+import torch
+import sys
+import torch.utils.benchmark as benchmark
+import numpy as np
+import json
+import polars as pl
+import dataclasses
+
+from config import Statistics, Configuration
+
+# device = torch.device("cuda:0")
+device = torch.device("cpu")
+
+# ITERATIONS = 1_000_000
+ITERATIONS = 1_000
+
+
+def run_gemv_bench(workload, level):
+    match level:
+        case "X1":
+            ROWS = 16
+        case "X2":
+            ROWS = 32
+        case "X3":
+            ROWS = 64
+        case "X4":
+            ROWS = 128
+
+    COLUMNS = 128
+
+    matrix = torch.rand(
+        (ROWS, COLUMNS),
+        dtype=torch.float16,
+        device=device,
+    )
+    input_vector = torch.rand(COLUMNS, dtype=torch.float16, device=device)
+
+    timer = benchmark.Timer(
+        stmt="gemv(matrix, input_vector)",
+        setup="from workloads import gemv",
+        globals={"input_vector": input_vector, "matrix": matrix},
+    )
+
+    return int(timer.timeit(ITERATIONS).mean * 1e12)
+
+
+def run_gemv_layers_bench(workload, level):
+    LESS_ITERATIONS = int(ITERATIONS / 100)
+
+    match level:
+        case "X1":
+            DIMENSIONS = 128
+        case "X2":
+            DIMENSIONS = 256
+        case "X3":
+            DIMENSIONS = 512
+        case "X4":
+            DIMENSIONS = 1024
+
+    matrix = torch.rand(
+        (DIMENSIONS, DIMENSIONS),
+        dtype=torch.float16,
+        device=device,
+    )
+    input_vector = torch.rand(DIMENSIONS, dtype=torch.float16, device=device)
+
+    timer = benchmark.Timer(
+        stmt="gemv_layers(matrix, input_vector)",
+        setup="from workloads import gemv_layers",
+        globals={"input_vector": input_vector, "matrix": matrix},
+    )
+
+    return int(timer.timeit(LESS_ITERATIONS).mean * 1e12)
+
+
+def run_vector_bench(workload, level):
+    match level:
+        case "X1":
+            ROWS = 256
+        case "X2":
+            ROWS = 512
+        case "X3":
+            ROWS = 1024
+        case "X4":
+            ROWS = 2048
+
+    vector_a = torch.rand(ROWS, dtype=torch.float16, device=device)
+    vector_b = torch.rand(ROWS, dtype=torch.float16, device=device)
+
+    timer = benchmark.Timer(
+        stmt=f"{workload}(vector_a, vector_b)",
+        setup=f"from workloads import {workload}",
+        globals={"vector_a": vector_a, "vector_b": vector_b},
+    )
+
+    return int(timer.timeit(ITERATIONS).mean * 1e12)
+
+
+workloads = [
+    ("vadd", run_vector_bench),
+    ("vmul", run_vector_bench),
+    ("haxpy", run_vector_bench),
+    ("gemv", run_gemv_bench),
+    ("gemv_layers", run_gemv_layers_bench),
+]
+
+levels = ["X1", "X2", "X3", "X4"]
+
+results: list[dict] = []
+
+for workload, workload_callback in workloads:
+    for level in levels:
+        runtime = workload_callback(workload, level)
+        element = {"workload": workload, "level": level, "runtime": runtime}
+        results.append(element)
+        print(element)
+
+
+df = pl.DataFrame(results)
+df.write_csv("rocm_results.csv")
--- a/workloads.py
+++ b/workloads.py
@@ -0,0 +1,20 @@
+import torch
+
+def gemv(matrix, input_vector):
+    return torch.matmul(matrix, input_vector)
+
+def gemv_layers(matrix, input_vector):
+    for _ in range(5):
+        input_vector = torch.matmul(matrix, input_vector)
+    input_vector.relu()
+
+    return input_vector
+
+def vadd(vector_a, vector_b):
+    return torch.add(vector_a, vector_b)
+
+def vmul(vector_a, vector_b):
+    return torch.mul(vector_a, vector_b)
+
+def haxpy(vector_a, vector_b):
+    return torch.add(vector_a, vector_b, alpha=2)