Prometheus-Result/reformat.py at main · EuniAI/Prometheus-Result · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
import os
import argparse
from datasets import load_dataset

SWEBENCH_IMAGE_FORMAT = (
    "swebench/sweb.eval.x86_64.{repo_prefix}_1776_{instance_id_suffix}:v1"
)

SWE_POLYBENCH_IMAGE_FORMAT = "ghcr.io/timesler/swe-polybench.eval.x86_64.{instance_id}:latest"


def get_swebench_image(instance_id: str, repo: str) -> str:
    """
    Get the SWEbench Docker image name for a given instance ID.
    """
    repo_prefix = repo.split("/")[0]
    instance_id_suffix = instance_id.split("__")[-1]
    return SWEBENCH_IMAGE_FORMAT.format(
        repo_prefix=repo_prefix, instance_id_suffix=instance_id_suffix
    )


def get_swe_polybench_image(instance_id: str) -> str:
    return SWE_POLYBENCH_IMAGE_FORMAT.format(instance_id=instance_id)


def get_swe_bench_pro_image(uid, repo_name, dockerhub_username="jefzda"):
    repo_base, repo_name_only = repo_name.lower().split("/")
    hsh = uid.replace("instance_", "")

    if uid == "instance_element-hq__element-web-ec0f940ef0e8e3b61078f145f34dc40d1938e6c5-vnan":
        repo_name_only = 'element-web'  # Keep full name for this one case
    elif 'element-hq' in repo_name.lower() and 'element-web' in repo_name.lower():
        repo_name_only = 'element'
        if hsh.endswith('-vnan'):
            hsh = hsh[:-5]
    # All other repos: strip -vnan suffix
    elif hsh.endswith('-vnan'):
        hsh = hsh[:-5]

    tag = f"{repo_base}.{repo_name_only}-{hsh}"
    if len(tag) > 128:
        tag = tag[:128]

    return f"{dockerhub_username}/sweap-images:{tag}"


def rename_log(log_dir, filename, instance_id):
    new_name = f"{instance_id}.log"
    old_path = os.path.join(log_dir, filename)
    new_path = os.path.join(log_dir, new_name)
    os.rename(old_path, new_path)
    print(f"Renamed: {filename} -> {new_name}")


def rename_logs(log_dir, dataset_name):
    dataset = load_dataset(dataset_name, split='test')
    num = 0
    num_already_renamed = 0

    for data in dataset:
        logs = os.listdir(log_dir)
        logs.sort()

        instance_id = data['instance_id']
        result = None

        # skip if already renamed
        if f"{instance_id}.log" in logs:
            num_already_renamed += 1
            continue

        repo = data['repo']
        if dataset_name == "AmazonScience/SWE-PolyBench_Verified":
            image_name = get_swe_polybench_image(instance_id)
        elif dataset_name == "ScaleAI/SWE-bench_Pro":
            image_name = get_swe_bench_pro_image(instance_id, repo)
        else:
            image_name = get_swebench_image(instance_id, repo)

        for filename in logs:
            if filename.endswith(".log"):
                with open(os.path.join(log_dir, filename), "r") as f:
                    content = f.read()
                if image_name in content:
                    result = filename
        if not result:
            print(f"Warning: No log file found for instance_id {instance_id}")
            continue

        num += 1
        rename_log(log_dir, result, instance_id)
    print(f"Renamed {num} log files")
    print(f"Already renamed {num_already_renamed} log files")


def remove_non_log_files(log_dir, dataset_name):
    dataset = load_dataset(dataset_name, split='test')

    instance_ids = [data['instance_id'] for data in dataset]

    for filename in os.listdir(log_dir):
        if filename[:-4] not in instance_ids:
            input(f"Press Enter to remove non-log file: {filename}")
            os.remove(os.path.join(log_dir, filename))
            print(f"Removed non-log file: {filename}")


if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Rename log files based on timestamp mapping.")
    parser.add_argument("--log_dir", required=True, help="Path to the directory containing log files.")
    parser.add_argument("--dataset_name", required=True, help="Name of the dataset.")

    args = parser.parse_args()

    rename_logs(args.log_dir, args.dataset_name)

    remove_non_log_files(args.log_dir, args.dataset_name)