danswer/backend/tests/regression/answer_quality/relari.py

import json
import os
import time
from types import SimpleNamespace

import yaml

from tests.regression.answer_quality.api_utils import check_if_query_ready
from tests.regression.answer_quality.api_utils import get_answer_from_query
from tests.regression.answer_quality.cli_utils import get_current_commit_sha


def _get_and_write_relari_outputs(
    samples: list[dict], run_suffix: str, output_file_path: str
) -> None:
    while not check_if_query_ready(run_suffix):
        time.sleep(5)

    count = 0
    with open(output_file_path, "w", encoding="utf-8") as file:
        for sample in samples:
            print(f"On question number {count}")
            query = sample["question"]
            print(f"query: {query}")
            context_data_list, answer = get_answer_from_query(
                query=query,
                run_suffix=run_suffix,
            )

            print(f"answer: {answer[:50]}...")
            if not context_data_list:
                print("No context found")
            else:
                print(f"{len(context_data_list)} context docs found")
            print("\n")

            output = {
                "question_data": sample,
                "answer": answer,
                "context_data_list": context_data_list,
            }

            file.write(json.dumps(output) + "\n")
            file.flush()
            count += 1


def _write_metadata_file(run_suffix: str, metadata_file_path: str) -> None:
    metadata = {"commit_sha": get_current_commit_sha(), "run_suffix": run_suffix}

    print("saving metadata to:", metadata_file_path)
    with open(metadata_file_path, "w", encoding="utf-8") as yaml_file:
        yaml.dump(metadata, yaml_file)


def _read_questions_jsonl(questions_file_path: str) -> list[dict]:
    questions = []
    with open(questions_file_path, "r") as file:
        for line in file:
            json_obj = json.loads(line)
            questions.append(json_obj)
    return questions


def answer_relari_questions(
    questions_file_path: str,
    results_folder_path: str,
    run_suffix: str,
    limit: int | None = None,
) -> None:
    results_file = "run_results.jsonl"
    metadata_file = "run_metadata.yaml"
    samples = _read_questions_jsonl(questions_file_path)

    if limit is not None:
        samples = samples[:limit]

    counter = 1
    output_file_path = os.path.join(results_folder_path, results_file)
    metadata_file_path = os.path.join(results_folder_path, metadata_file)
    while os.path.exists(output_file_path):
        output_file_path = os.path.join(
            results_folder_path,
            results_file.replace("run_results", f"run_results_{counter}"),
        )
        metadata_file_path = os.path.join(
            results_folder_path,
            metadata_file.replace("run_metadata", f"run_metadata_{counter}"),
        )
        counter += 1

    print("saving question results to:", output_file_path)
    _write_metadata_file(run_suffix, metadata_file_path)
    _get_and_write_relari_outputs(
        samples=samples, run_suffix=run_suffix, output_file_path=output_file_path
    )


def main() -> None:
    current_dir = os.path.dirname(os.path.abspath(__file__))
    config_path = os.path.join(current_dir, "search_test_config.yaml")
    with open(config_path, "r") as file:
        config = SimpleNamespace(**yaml.safe_load(file))

    current_output_folder = os.path.expanduser(config.output_folder)
    if config.existing_test_suffix:
        current_output_folder = os.path.join(
            current_output_folder, "test" + config.existing_test_suffix, "relari_output"
        )
    else:
        current_output_folder = os.path.join(current_output_folder, "no_defined_suffix")

    answer_relari_questions(
        config.questions_file,
        current_output_folder,
        config.existing_test_suffix,
        config.limit,
    )


if __name__ == "__main__":
    """
    To run a different set of questions, update the questions_file in search_test_config.yaml
    If there is more than one instance of Danswer running, specify the suffix in search_test_config.yaml
    """
    main()