danswer/backend/onyx/chat/stream_processing/answer_response_handler.py

import abc
from collections.abc import Generator

from langchain_core.messages import BaseMessage

from onyx.chat.llm_response_handler import ResponsePart
from onyx.chat.models import CitationInfo
from onyx.chat.models import LlmDoc
from onyx.chat.stream_processing.citation_processing import CitationProcessor
from onyx.chat.stream_processing.utils import DocumentIdOrderMapping
from onyx.utils.logger import setup_logger

logger = setup_logger()


class AnswerResponseHandler(abc.ABC):
    @abc.abstractmethod
    def handle_response_part(
        self,
        response_item: BaseMessage | None,
        previous_response_items: list[BaseMessage],
    ) -> Generator[ResponsePart, None, None]:
        raise NotImplementedError


class DummyAnswerResponseHandler(AnswerResponseHandler):
    def handle_response_part(
        self,
        response_item: BaseMessage | None,
        previous_response_items: list[BaseMessage],
    ) -> Generator[ResponsePart, None, None]:
        # This is a dummy handler that returns nothing
        yield from []


class CitationResponseHandler(AnswerResponseHandler):
    def __init__(
        self,
        context_docs: list[LlmDoc],
        doc_id_to_rank_map: DocumentIdOrderMapping,
        display_doc_order_dict: dict[str, int],
    ):
        self.context_docs = context_docs
        self.doc_id_to_rank_map = doc_id_to_rank_map
        self.display_doc_order_dict = display_doc_order_dict
        self.citation_processor = CitationProcessor(
            context_docs=self.context_docs,
            doc_id_to_rank_map=self.doc_id_to_rank_map,
            display_doc_order_dict=self.display_doc_order_dict,
        )
        self.processed_text = ""
        self.citations: list[CitationInfo] = []

        # TODO remove this after citation issue is resolved
        logger.debug(f"Document to ranking map {self.doc_id_to_rank_map}")

    def handle_response_part(
        self,
        response_item: BaseMessage | None,
        previous_response_items: list[BaseMessage],
    ) -> Generator[ResponsePart, None, None]:
        if response_item is None:
            return

        content = (
            response_item.content if isinstance(response_item.content, str) else ""
        )

        # Process the new content through the citation processor
        yield from self.citation_processor.process_token(content)


# No longer in use, remove later
# class QuotesResponseHandler(AnswerResponseHandler):
#     def __init__(
#         self,
#         context_docs: list[LlmDoc],
#         is_json_prompt: bool = True,
#     ):
#         self.quotes_processor = QuotesProcessor(
#             context_docs=context_docs,
#             is_json_prompt=is_json_prompt,
#         )

#     def handle_response_part(
#         self,
#         response_item: BaseMessage | None,
#         previous_response_items: list[BaseMessage],
#     ) -> Generator[ResponsePart, None, None]:
#         if response_item is None:
#             yield from self.quotes_processor.process_token(None)
#             return

#         content = (
#             response_item.content if isinstance(response_item.content, str) else ""
#         )

#         yield from self.quotes_processor.process_token(content)