Fix follow ups in thread + fix user name (#3686)

* Fix follow ups in thread + fix user name * Add back single history str * Remove newline
2025-07-12 14:12:53 +02:00 · 2025-01-15 18:40:25 -08:00
parent c9a420ec49
commit 8a4d762798
23 changed files with 153 additions and 117 deletions
--- a/backend/onyx/chat/prompt_builder/answer_prompt_builder.py
+++ b/backend/onyx/chat/prompt_builder/answer_prompt_builder.py
@ -0,0 +1,171 @@
+from collections.abc import Callable
+from typing import cast
+
+from langchain_core.messages import BaseMessage
+from langchain_core.messages import HumanMessage
+from langchain_core.messages import SystemMessage
+from pydantic.v1 import BaseModel as BaseModel__v1
+
+from onyx.chat.models import PromptConfig
+from onyx.chat.prompt_builder.citations_prompt import compute_max_llm_input_tokens
+from onyx.chat.prompt_builder.utils import translate_history_to_basemessages
+from onyx.file_store.models import InMemoryChatFile
+from onyx.llm.interfaces import LLMConfig
+from onyx.llm.models import PreviousMessage
+from onyx.llm.utils import build_content_with_imgs
+from onyx.llm.utils import check_message_tokens
+from onyx.llm.utils import message_to_prompt_and_imgs
+from onyx.natural_language_processing.utils import get_tokenizer
+from onyx.prompts.chat_prompts import CHAT_USER_CONTEXT_FREE_PROMPT
+from onyx.prompts.direct_qa_prompts import HISTORY_BLOCK
+from onyx.prompts.prompt_utils import add_date_time_to_prompt
+from onyx.prompts.prompt_utils import drop_messages_history_overflow
+from onyx.tools.force import ForceUseTool
+from onyx.tools.models import ToolCallFinalResult
+from onyx.tools.models import ToolCallKickoff
+from onyx.tools.models import ToolResponse
+from onyx.tools.tool import Tool
+
+
+def default_build_system_message(
+    prompt_config: PromptConfig,
+) -> SystemMessage | None:
+    system_prompt = prompt_config.system_prompt.strip()
+    if prompt_config.datetime_aware:
+        system_prompt = add_date_time_to_prompt(prompt_str=system_prompt)
+
+    if not system_prompt:
+        return None
+
+    system_msg = SystemMessage(content=system_prompt)
+
+    return system_msg
+
+
+def default_build_user_message(
+    user_query: str,
+    prompt_config: PromptConfig,
+    files: list[InMemoryChatFile] = [],
+    single_message_history: str | None = None,
+) -> HumanMessage:
+    history_block = (
+        HISTORY_BLOCK.format(history_str=single_message_history)
+        if single_message_history
+        else ""
+    )
+
+    user_prompt = (
+        CHAT_USER_CONTEXT_FREE_PROMPT.format(
+            history_block=history_block,
+            task_prompt=prompt_config.task_prompt,
+            user_query=user_query,
+        )
+        if prompt_config.task_prompt
+        else user_query
+    )
+    user_prompt = user_prompt.strip()
+    user_msg = HumanMessage(
+        content=build_content_with_imgs(user_prompt, files) if files else user_prompt
+    )
+    return user_msg
+
+
+class AnswerPromptBuilder:
+    def __init__(
+        self,
+        user_message: HumanMessage,
+        message_history: list[PreviousMessage],
+        llm_config: LLMConfig,
+        raw_user_query: str,
+        raw_user_uploaded_files: list[InMemoryChatFile],
+        single_message_history: str | None = None,
+    ) -> None:
+        self.max_tokens = compute_max_llm_input_tokens(llm_config)
+
+        llm_tokenizer = get_tokenizer(
+            provider_type=llm_config.model_provider,
+            model_name=llm_config.model_name,
+        )
+        self.llm_tokenizer_encode_func = cast(
+            Callable[[str], list[int]], llm_tokenizer.encode
+        )
+
+        self.raw_message_history = message_history
+        (
+            self.message_history,
+            self.history_token_cnts,
+        ) = translate_history_to_basemessages(message_history)
+
+        self.system_message_and_token_cnt: tuple[SystemMessage, int] | None = None
+        self.user_message_and_token_cnt = (
+            user_message,
+            check_message_tokens(user_message, self.llm_tokenizer_encode_func),
+        )
+
+        self.new_messages_and_token_cnts: list[tuple[BaseMessage, int]] = []
+
+        # used for building a new prompt after a tool-call
+        self.raw_user_query = raw_user_query
+        self.raw_user_uploaded_files = raw_user_uploaded_files
+        self.single_message_history = single_message_history
+
+    def update_system_prompt(self, system_message: SystemMessage | None) -> None:
+        if not system_message:
+            self.system_message_and_token_cnt = None
+            return
+
+        self.system_message_and_token_cnt = (
+            system_message,
+            check_message_tokens(system_message, self.llm_tokenizer_encode_func),
+        )
+
+    def update_user_prompt(self, user_message: HumanMessage) -> None:
+        self.user_message_and_token_cnt = (
+            user_message,
+            check_message_tokens(user_message, self.llm_tokenizer_encode_func),
+        )
+
+    def append_message(self, message: BaseMessage) -> None:
+        """Append a new message to the message history."""
+        token_count = check_message_tokens(message, self.llm_tokenizer_encode_func)
+        self.new_messages_and_token_cnts.append((message, token_count))
+
+    def get_user_message_content(self) -> str:
+        query, _ = message_to_prompt_and_imgs(self.user_message_and_token_cnt[0])
+        return query
+
+    def build(self) -> list[BaseMessage]:
+        if not self.user_message_and_token_cnt:
+            raise ValueError("User message must be set before building prompt")
+
+        final_messages_with_tokens: list[tuple[BaseMessage, int]] = []
+        if self.system_message_and_token_cnt:
+            final_messages_with_tokens.append(self.system_message_and_token_cnt)
+
+        final_messages_with_tokens.extend(
+            [
+                (self.message_history[i], self.history_token_cnts[i])
+                for i in range(len(self.message_history))
+            ]
+        )
+
+        final_messages_with_tokens.append(self.user_message_and_token_cnt)
+
+        if self.new_messages_and_token_cnts:
+            final_messages_with_tokens.extend(self.new_messages_and_token_cnts)
+
+        return drop_messages_history_overflow(
+            final_messages_with_tokens, self.max_tokens
+        )
+
+
+class LLMCall(BaseModel__v1):
+    prompt_builder: AnswerPromptBuilder
+    tools: list[Tool]
+    force_use_tool: ForceUseTool
+    files: list[InMemoryChatFile]
+    tool_call_info: list[ToolCallKickoff | ToolResponse | ToolCallFinalResult]
+    using_tool_calling_llm: bool
+
+    class Config:
+        arbitrary_types_allowed = True