1 年之前 · f53454f81d
--- a/api/core/model_runtime/model_providers/openai_api_compatible/llm/llm.py
+++ b/api/core/model_runtime/model_providers/openai_api_compatible/llm/llm.py
                if new_tool_call.function.arguments:
                    tool_call.function.arguments += new_tool_call.function.arguments
        finish_reason = 'Unknown'
        finish_reason = None  # The default value of finish_reason is None
        for chunk in response.iter_lines(decode_unicode=True, delimiter=delimiter):
            chunk = chunk.strip()
                if chunk.startswith(':'):
                    continue
                decoded_chunk = chunk.strip().lstrip('data: ').lstrip()
                if decoded_chunk == '[DONE]':  # Some provider returns "data: [DONE]"
                    continue
                try:
                    chunk_json = json.loads(decoded_chunk)
--- a/api/core/workflow/nodes/llm/llm_node.py
+++ b/api/core/workflow/nodes/llm/llm_node.py
            }
            # handle invoke result
            result_text, usage = self._invoke_llm(
            result_text, usage, finish_reason = self._invoke_llm(
                node_data_model=node_data.model,
                model_instance=model_instance,
                prompt_messages=prompt_messages,
        outputs = {
            'text': result_text,
            'usage': jsonable_encoder(usage)
            'usage': jsonable_encoder(usage),
            'finish_reason': finish_reason
        }
        return NodeRunResult(
        )
        # handle invoke result
        text, usage = self._handle_invoke_result(
        text, usage, finish_reason = self._handle_invoke_result(
            invoke_result=invoke_result
        )
        # deduct quota
        self.deduct_llm_quota(tenant_id=self.tenant_id, model_instance=model_instance, usage=usage)
        return text, usage
        return text, usage, finish_reason
    def _handle_invoke_result(self, invoke_result: Generator) -> tuple[str, LLMUsage]:
        """
        prompt_messages = []
        full_text = ''
        usage = None
        finish_reason = None
        for result in invoke_result:
            text = result.delta.message.content
            full_text += text
            if not usage and result.delta.usage:
                usage = result.delta.usage
            if not finish_reason and result.delta.finish_reason:
                finish_reason = result.delta.finish_reason
        if not usage:
            usage = LLMUsage.empty_usage()
        return full_text, usage
        return full_text, usage, finish_reason
    def _transform_chat_messages(self,
        messages: list[LLMNodeChatModelMessage] | LLMNodeCompletionModelPromptTemplate
--- a/api/core/workflow/nodes/question_classifier/question_classifier_node.py
+++ b/api/core/workflow/nodes/question_classifier/question_classifier_node.py
        )
        # handle invoke result
        result_text, usage = self._invoke_llm(
        result_text, usage, finish_reason = self._invoke_llm(
            node_data_model=node_data.model,
            model_instance=model_instance,
            prompt_messages=prompt_messages,
                    prompt_messages=prompt_messages
                ),
                'usage': jsonable_encoder(usage),
                'finish_reason': finish_reason
            }
            outputs = {
                'class_name': category_name