Parcourir la source

fix: xinference chat completion error (#952)

tags/0.3.15
takatost il y a 2 ans
Parent
révision
4f3053a8cc
Aucun compte lié à l'adresse e-mail de l'auteur
1 fichiers modifiés avec 2 ajouts et 2 suppressions
  1. 2
    2
      api/core/third_party/langchain/llms/xinference_llm.py

+ 2
- 2
api/core/third_party/langchain/llms/xinference_llm.py Voir le fichier

@@ -46,7 +46,7 @@ class XinferenceLLM(Xinference):
return combined_text_output
else:
completion = model.chat(prompt=prompt, generate_config=generate_config)
return completion["choices"][0]["text"]
return completion["choices"][0]["message"]["content"]
elif isinstance(model, RESTfulGenerateModelHandle):
generate_config: "LlamaCppGenerateConfig" = kwargs.get("generate_config", {})

@@ -82,7 +82,7 @@ class XinferenceLLM(Xinference):
completion = combined_text_output
else:
completion = model.chat(prompt=prompt, generate_config=generate_config)
completion = completion["choices"][0]["text"]
completion = completion["choices"][0]["message"]["content"]

if stop is not None:
completion = enforce_stop_tokens(completion, stop)

Chargement…
Annuler
Enregistrer