1 year ago · 0e627c920f
--- a/api/controllers/console/workspace/model_providers.py
+++ b/api/controllers/console/workspace/model_providers.py
@@ -115,7 +115,7 @@ class ModelProviderModelValidateApi(Resource):
        parser = reqparse.RequestParser()
        parser.add_argument('model_name', type=str, required=True, nullable=False, location='json')
        parser.add_argument('model_type', type=str, required=True, nullable=False,
                            choices=['text-generation', 'embeddings', 'speech2text'], location='json')
                            choices=['text-generation', 'embeddings', 'speech2text', 'reranking'], location='json')
        parser.add_argument('config', type=dict, required=True, nullable=False, location='json')
        args = parser.parse_args()

@@ -155,7 +155,7 @@ class ModelProviderModelUpdateApi(Resource):
        parser = reqparse.RequestParser()
        parser.add_argument('model_name', type=str, required=True, nullable=False, location='json')
        parser.add_argument('model_type', type=str, required=True, nullable=False,
                            choices=['text-generation', 'embeddings', 'speech2text'], location='json')
                            choices=['text-generation', 'embeddings', 'speech2text', 'reranking'], location='json')
        parser.add_argument('config', type=dict, required=True, nullable=False, location='json')
        args = parser.parse_args()

@@ -184,7 +184,7 @@ class ModelProviderModelUpdateApi(Resource):
        parser = reqparse.RequestParser()
        parser.add_argument('model_name', type=str, required=True, nullable=False, location='args')
        parser.add_argument('model_type', type=str, required=True, nullable=False,
                            choices=['text-generation', 'embeddings', 'speech2text'], location='args')
                            choices=['text-generation', 'embeddings', 'speech2text', 'reranking'], location='args')
        args = parser.parse_args()

        provider_service = ProviderService()
--- a/api/core/model_providers/models/reranking/xinference_reranking.py
+++ b/api/core/model_providers/models/reranking/xinference_reranking.py
@@ -0,0 +1,58 @@
 import logging
 from typing import Optional, List

 from langchain.schema import Document
 from xinference_client.client.restful.restful_client import Client

 from core.model_providers.error import LLMBadRequestError
 from core.model_providers.models.reranking.base import BaseReranking
 from core.model_providers.providers.base import BaseModelProvider


 class XinferenceReranking(BaseReranking):

    def __init__(self, model_provider: BaseModelProvider, name: str):
        self.credentials = model_provider.get_model_credentials(
            model_name=name,
            model_type=self.type
        )

        client = Client(self.credentials['server_url'])

        super().__init__(model_provider, client, name)

    def rerank(self, query: str, documents: List[Document], score_threshold: Optional[float], top_k: Optional[int]) -> Optional[List[Document]]:
        docs = []
        doc_id = []
        for document in documents:
            if document.metadata['doc_id'] not in doc_id:
                doc_id.append(document.metadata['doc_id'])
                docs.append(document.page_content)

        model = self.client.get_model(self.credentials['model_uid'])
        response = model.rerank(query=query, documents=docs, top_n=top_k)
        rerank_documents = []

        for idx, result in enumerate(response['results']):
            # format document
            index = result['index']
            rerank_document = Document(
                page_content=result['document'],
                metadata={
                    "doc_id": documents[index].metadata['doc_id'],
                    "doc_hash": documents[index].metadata['doc_hash'],
                    "document_id": documents[index].metadata['document_id'],
                    "dataset_id": documents[index].metadata['dataset_id'],
                    'score': result['relevance_score']
                }
            )
            # score threshold check
            if score_threshold is not None:
                if result.relevance_score >= score_threshold:
                    rerank_documents.append(rerank_document)
            else:
                rerank_documents.append(rerank_document)
        return rerank_documents

    def handle_exceptions(self, ex: Exception) -> Exception:
        return LLMBadRequestError(f"Xinference rerank: {str(ex)}")
--- a/api/core/model_providers/providers/xinference_provider.py
+++ b/api/core/model_providers/providers/xinference_provider.py
@@ -2,11 +2,13 @@ import json
 from typing import Type

 import requests
 from xinference_client.client.restful.restful_client import Client

 from core.helper import encrypter
 from core.model_providers.models.embedding.xinference_embedding import XinferenceEmbedding
 from core.model_providers.models.entity.model_params import KwargRule, ModelKwargsRules, ModelType, ModelMode
 from core.model_providers.models.llm.xinference_model import XinferenceModel
 from core.model_providers.models.reranking.xinference_reranking import XinferenceReranking
 from core.model_providers.providers.base import BaseModelProvider, CredentialsValidateFailedError

 from core.model_providers.models.base import BaseProviderModel
@@ -40,6 +42,8 @@ class XinferenceProvider(BaseModelProvider):
            model_class = XinferenceModel
        elif model_type == ModelType.EMBEDDINGS:
            model_class = XinferenceEmbedding
        elif model_type == ModelType.RERANKING:
            model_class = XinferenceReranking
        else:
            raise NotImplementedError

@@ -113,6 +117,10 @@ class XinferenceProvider(BaseModelProvider):
                )

                embedding.embed_query("ping")
            elif model_type == ModelType.RERANKING:
                rerank_client = Client(credential_kwargs['server_url'])
                model = rerank_client.get_model(credential_kwargs['model_uid'])
                model.rerank(query="ping", documents=["ping", "pong"], top_n=2)
        except Exception as ex:
            raise CredentialsValidateFailedError(str(ex))

--- a/api/core/model_providers/rules/xinference.json
+++ b/api/core/model_providers/rules/xinference.json
@@ -6,6 +6,7 @@
    "model_flexibility": "configurable",
    "supported_model_types": [
        "text-generation",
        "embeddings"
        "embeddings",
        "reranking"
    ]
 }
--- a/api/requirements.txt
+++ b/api/requirements.txt
@@ -48,7 +48,7 @@ huggingface_hub~=0.16.4
 transformers~=4.31.0
 stripe~=5.5.0
 pandas==1.5.3
 xinference-client~=0.5.4
 xinference-client~=0.6.4
 safetensors==0.3.2
 zhipuai==1.0.7
 werkzeug==2.3.7
--- a/api/tests/integration_tests/.env.example
+++ b/api/tests/integration_tests/.env.example
@@ -50,4 +50,7 @@ XINFERENCE_MODEL_UID=
 OPENLLM_SERVER_URL=

 # LocalAI Credentials
 LOCALAI_SERVER_URL=
 LOCALAI_SERVER_URL=

 # Cohere Credentials
 COHERE_API_KEY=
--- a/api/tests/integration_tests/models/reranking/__init__.py
+++ b/api/tests/integration_tests/models/reranking/__init__.py
--- a/api/tests/integration_tests/models/reranking/test_cohere_reranking.py
+++ b/api/tests/integration_tests/models/reranking/test_cohere_reranking.py
@@ -0,0 +1,61 @@
 import json
 import os
 from unittest.mock import patch

 from langchain.schema import Document

 from core.model_providers.models.reranking.cohere_reranking import CohereReranking
 from core.model_providers.providers.cohere_provider import CohereProvider
 from models.provider import Provider, ProviderType


 def get_mock_provider(valid_api_key):
    return Provider(
        id='provider_id',
        tenant_id='tenant_id',
        provider_name='cohere',
        provider_type=ProviderType.CUSTOM.value,
        encrypted_config=json.dumps({'api_key': valid_api_key}),
        is_valid=True,
    )


 def get_mock_model():
    valid_api_key = os.environ['COHERE_API_KEY']
    provider = CohereProvider(provider=get_mock_provider(valid_api_key))
    return CohereReranking(
        model_provider=provider,
        name='rerank-english-v2.0'
    )


 def decrypt_side_effect(tenant_id, encrypted_api_key):
    return encrypted_api_key


@patch('core.helper.encrypter.decrypt_token', side_effect=decrypt_side_effect)
 def test_run(mock_decrypt):
    model = get_mock_model()

    docs = []
    docs.append(Document(
        page_content='bye',
        metadata={
            "doc_id": 'a',
            "doc_hash": 'doc_hash',
            "document_id": 'document_id',
            "dataset_id": 'dataset_id',
        }
    ))
    docs.append(Document(
        page_content='hello',
        metadata={
            "doc_id": 'b',
            "doc_hash": 'doc_hash',
            "document_id": 'document_id',
            "dataset_id": 'dataset_id',
        }
    ))
    rst = model.rerank('hello', docs, None, 2)

    assert rst[0].page_content == 'hello'
--- a/api/tests/integration_tests/models/reranking/test_xinference_reranking.py
+++ b/api/tests/integration_tests/models/reranking/test_xinference_reranking.py
@@ -0,0 +1,78 @@
 import json
 import os
 from unittest.mock import patch, MagicMock

 from langchain.schema import Document

 from core.model_providers.models.entity.model_params import ModelType
 from core.model_providers.models.reranking.xinference_reranking import XinferenceReranking
 from core.model_providers.providers.xinference_provider import XinferenceProvider
 from models.provider import Provider, ProviderType, ProviderModel


 def get_mock_provider(valid_server_url, valid_model_uid):
    return Provider(
        id='provider_id',
        tenant_id='tenant_id',
        provider_name='xinference',
        provider_type=ProviderType.CUSTOM.value,
        encrypted_config=json.dumps({'server_url': valid_server_url, 'model_uid': valid_model_uid}),
        is_valid=True,
    )


 def get_mock_model(mocker):
    valid_server_url = os.environ['XINFERENCE_SERVER_URL']
    valid_model_uid = os.environ['XINFERENCE_MODEL_UID']
    model_name = 'bge-reranker-base'
    provider = XinferenceProvider(provider=get_mock_provider(valid_server_url, valid_model_uid))

    mock_query = MagicMock()
    mock_query.filter.return_value.first.return_value = ProviderModel(
        provider_name='xinference',
        model_name=model_name,
        model_type=ModelType.RERANKING.value,
        encrypted_config=json.dumps({
            'server_url': valid_server_url,
            'model_uid': valid_model_uid
        }),
        is_valid=True,
    )
    mocker.patch('extensions.ext_database.db.session.query', return_value=mock_query)

    return XinferenceReranking(
        model_provider=provider,
        name=model_name
    )


 def decrypt_side_effect(tenant_id, encrypted_api_key):
    return encrypted_api_key


@patch('core.helper.encrypter.decrypt_token', side_effect=decrypt_side_effect)
 def test_run(mock_decrypt, mocker):
    model = get_mock_model(mocker)

    docs = []
    docs.append(Document(
        page_content='bye',
        metadata={
            "doc_id": 'a',
            "doc_hash": 'doc_hash',
            "document_id": 'document_id',
            "dataset_id": 'dataset_id',
        }
    ))
    docs.append(Document(
        page_content='hello',
        metadata={
            "doc_id": 'b',
            "doc_hash": 'doc_hash',
            "document_id": 'document_id',
            "dataset_id": 'dataset_id',
        }
    ))
    rst = model.rerank('hello', docs, None, 2)

    assert rst[0].page_content == 'hello'