1 год назад · 7545e5de6c
--- a/api/core/model_runtime/model_providers/nvidia/llm/_position.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/_position.yaml
@@ -1,5 +1,7 @@
 - google/gemma-7b
 - google/codegemma-7b
 - meta/llama2-70b
 - meta/llama3-8b
 - meta/llama3-70b
 - mistralai/mixtral-8x7b-instruct-v0.1
 - fuyu-8b
--- a/api/core/model_runtime/model_providers/nvidia/llm/codegemma-7b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/codegemma-7b.yaml
@@ -11,13 +11,19 @@ model_properties:
 parameter_rules:
  - name: temperature
    use_template: temperature
    min: 0
    max: 1
    default: 0.5
  - name: top_p
    use_template: top_p
    min: 0
    max: 1
    default: 1
  - name: max_tokens
    use_template: max_tokens
    default: 1024
    min: 1
    max: 1024
    default: 1024
  - name: frequency_penalty
    use_template: frequency_penalty
    min: -2
--- a/api/core/model_runtime/model_providers/nvidia/llm/fuyu-8b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/fuyu-8b.yaml
@@ -22,6 +22,6 @@ parameter_rules:
    max: 1
  - name: max_tokens
    use_template: max_tokens
    default: 512
    default: 1024
    min: 1
    max: 1024
--- a/api/core/model_runtime/model_providers/nvidia/llm/gemma-7b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/gemma-7b.yaml
@@ -11,13 +11,19 @@ model_properties:
 parameter_rules:
  - name: temperature
    use_template: temperature
    min: 0
    max: 1
    default: 0.5
  - name: top_p
    use_template: top_p
    min: 0
    max: 1
    default: 1
  - name: max_tokens
    use_template: max_tokens
    default: 512
    min: 1
    max: 1024
    default: 1024
  - name: frequency_penalty
    use_template: frequency_penalty
    min: -2
--- a/api/core/model_runtime/model_providers/nvidia/llm/llama2-70b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/llama2-70b.yaml
@@ -7,17 +7,23 @@ features:
  - agent-thought
 model_properties:
  mode: chat
  context_size: 32768
  context_size: 4096
 parameter_rules:
  - name: temperature
    use_template: temperature
    min: 0
    max: 1
    default: 0.5
  - name: top_p
    use_template: top_p
    min: 0
    max: 1
    default: 1
  - name: max_tokens
    use_template: max_tokens
    default: 512
    min: 1
    max: 1024
    default: 1024
  - name: frequency_penalty
    use_template: frequency_penalty
    min: -2
--- a/api/core/model_runtime/model_providers/nvidia/llm/llama3-70b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/llama3-70b.yaml
@@ -0,0 +1,36 @@
 model: meta/llama3-70b
 label:
  zh_Hans: meta/llama3-70b
  en_US: meta/llama3-70b
 model_type: llm
 features:
  - agent-thought
 model_properties:
  mode: chat
  context_size: 8192
 parameter_rules:
  - name: temperature
    use_template: temperature
    min: 0
    max: 1
    default: 0.5
  - name: top_p
    use_template: top_p
    min: 0
    max: 1
    default: 1
  - name: max_tokens
    use_template: max_tokens
    min: 1
    max: 1024
    default: 1024
  - name: frequency_penalty
    use_template: frequency_penalty
    min: -2
    max: 2
    default: 0
  - name: presence_penalty
    use_template: presence_penalty
    min: -2
    max: 2
    default: 0
--- a/api/core/model_runtime/model_providers/nvidia/llm/llama3-8b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/llama3-8b.yaml
@@ -0,0 +1,36 @@
 model: meta/llama3-8b
 label:
  zh_Hans: meta/llama3-8b
  en_US: meta/llama3-8b
 model_type: llm
 features:
  - agent-thought
 model_properties:
  mode: chat
  context_size: 8192
 parameter_rules:
  - name: temperature
    use_template: temperature
    min: 0
    max: 1
    default: 0.5
  - name: top_p
    use_template: top_p
    min: 0
    max: 1
    default: 1
  - name: max_tokens
    use_template: max_tokens
    min: 1
    max: 1024
    default: 1024
  - name: frequency_penalty
    use_template: frequency_penalty
    min: -2
    max: 2
    default: 0
  - name: presence_penalty
    use_template: presence_penalty
    min: -2
    max: 2
    default: 0
--- a/api/core/model_runtime/model_providers/nvidia/llm/llm.py
+++ b/api/core/model_runtime/model_providers/nvidia/llm/llm.py
@@ -25,7 +25,10 @@ class NVIDIALargeLanguageModel(OAIAPICompatLargeLanguageModel):
        'mistralai/mixtral-8x7b-instruct-v0.1': '',
        'google/gemma-7b': '',
        'google/codegemma-7b': '',
        'meta/llama2-70b': ''
        'meta/llama2-70b': '',
        'meta/llama3-8b': '',
        'meta/llama3-70b': ''
        
    }

    def _invoke(self, model: str, credentials: dict,
--- a/api/core/model_runtime/model_providers/nvidia/llm/mistralai_mixtral-8x7b-instruct-v0.1.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/mistralai_mixtral-8x7b-instruct-v0.1.yaml
@@ -11,13 +11,19 @@ model_properties:
 parameter_rules:
  - name: temperature
    use_template: temperature
    min: 0
    max: 1
    default: 0.5
  - name: top_p
    use_template: top_p
    min: 0
    max: 1
    default: 1
  - name: max_tokens
    use_template: max_tokens
    default: 512
    min: 1
    max: 1024
    default: 1024
  - name: frequency_penalty
    use_template: frequency_penalty
    min: -2
--- a/api/core/model_runtime/model_providers/nvidia/nvidia.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/nvidia.yaml
@@ -1,6 +1,9 @@
 provider: nvidia
 label:
  en_US: API Catalog
 description:
  en_US: API Catalog
  zh_Hans: API Catalog
 icon_small:
  en_US: icon_s_en.svg
 icon_large: