{/** * @typedef Props * @property {string} apiBaseUrl */} import { CodeGroup } from '@/app/components/develop/code.tsx' import { Row, Col, Properties, Property, Heading, SubProperty, PropertyInstruction, Paragraph } from '@/app/components/develop/md.tsx' # ナレッジ API
high_quality 高品質: 埋め込みモデルを使用してベクトルデータベースインデックスを構築
- economy 経済: キーワードテーブルインデックスの反転インデックスを構築
text_model テキストドキュメントは直接埋め込まれます; `economy` モードではこの形式がデフォルト
- hierarchical_model 親子モード
- qa_model Q&A モード: 分割されたドキュメントの質問と回答ペアを生成し、質問を埋め込みます
English, Chinese
mode (string) クリーニング、セグメンテーションモード、自動 / カスタム
- rules (object) カスタムルール (自動モードでは、このフィールドは空)
- pre_processing_rules (array[object]) 前処理ルール
- id (string) 前処理ルールの一意識別子
- 列挙
- remove_extra_spaces 連続するスペース、改行、タブを置換
- remove_urls_emails URL、メールアドレスを削除
- enabled (bool) このルールを選択するかどうか。ドキュメント ID が渡されない場合、デフォルト値を表します。
- segmentation (object) セグメンテーションルール
- separator カスタムセグメント識別子。現在は 1 つの区切り文字のみ設定可能。デフォルトは \n
- max_tokens 最大長 (トークン) デフォルトは 1000
- parent_mode 親チャンクの検索モード: full-doc 全文検索 / paragraph 段落検索
- subchunk_segmentation (object) 子チャンクルール
- separator セグメンテーション識別子。現在は 1 つの区切り文字のみ許可。デフォルトは ***
- max_tokens 最大長 (トークン) は親チャンクの長さより短いことを検証する必要があります
- chunk_overlap 隣接するチャンク間の重なりを定義 (オプション)
search_method (string) 検索方法
- hybrid_search ハイブリッド検索
- semantic_search セマンティック検索
- full_text_search 全文検索
- reranking_enable (bool) 再ランキングを有効にするかどうか
- reranking_mode (object) 再ランキングモデル構成
- reranking_provider_name (string) 再ランキングモデルプロバイダー
- reranking_model_name (string) 再ランキングモデル名
- top_k (int) 返される結果の数
- score_threshold_enabled (bool) スコア閾値を有効にするかどうか
- score_threshold (float) スコア閾値
original_document_id 元のドキュメント ID (オプション)
- ドキュメントを再アップロードまたはクリーニングとセグメンテーション構成を変更するために使用されます。欠落している情報は元のドキュメントからコピーされます。
- 元のドキュメントはアーカイブされたドキュメントであってはなりません。
- original_document_id が渡された場合、更新操作が実行されます。process_rule は入力可能な項目です。入力されない場合、元のドキュメントのセグメンテーション方法がデフォルトで使用されます。
- original_document_id が渡されない場合、新しい操作が実行され、process_rule が必要です。
- indexing_technique インデックスモード
- high_quality 高品質:埋め込みモデルを使用してベクトルデータベースインデックスを構築
- economy 経済:キーワードテーブルインデックスの反転インデックスを構築
- doc_form インデックス化された内容の形式
- text_model テキストドキュメントは直接埋め込まれます; `economy` モードではこの形式がデフォルト
- hierarchical_model 親子モード
- qa_model Q&A モード:分割されたドキュメントの質問と回答ペアを生成し、質問を埋め込みます
- doc_language Q&A モードでは、ドキュメントの言語を指定します。例:English, Chinese
- process_rule 処理ルール
- mode (string) クリーニング、セグメンテーションモード、自動 / カスタム
- rules (object) カスタムルール (自動モードでは、このフィールドは空)
- pre_processing_rules (array[object]) 前処理ルール
- id (string) 前処理ルールの一意識別子
- 列挙
- remove_extra_spaces 連続するスペース、改行、タブを置換
- remove_urls_emails URL、メールアドレスを削除
- enabled (bool) このルールを選択するかどうか。ドキュメント ID が渡されない場合、デフォルト値を表します。
- segmentation (object) セグメンテーションルール
- separator カスタムセグメント識別子。現在は 1 つの区切り文字のみ設定可能。デフォルトは \n
- max_tokens 最大長 (トークン) デフォルトは 1000
- parent_mode 親チャンクの検索モード:full-doc 全文検索 / paragraph 段落検索
- subchunk_segmentation (object) 子チャンクルール
- separator セグメンテーション識別子。現在は 1 つの区切り文字のみ許可。デフォルトは ***
- max_tokens 最大長 (トークン) は親チャンクの長さより短いことを検証する必要があります
- chunk_overlap 隣接するチャンク間の重なりを定義 (オプション)
search_method (string) 検索方法
- hybrid_search ハイブリッド検索
- semantic_search セマンティック検索
- full_text_search 全文検索
- reranking_enable (bool) 再ランキングを有効にするかどうか
- reranking_mode (object) 再ランキングモデル構成
- reranking_provider_name (string) 再ランキングモデルプロバイダー
- reranking_model_name (string) 再ランキングモデル名
- top_k (int) 返される結果の数
- score_threshold_enabled (bool) スコア閾値を有効にするかどうか
- score_threshold (float) スコア閾値
high_quality 高品質
- economy 経済
only_me 自分のみ
- all_team_members すべてのチームメンバー
- partial_members 一部のメンバー
vendor ベンダー
- external 外部ナレッジ
search_method (文字列) 検索方法
- hybrid_search ハイブリッド検索
- semantic_search セマンティック検索
- full_text_search 全文検索
- reranking_enable (ブール値) リランキングを有効にするかどうか
- reranking_model (オブジェクト) リランクモデルの設定
- reranking_provider_name (文字列) リランクモデルのプロバイダ
- reranking_model_name (文字列) リランクモデル名
- top_k (整数) 返される結果の数
- score_threshold_enabled (ブール値) スコア閾値を有効にするかどうか
- score_threshold (浮動小数点数) スコア閾値
mode (string) クリーニング、セグメンテーションモード、自動 / カスタム
- rules (object) カスタムルール (自動モードでは、このフィールドは空)
- pre_processing_rules (array[object]) 前処理ルール
- id (string) 前処理ルールの一意識別子
- 列挙
- remove_extra_spaces 連続するスペース、改行、タブを置換
- remove_urls_emails URL、メールアドレスを削除
- enabled (bool) このルールを選択するかどうか。ドキュメント ID が渡されない場合、デフォルト値を表します。
- segmentation (object) セグメンテーションルール
- separator カスタムセグメント識別子。現在は 1 つの区切り文字のみ設定可能。デフォルトは \n
- max_tokens 最大長 (トークン) デフォルトは 1000
- parent_mode 親チャンクの検索モード: full-doc 全文検索 / paragraph 段落検索
- subchunk_segmentation (object) 子チャンクルール
- separator セグメンテーション識別子。現在は 1 つの区切り文字のみ許可。デフォルトは ***
- max_tokens 最大長 (トークン) は親チャンクの長さより短いことを検証する必要があります
- chunk_overlap 隣接するチャンク間の重なりを定義 (オプション)
mode (string) クリーニング、セグメンテーションモード、自動 / カスタム
- rules (object) カスタムルール (自動モードでは、このフィールドは空)
- pre_processing_rules (array[object]) 前処理ルール
- id (string) 前処理ルールの一意識別子
- 列挙
- remove_extra_spaces 連続するスペース、改行、タブを置換
- remove_urls_emails URL、メールアドレスを削除
- enabled (bool) このルールを選択するかどうか。ドキュメント ID が渡されない場合、デフォルト値を表します。
- segmentation (object) セグメンテーションルール
- separator カスタムセグメント識別子。現在は 1 つの区切り文字のみ設定可能。デフォルトは \n
- max_tokens 最大長 (トークン) デフォルトは 1000
- parent_mode 親チャンクの検索モード: full-doc 全文検索 / paragraph 段落検索
- subchunk_segmentation (object) 子チャンクルール
- separator セグメンテーション識別子。現在は 1 つの区切り文字のみ許可。デフォルトは ***
- max_tokens 最大長 (トークン) は親チャンクの長さより短いことを検証する必要があります
- chunk_overlap 隣接するチャンク間の重なりを定義 (オプション)
content (text) テキスト内容 / 質問内容、必須
- answer (text) 回答内容、ナレッジのモードが Q&A モードの場合に値を渡します (オプション)
- keywords (list) キーワード (オプション)
content (text) テキスト内容 / 質問内容、必須
- answer (text) 回答内容、ナレッジが Q&A モードの場合に値を渡します (オプション)
- keywords (list) キーワード (オプション)
- enabled (bool) False / true (オプション)
- regenerate_child_chunks (bool) 子チャンクを再生成するかどうか (オプション)
search_method (text) 検索方法: 以下の4つのキーワードのいずれかが必要です
- keyword_search キーワード検索
- semantic_search セマンティック検索
- full_text_search 全文検索
- hybrid_search ハイブリッド検索
- reranking_enable (bool) 再ランキングを有効にするかどうか、検索モードがsemantic_searchまたはhybrid_searchの場合に必須(オプション)
- reranking_mode (object) 再ランキングモデル構成、再ランキングが有効な場合に必須
- reranking_provider_name (string) 再ランキングモデルプロバイダー
- reranking_model_name (string) 再ランキングモデル名
- weights (float) ハイブリッド検索モードでのセマンティック検索の重み設定
- top_k (integer) 返される結果の数(オプション)
- score_threshold_enabled (bool) スコア閾値を有効にするかどうか
- score_threshold (float) スコア閾値
- metadata_filtering_conditions (object) メタデータフィルタリング条件
- logical_operator (string) 論理演算子: and | or
- conditions (array[object]) 条件リスト
- name (string) メタデータフィールド名
- comparison_operator (string) 比較演算子、許可される値:
- 文字列比較:
- contains: 含む
- not contains: 含まない
- start with: で始まる
- end with: で終わる
- is: 等しい
- is not: 等しくない
- empty: 空
- not empty: 空でない
- 数値比較:
- =: 等しい
- ≠: 等しくない
- >: より大きい
- < : より小さい
- ≥: 以上
- ≤: 以下
- 時間比較:
- before: より前
- after: より後
- value (string|number|null) 比較値
type (string) メタデータの種類、必須
- name (string) メタデータの名前、必須
name (string) メタデータの名前、必須
document_id (string) ドキュメント ID
- metadata_list (list) メタデータリスト
- id (string) メタデータ ID
- value (string) メタデータの値
- name (string) メタデータの名前
| code | status | message |
|---|---|---|
| no_file_uploaded | 400 | Please upload your file. |
| too_many_files | 400 | Only one file is allowed. |
| file_too_large | 413 | File size exceeded. |
| unsupported_file_type | 415 | File type not allowed. |
| high_quality_dataset_only | 400 | Current operation only supports 'high-quality' datasets. |
| dataset_not_initialized | 400 | The dataset is still being initialized or indexing. Please wait a moment. |
| archived_document_immutable | 403 | The archived document is not editable. |
| dataset_name_duplicate | 409 | The dataset name already exists. Please modify your dataset name. |
| invalid_action | 400 | Invalid action. |
| document_already_finished | 400 | The document has been processed. Please refresh the page or go to the document details. |
| document_indexing | 400 | The document is being processed and cannot be edited. |
| invalid_metadata | 400 | The metadata content is incorrect. Please check and verify. |