You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

dataset-creation.ts 11KB


  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: '建立知識庫',
  5. update: '上傳檔案',
  6. fallbackRoute: '知識',
  7. },
  8. one: '選擇資料來源',
  9. two: '文字分段與清洗',
  10. three: '處理並完成',
  11. },
  12. error: {
  13. unavailable: '該知識庫不可用',
  14. },
  15. stepOne: {
  16. filePreview: '檔案預覽',
  17. pagePreview: '頁面預覽',
  18. dataSourceType: {
  19. file: '匯入已有文字',
  20. notion: '同步自 Notion 內容',
  21. web: '同步自 Web 站點',
  22. },
  23. uploader: {
  24. title: '上傳文字檔案',
  25. button: '拖拽檔案或檔案夾至此,或者',
  26. browse: '選擇檔案',
  27. tip: '已支援 {{supportTypes}},每個檔案不超過 {{size}}MB。',
  28. validation: {
  29. typeError: '檔案型別不支援',
  30. size: '檔案太大了,不能超過 {{size}}MB',
  31. count: '暫不支援多個檔案',
  32. filesNumber: '批次上傳限制 {{filesNumber}}。',
  33. },
  34. cancel: '取消',
  35. change: '更改檔案',
  36. failed: '上傳失敗',
  37. },
  38. notionSyncTitle: 'Notion 未繫結',
  39. notionSyncTip: '同步 Notion 內容前,須先繫結 Notion 空間',
  40. connect: '去繫結',
  41. cancel: '取消',
  42. button: '下一步',
  43. emptyDatasetCreation: '建立一個空知識庫',
  44. modal: {
  45. title: '建立空知識庫',
  46. tip: '空知識庫中還沒有文件,你可以在今後任何時候上傳文件至該知識庫。',
  47. input: '知識庫名稱',
  48. placeholder: '請輸入知識庫名稱',
  49. nameNotEmpty: '名稱不能為空',
  50. nameLengthInvalid: '名稱長度不能超過 40 個字元',
  51. cancelButton: '取消',
  52. confirmButton: '建立',
  53. failed: '建立失敗',
  54. },
  55. website: {
  56. maxDepth: '最大深度',
  57. selectAll: '全選',
  58. exceptionErrorTitle: '運行 Firecrawl 作業時發生異常:',
  59. run: '跑',
  60. extractOnlyMainContent: '僅提取主要內容(無頁眉、導航、頁腳等)',
  61. fireCrawlNotConfiguredDescription: '使用 API 金鑰配置 Firecrawl 以使用它。',
  62. limit: '限制',
  63. crawlSubPage: '抓取子頁面',
  64. preview: '預覽',
  65. configure: '配置',
  66. excludePaths: '排除路徑',
  67. options: '選項',
  68. firecrawlDoc: 'Firecrawl 文件',
  69. totalPageScraped: '抓取的總頁數:',
  70. firecrawlTitle: '使用 🔥Firecrawl 提取 Web 內容',
  71. includeOnlyPaths: '僅包含路徑',
  72. resetAll: '全部重置',
  73. scrapTimeInfo: '在 {{time}} 秒內總共抓取了 {{total}} 個頁面',
  74. unknownError: '未知錯誤',
  75. fireCrawlNotConfigured: '未配置 Firecrawl',
  76. maxDepthTooltip: '相對於輸入的 URL 的最大爬網深度。深度 0 只是抓取輸入的 url 的頁面,深度 1 抓取 url 以及 enteredURL + 1 / 之後的所有內容,依此類推。',
  77. jinaReaderNotConfigured: '未配置 Jina Reader',
  78. jinaReaderNotConfiguredDescription: '通過輸入您的免費 API 金鑰進行訪問來設置 Jina Reader。',
  79. chooseProvider: '選擇供應商',
  80. jinaReaderDoc: '了解有關 Jina Reader 的更多資訊',
  81. jinaReaderTitle: '將整個網站轉換為 Markdown',
  82. useSitemap: '使用網站地圖',
  83. jinaReaderDocLink: 'https://jina.ai/reader',
  84. useSitemapTooltip: '按照網站地圖對網站進行爬網。否則,Jina Reader 將根據頁面相關性反覆運算抓取,從而生成更少但品質更高的頁面。',
  85. watercrawlDoc: 'Watercrawl 文檔',
  86. configureFirecrawl: '配置 Firecrawl',
  87. configureWatercrawl: '配置水爬行',
  88. watercrawlTitle: '使用 Watercrawl 提取網頁內容',
  89. waterCrawlNotConfiguredDescription: '配置 Watercrawl 並使用 API 金鑰來使用它。',
  90. configureJinaReader: '配置 Jina Reader',
  91. waterCrawlNotConfigured: 'Watercrawl 尚未配置',
  92. },
  93. },
  94. stepTwo: {
  95. segmentation: '分段設定',
  96. auto: '自動分段與清洗',
  97. autoDescription: '自動設定分段規則與預處理規則,如果不瞭解這些引數建議選擇此項',
  98. custom: '自定義',
  99. customDescription: '自定義分段規則、分段長度以及預處理規則等引數',
  100. separator: '分段識別符號',
  101. separatorPlaceholder: '例如換行符(\n)或特定的分隔符(如 "***")',
  102. maxLength: '分段最大長度',
  103. overlap: '分段重疊長度',
  104. overlapTip: '設定分段之間的重疊長度可以保留分段之間的語義關係,提升召回效果。建議設定為最大分段長度的 10%-25%',
  105. overlapCheck: '分段重疊長度不能大於分段最大長度',
  106. rules: '文字預處理規則',
  107. removeExtraSpaces: '替換掉連續的空格、換行符和製表符',
  108. removeUrlEmails: '刪除所有 URL 和電子郵件地址',
  109. removeStopwords: '去除停用詞,例如“a”,“an”,“the”等',
  110. preview: '預覽',
  111. reset: '重置',
  112. indexMode: '索引方式',
  113. qualified: '高質量',
  114. recommend: '推薦',
  115. qualifiedTip: '呼叫系統預設的嵌入介面進行處理,以在使用者查詢時提供更高的準確度',
  116. warning: '請先完成模型供應商的 API KEY 設定。.',
  117. click: '前往設定',
  118. economical: '經濟',
  119. economicalTip: '使用離線的向量引擎、關鍵詞索引等方式,降低了準確度但無需花費 Token',
  120. QATitle: '採用 Q&A 分段模式',
  121. QATip: '開啟後將會消耗額外的 token',
  122. QALanguage: '分段使用',
  123. estimateCost: '執行嵌入預估消耗',
  124. estimateSegment: '預估分段數',
  125. segmentCount: '段',
  126. calculating: '計算中...',
  127. fileSource: '預處理文件',
  128. notionSource: '預處理頁面',
  129. other: '和其他 ',
  130. fileUnit: ' 個檔案',
  131. notionUnit: ' 個頁面',
  132. previousStep: '上一步',
  133. nextStep: '儲存並處理',
  134. save: '儲存並處理',
  135. cancel: '取消',
  136. sideTipTitle: '為什麼要分段和預處理?',
  137. sideTipP1: '在處理文字資料時,分段和清洗是兩個重要的預處理步驟。',
  138. sideTipP2: '分段的目的是將長文字拆分成較小的段落,以便模型更有效地處理和理解。這有助於提高模型生成的結果的質量和相關性。',
  139. sideTipP3: '清洗則是對文字進行預處理,刪除不必要的字元、符號或格式,使知識庫更加乾淨、整潔,便於模型解析。',
  140. sideTipP4: '透過對知識庫進行適當的分段和清洗,可以提高模型在實際應用中的表現,從而為使用者提供更準確、更有價值的結果。',
  141. previewTitle: '分段預覽',
  142. previewTitleButton: '預覽',
  143. previewButton: '切換至 Q&A 形式',
  144. previewSwitchTipStart: '當前分段預覽是文字模式,切換到 Q&A 模式將會',
  145. previewSwitchTipEnd: '消耗額外的 token',
  146. characters: '字元',
  147. indexSettingTip: '要更改索引方法,請轉到',
  148. retrievalSettingTip: '要更改檢索方法,請轉到',
  149. datasetSettingLink: '知識庫設定。',
  150. websiteSource: '預處理網站',
  151. webpageUnit: '頁面',
  152. separatorTip: '分隔符是用於分隔文字的字元。\\n\\n 和 \\n 是分隔段落和行的常用分隔符。與逗號(\\n\\n,\\n)組合使用時,當超過最大區塊長度時,段落將按行分段。您也可以使用自定義的特殊分隔符(例如 ***)。',
  153. maxLengthCheck: '塊最大長度應小於 {{limit}}',
  154. general: '常規',
  155. previewChunkCount: '{{count}}估計塊數',
  156. useQALanguage: '使用 Q&A 格式的塊',
  157. qaSwitchHighQualityTipContent: '目前,只有高品質索引方法支援 Q&A 格式分塊。是否要切換到高品質模式?',
  158. previewChunk: '預覽資料塊(Preview Chunk)',
  159. fullDocTip: '整個文件用作父塊並直接檢索。請注意,出於性能原因,超過 10000 個令牌的文本將被自動截斷。',
  160. parentChunkForContext: '父母的背景',
  161. previewChunkTip: '點擊左側的 『Preview Chunk』 按鈕載入預覽',
  162. parentChild: '父子',
  163. notAvailableForQA: '不適用於 Q&A 索引',
  164. parentChildChunkDelimiterTip: '分隔符是用於分隔文字的字元。建議使用 \\n 將父塊拆分為小的子塊。您還可以使用自己定義的特殊分隔符。',
  165. parentChildDelimiterTip: '分隔符是用於分隔文字的字元。建議將原始文檔拆分為多個大型父塊。您還可以使用自己定義的特殊分隔符。',
  166. generalTip: '常規文本分塊模式,檢索和調用的塊是相同的。',
  167. highQualityTip: '在 High Quality 模式下完成嵌入後,將無法恢復到 Economical(經濟)模式。',
  168. childChunkForRetrieval: '用於檢索的 Child-chunk',
  169. paragraphTip: '此模式根據分隔符和最大區塊長度將文本拆分為段落,使用拆分文本作為父區塊進行檢索。',
  170. paragraph: '段',
  171. qaSwitchHighQualityTipTitle: 'Q&A 格式需要高品質的索引方法',
  172. notAvailableForParentChild: '不適用於父子索引',
  173. fullDoc: '完整文件',
  174. parentChildTip: '當使用 parent-child 模式時,child-chunk 用於檢索,parent-chunk 用於作為上下文調用 call。',
  175. switch: '開關',
  176. },
  177. stepThree: {
  178. creationTitle: '🎉 知識庫已建立',
  179. creationContent: '我們自動為該知識庫起了個名稱,您也可以隨時修改',
  180. label: '知識庫名稱',
  181. additionTitle: '🎉 文件已上傳',
  182. additionP1: '文件已上傳至知識庫:',
  183. additionP2: ',你可以在知識庫的文件列表中找到它。',
  184. stop: '停止處理',
  185. resume: '恢復處理',
  186. navTo: '前往文件',
  187. sideTipTitle: '接下來做什麼',
  188. sideTipContent: '當文件完成索引處理後,知識庫即可整合至應用內作為上下文使用,你可以在提示詞編排頁找到上下文設定。你也可以建立成可獨立使用的 ChatGPT 索引外掛釋出。',
  189. modelTitle: '確認停止索引過程嗎?',
  190. modelContent: '如果您需要稍後恢復處理,則從停止處繼續。',
  191. modelButtonConfirm: '確認停止',
  192. modelButtonCancel: '取消',
  193. },
  194. firecrawl: {
  195. configFirecrawl: '配置 🔥Firecrawl',
  196. apiKeyPlaceholder: '來自 firecrawl.dev 的 API 金鑰',
  197. getApiKeyLinkText: '從 firecrawl.dev 獲取 API 金鑰',
  198. },
  199. jinaReader: {
  200. configJinaReader: '配置 Jina Reader',
  201. getApiKeyLinkText: '在 jina.ai 獲取您的免費 API 金鑰',
  202. apiKeyPlaceholder: '來自 jina.ai 的 API 金鑰',
  203. },
  204. otherDataSource: {
  205. learnMore: '瞭解更多資訊',
  206. description: '目前,Dify 的知識庫只有有限的數據源。向 Dify 知識庫貢獻數據源是説明所有使用者增強平台靈活性和強大功能的絕佳方式。我們的貢獻指南使入門變得容易。請點擊下面的連結瞭解更多資訊。',
  207. title: '連接到其他數據源?',
  208. },
  209. watercrawl: {
  210. apiKeyPlaceholder: '來自 watercrawl.dev 的 API 金鑰',
  211. configWatercrawl: '配置水爬行',
  212. getApiKeyLinkText: '從 watercrawl.dev 獲取您的 API 金鑰',
  213. },
  214. }
  215. export default translation