You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

dataset-creation.ts 19KB


  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: 'Создать базу знаний',
  5. update: 'Добавить данные',
  6. fallbackRoute: 'Знание',
  7. },
  8. one: 'Выберите источник данных',
  9. two: 'Предварительная обработка и очистка текста',
  10. three: 'Выполнить и завершить',
  11. },
  12. error: {
  13. unavailable: 'Эта база знаний недоступна',
  14. },
  15. firecrawl: {
  16. configFirecrawl: 'Настроить 🔥Firecrawl',
  17. apiKeyPlaceholder: 'Ключ API с firecrawl.dev',
  18. getApiKeyLinkText: 'Получите свой ключ API с firecrawl.dev',
  19. },
  20. stepOne: {
  21. filePreview: 'Предварительный просмотр файла',
  22. pagePreview: 'Предварительный просмотр страницы',
  23. dataSourceType: {
  24. file: 'Импортировать из файла',
  25. notion: 'Синхронизировать из Notion',
  26. web: 'Синхронизировать с веб-сайта',
  27. },
  28. uploader: {
  29. title: 'Загрузить файл',
  30. button: 'Перетащите файлы или папки или',
  31. browse: 'Обзор',
  32. tip: 'Поддерживаются {{supportTypes}}. Максимум {{size}} МБ каждый.',
  33. validation: {
  34. typeError: 'Тип файла не поддерживается',
  35. size: 'Файл слишком большой. Максимум {{size}} МБ',
  36. count: 'Несколько файлов не поддерживаются',
  37. filesNumber: 'Вы достигли лимита пакетной загрузки {{filesNumber}} файлов.',
  38. },
  39. cancel: 'Отмена',
  40. change: 'Изменить',
  41. failed: 'Ошибка загрузки',
  42. },
  43. notionSyncTitle: 'Notion не подключен',
  44. notionSyncTip: 'Чтобы синхронизировать данные из Notion, сначала необходимо установить соединение с Notion.',
  45. connect: 'Перейти к подключению',
  46. button: 'Далее',
  47. emptyDatasetCreation: 'Я хочу создать пустую базу знаний',
  48. modal: {
  49. title: 'Создать пустую базу знаний',
  50. tip: 'Пустая база знаний не будет содержать документов, и вы можете загружать документы в любое время.',
  51. input: 'Название базы знаний',
  52. placeholder: 'Пожалуйста, введите',
  53. nameNotEmpty: 'Название не может быть пустым',
  54. nameLengthInvalid: 'Название должно быть от 1 до 40 символов',
  55. cancelButton: 'Отмена',
  56. confirmButton: 'Создать',
  57. failed: 'Ошибка создания',
  58. },
  59. website: {
  60. fireCrawlNotConfigured: 'Firecrawl не настроен',
  61. fireCrawlNotConfiguredDescription: 'Настройте Firecrawl с API-ключом.',
  62. configure: 'Настроить',
  63. run: 'Запустить',
  64. firecrawlTitle: 'Извлечь веб-контент с помощью 🔥Firecrawl',
  65. firecrawlDoc: 'Документация Firecrawl',
  66. options: 'Опции',
  67. crawlSubPage: 'Сканировать подстраницы',
  68. limit: 'Лимит',
  69. maxDepth: 'Максимальная глубина',
  70. excludePaths: 'Исключить пути',
  71. includeOnlyPaths: 'Включить только пути',
  72. extractOnlyMainContent: 'Извлекать только основной контент (без заголовков, навигации, футеров и т. д.)',
  73. exceptionErrorTitle: 'Произошло исключение при запуске задания Firecrawl:',
  74. unknownError: 'Неизвестная ошибка',
  75. totalPageScraped: 'Всего просканировано страниц:',
  76. selectAll: 'Выбрать все',
  77. resetAll: 'Сбросить все',
  78. scrapTimeInfo: 'Всего просканировано {{total}} страниц за {{time}} секунд',
  79. preview: 'Предварительный просмотр',
  80. maxDepthTooltip: 'Максимальная глубина сканирования относительно введенного URL. Глубина 0 сканирует только страницу введенного URL, глубина 1 сканирует URL и все, что находится после введенного URL + один /, и так далее.',
  81. jinaReaderNotConfiguredDescription: 'Настройте Jina Reader, введя свой бесплатный ключ API для доступа.',
  82. jinaReaderDocLink: 'https://jina.ai/reader',
  83. useSitemap: 'Использовать карту сайта',
  84. chooseProvider: 'Выберите провайдера',
  85. jinaReaderNotConfigured: 'Jina Reader не настроен',
  86. jinaReaderDoc: 'Узнайте больше о Jina Reader',
  87. jinaReaderTitle: 'Конвертируйте весь сайт в Markdown',
  88. useSitemapTooltip: 'Следуйте карте сайта, чтобы просканировать сайт. Если нет, Jina Reader будет сканировать итеративно в зависимости от релевантности страницы, выдавая меньшее количество страниц, но более высокого качества.',
  89. watercrawlTitle: 'Извлечение веб-контента с помощью Watercrawl',
  90. configureWatercrawl: 'Настроить Watercrawl',
  91. waterCrawlNotConfigured: 'Watercrawl не настроен',
  92. configureFirecrawl: 'Настроить Firecrawl',
  93. waterCrawlNotConfiguredDescription: 'Настройте Watercrawl с помощью ключа API для его использования.',
  94. configureJinaReader: 'Настройте Jina Reader',
  95. watercrawlDoc: 'Документация Watercrawl',
  96. },
  97. cancel: 'Отмена',
  98. },
  99. stepTwo: {
  100. segmentation: 'Настройки фрагментации',
  101. auto: 'Автоматически',
  102. autoDescription: 'Автоматически устанавливать правила фрагментации и предварительной обработки. Пользователям, не знакомым с системой, рекомендуется выбрать этот вариант.',
  103. custom: 'Пользовательский',
  104. customDescription: 'Настроить правила фрагментации, длину фрагментов, правила предварительной обработки и т. д.',
  105. separator: 'Идентификатор сегмента',
  106. separatorPlaceholder: 'Например, новая строка (\\\\n) или специальный разделитель (например, "***")',
  107. maxLength: 'Максимальная длина фрагмента',
  108. overlap: 'Перекрытие фрагментов',
  109. overlapTip: 'Установка перекрытия фрагментов может сохранить семантическую связь между ними, улучшая эффект поиска. Рекомендуется установить 10%-25% от максимального размера фрагмента.',
  110. overlapCheck: 'перекрытие фрагментов не должно превышать максимальную длину фрагмента',
  111. rules: 'Правила предварительной обработки текста',
  112. removeExtraSpaces: 'Заменить последовательные пробелы, новые строки и табуляции',
  113. removeUrlEmails: 'Удалить все URL-адреса и адреса электронной почты',
  114. removeStopwords: 'Удалить стоп-слова, такие как "a", "an", "the"',
  115. preview: 'Подтвердить и просмотреть',
  116. reset: 'Сбросить',
  117. indexMode: 'Режим индексации',
  118. qualified: 'Высокое качество',
  119. recommend: 'Рекомендуется',
  120. qualifiedTip: 'Вызов интерфейса встраивания системы по умолчанию для обработки, чтобы обеспечить более высокую точность при запросах пользователей.',
  121. warning: 'Пожалуйста, сначала настройте ключ API поставщика модели.',
  122. click: 'Перейти к настройкам',
  123. economical: 'Экономичный',
  124. economicalTip: 'Используйте автономные векторные движки, индексы ключевых слов и т. д., чтобы снизить точность, не тратя токены',
  125. QATitle: 'Сегментация в формате вопрос-ответ',
  126. QATip: 'Включение этой опции приведет к потреблению большего количества токенов',
  127. QALanguage: 'Сегментировать с помощью',
  128. estimateCost: 'Оценка',
  129. estimateSegment: 'Оценочное количество фрагментов',
  130. segmentCount: 'фрагментов',
  131. calculating: 'Вычисление...',
  132. fileSource: 'Предварительная обработка документов',
  133. notionSource: 'Предварительная обработка страниц',
  134. websiteSource: 'Предварительная обработка веб-сайта',
  135. other: 'и другие ',
  136. fileUnit: ' файлов',
  137. notionUnit: ' страниц',
  138. webpageUnit: ' страниц',
  139. previousStep: 'Предыдущий шаг',
  140. nextStep: 'Сохранить и обработать',
  141. save: 'Сохранить и обработать',
  142. cancel: 'Отмена',
  143. sideTipTitle: 'Зачем нужна фрагментация и предварительная обработка?',
  144. sideTipP1: 'При обработке текстовых данных фрагментация и очистка являются двумя важными этапами предварительной обработки.',
  145. sideTipP2: 'Сегментация разбивает длинный текст на абзацы, чтобы модели могли лучше его понимать. Это улучшает качество и релевантность результатов модели.',
  146. sideTipP3: 'Очистка удаляет ненужные символы и форматы, делая знания более чистыми и легкими для анализа.',
  147. sideTipP4: 'Правильная фрагментация и очистка улучшают производительность модели, обеспечивая более точные и ценные результаты.',
  148. previewTitle: 'Предварительный просмотр',
  149. previewTitleButton: 'Предварительный просмотр',
  150. previewButton: 'Переключение в формат вопрос-ответ',
  151. previewSwitchTipStart: 'Текущий предварительный просмотр фрагмента находится в текстовом формате, переключение на предварительный просмотр в формате вопрос-ответ',
  152. previewSwitchTipEnd: ' потребляет дополнительные токены',
  153. characters: 'символов',
  154. indexSettingTip: 'Чтобы изменить метод индексации, пожалуйста, перейдите в ',
  155. retrievalSettingTip: 'Чтобы изменить метод индексации, пожалуйста, перейдите в ',
  156. datasetSettingLink: 'настройки базы знаний.',
  157. separatorTip: 'Разделитель — это символ, используемый для разделения текста. \\n\\n и \\n — это часто используемые разделители для разделения абзацев и строк. В сочетании с запятыми (\\n\\n,\\n) абзацы будут сегментированы по строкам, если максимальная длина блока превышает их. Вы также можете использовать специальные разделители, определенные вами (например, ***).',
  158. maxLengthCheck: 'Максимальная длина блока должна быть меньше {{limit}}',
  159. switch: 'Выключатель',
  160. parentChunkForContext: 'Родительский блок для контекста',
  161. previewChunkTip: 'Нажмите кнопку «Предварительный просмотр фрагмента» слева, чтобы загрузить предварительный просмотр',
  162. notAvailableForParentChild: 'Недоступно для индекса типа "родитель-потомок"',
  163. parentChildChunkDelimiterTip: 'Разделитель — это символ, используемый для разделения текста. \\n рекомендуется для разбиения родительских блоков на небольшие дочерние блоки. Вы также можете использовать специальные разделители, определенные самостоятельно.',
  164. previewChunk: 'Предварительный просмотр фрагмента',
  165. previewChunkCount: '{{Количество}} Предполагаемые куски',
  166. generalTip: 'Общий режим фрагментации текста, извлекаемые и вызываемые фрагменты одинаковы.',
  167. general: 'Общее',
  168. useQALanguage: 'Фрагмент с использованием формата Q&A в',
  169. notAvailableForQA: 'Недоступно для индекса Q&A',
  170. paragraph: 'Параграф',
  171. parentChild: 'Родитель-дочерний',
  172. fullDoc: 'Полный документальный фильм',
  173. qaSwitchHighQualityTipTitle: 'Формат вопросов и ответов требует высококачественного метода индексации',
  174. parentChildDelimiterTip: 'Разделитель — это символ, используемый для разделения текста. \\n\\n рекомендуется для разделения исходного документа на большие родительские части. Вы также можете использовать специальные разделители, определенные самостоятельно.',
  175. parentChildTip: 'При использовании режима «родитель-потомок» дочерний блок используется для извлечения, а родительский блок — для вызова в качестве контекста.',
  176. paragraphTip: 'В этом режиме текст разбивается на абзацы на основе разделителей и максимальной длины блока, используя разделенный текст в качестве родительского блока для извлечения.',
  177. highQualityTip: 'После завершения встраивания в режиме «Высокое качество» возврат к экономичному режиму невозможен.',
  178. childChunkForRetrieval: 'Детский фрагмент для извлечения',
  179. qaSwitchHighQualityTipContent: 'В настоящее время только высококачественный метод индекса поддерживает фрагментацию формата Q&A. Хотели бы вы перейти в режим высокого качества?',
  180. fullDocTip: 'Весь документ используется в качестве родительского блока и извлекается напрямую. Обратите внимание, что по причинам производительности текст, превышающий 10000 токенов, будет автоматически обрезан.',
  181. },
  182. stepThree: {
  183. creationTitle: '🎉 База знаний создана',
  184. creationContent: 'Мы автоматически назвали базу знаний, вы можете изменить ее в любое время',
  185. label: 'Название базы знаний',
  186. additionTitle: '🎉 Документ загружен',
  187. additionP1: 'Документ был загружен в базу знаний',
  188. additionP2: ', вы можете найти его в списке документов базы знаний.',
  189. stop: 'Остановить обработку',
  190. resume: 'Возобновить обработку',
  191. navTo: 'Перейти к документу',
  192. sideTipTitle: 'Что дальше',
  193. sideTipContent: 'После завершения индексации документа база знаний может быть интегрирована в приложение в качестве контекста, вы можете найти настройку контекста на странице prompt orchestration. Вы также можете создать-workflow приложение как отдельный как независимый плагин.',
  194. modelTitle: 'Вы уверены, что хотите остановить встраивание?',
  195. modelContent: 'Если вам нужно будет возобновить обработку позже, вы продолжите с того места, где остановились.',
  196. modelButtonConfirm: 'Подтвердить',
  197. modelButtonCancel: 'Отмена',
  198. },
  199. jinaReader: {
  200. getApiKeyLinkText: 'Получите бесплатный ключ API в jina.ai',
  201. configJinaReader: 'Настройка Jina Reader',
  202. apiKeyPlaceholder: 'Ключ API от jina.ai',
  203. },
  204. otherDataSource: {
  205. learnMore: 'Подробнее',
  206. title: 'Подключаться к другим источникам данных?',
  207. description: 'В настоящее время база знаний Dify имеет лишь ограниченные источники данных. Добавление источника данных в базу знаний Dify — это отличный способ повысить гибкость и возможности платформы для всех пользователей. Наше руководство по вкладу поможет вам легко начать работу. Пожалуйста, нажмите на ссылку ниже, чтобы узнать больше.',
  208. },
  209. watercrawl: {
  210. getApiKeyLinkText: 'Получите свой API-ключ с watercrawl.dev',
  211. configWatercrawl: 'Настроить Watercrawl',
  212. apiKeyPlaceholder: 'API ключ с watercrawl.dev',
  213. },
  214. }
  215. export default translation