You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

dataset-creation.ts 19KB


  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: 'Создать базу знаний',
  5. update: 'Добавить данные',
  6. fallbackRoute: 'Знание',
  7. },
  8. one: 'Выберите источник данных',
  9. two: 'Предварительная обработка и очистка текста',
  10. three: 'Выполнить и завершить',
  11. },
  12. error: {
  13. unavailable: 'Эта база знаний недоступна',
  14. },
  15. firecrawl: {
  16. configFirecrawl: 'Настроить 🔥Firecrawl',
  17. apiKeyPlaceholder: 'Ключ API с firecrawl.dev',
  18. getApiKeyLinkText: 'Получите свой ключ API с firecrawl.dev',
  19. },
  20. stepOne: {
  21. filePreview: 'Предварительный просмотр файла',
  22. pagePreview: 'Предварительный просмотр страницы',
  23. dataSourceType: {
  24. file: 'Импортировать из файла',
  25. notion: 'Синхронизировать из Notion',
  26. web: 'Синхронизировать с веб-сайта',
  27. },
  28. uploader: {
  29. title: 'Загрузить файл',
  30. button: 'Перетащите файлы или папки или',
  31. buttonSingleFile: 'Перетащите файл или',
  32. browse: 'Обзор',
  33. tip: 'Поддерживаются {{supportTypes}}. Максимум {{size}} МБ каждый.',
  34. validation: {
  35. typeError: 'Тип файла не поддерживается',
  36. size: 'Файл слишком большой. Максимум {{size}} МБ',
  37. count: 'Несколько файлов не поддерживаются',
  38. filesNumber: 'Вы достигли лимита пакетной загрузки {{filesNumber}} файлов.',
  39. },
  40. cancel: 'Отмена',
  41. change: 'Изменить',
  42. failed: 'Ошибка загрузки',
  43. },
  44. notionSyncTitle: 'Notion не подключен',
  45. notionSyncTip: 'Чтобы синхронизировать данные из Notion, сначала необходимо установить соединение с Notion.',
  46. connect: 'Перейти к подключению',
  47. button: 'Далее',
  48. emptyDatasetCreation: 'Я хочу создать пустую базу знаний',
  49. modal: {
  50. title: 'Создать пустую базу знаний',
  51. tip: 'Пустая база знаний не будет содержать документов, и вы можете загружать документы в любое время.',
  52. input: 'Название базы знаний',
  53. placeholder: 'Пожалуйста, введите',
  54. nameNotEmpty: 'Название не может быть пустым',
  55. nameLengthInvalid: 'Название должно быть от 1 до 40 символов',
  56. cancelButton: 'Отмена',
  57. confirmButton: 'Создать',
  58. failed: 'Ошибка создания',
  59. },
  60. website: {
  61. fireCrawlNotConfigured: 'Firecrawl не настроен',
  62. fireCrawlNotConfiguredDescription: 'Настройте Firecrawl с API-ключом.',
  63. configure: 'Настроить',
  64. run: 'Запустить',
  65. firecrawlTitle: 'Извлечь веб-контент с помощью 🔥Firecrawl',
  66. firecrawlDoc: 'Документация Firecrawl',
  67. options: 'Опции',
  68. crawlSubPage: 'Сканировать подстраницы',
  69. limit: 'Лимит',
  70. maxDepth: 'Максимальная глубина',
  71. excludePaths: 'Исключить пути',
  72. includeOnlyPaths: 'Включить только пути',
  73. extractOnlyMainContent: 'Извлекать только основной контент (без заголовков, навигации, футеров и т. д.)',
  74. exceptionErrorTitle: 'Произошло исключение при запуске задания Firecrawl:',
  75. unknownError: 'Неизвестная ошибка',
  76. totalPageScraped: 'Всего просканировано страниц:',
  77. selectAll: 'Выбрать все',
  78. resetAll: 'Сбросить все',
  79. scrapTimeInfo: 'Всего просканировано {{total}} страниц за {{time}} секунд',
  80. preview: 'Предварительный просмотр',
  81. maxDepthTooltip: 'Максимальная глубина сканирования относительно введенного URL. Глубина 0 сканирует только страницу введенного URL, глубина 1 сканирует URL и все, что находится после введенного URL + один /, и так далее.',
  82. jinaReaderNotConfiguredDescription: 'Настройте Jina Reader, введя свой бесплатный ключ API для доступа.',
  83. jinaReaderDocLink: 'https://jina.ai/reader',
  84. useSitemap: 'Использовать карту сайта',
  85. chooseProvider: 'Выберите провайдера',
  86. jinaReaderNotConfigured: 'Jina Reader не настроен',
  87. jinaReaderDoc: 'Узнайте больше о Jina Reader',
  88. jinaReaderTitle: 'Конвертируйте весь сайт в Markdown',
  89. useSitemapTooltip: 'Следуйте карте сайта, чтобы просканировать сайт. Если нет, Jina Reader будет сканировать итеративно в зависимости от релевантности страницы, выдавая меньшее количество страниц, но более высокого качества.',
  90. watercrawlTitle: 'Извлечение веб-контента с помощью Watercrawl',
  91. configureWatercrawl: 'Настроить Watercrawl',
  92. waterCrawlNotConfigured: 'Watercrawl не настроен',
  93. configureFirecrawl: 'Настроить Firecrawl',
  94. waterCrawlNotConfiguredDescription: 'Настройте Watercrawl с помощью ключа API для его использования.',
  95. configureJinaReader: 'Настройте Jina Reader',
  96. watercrawlDoc: 'Документация Watercrawl',
  97. },
  98. cancel: 'Отмена',
  99. },
  100. stepTwo: {
  101. segmentation: 'Настройки фрагментации',
  102. auto: 'Автоматически',
  103. autoDescription: 'Автоматически устанавливать правила фрагментации и предварительной обработки. Пользователям, не знакомым с системой, рекомендуется выбрать этот вариант.',
  104. custom: 'Пользовательский',
  105. customDescription: 'Настроить правила фрагментации, длину фрагментов, правила предварительной обработки и т. д.',
  106. separator: 'Идентификатор сегмента',
  107. separatorPlaceholder: 'Например, новая строка (\\\\n) или специальный разделитель (например, "***")',
  108. maxLength: 'Максимальная длина фрагмента',
  109. overlap: 'Перекрытие фрагментов',
  110. overlapTip: 'Установка перекрытия фрагментов может сохранить семантическую связь между ними, улучшая эффект поиска. Рекомендуется установить 10%-25% от максимального размера фрагмента.',
  111. overlapCheck: 'перекрытие фрагментов не должно превышать максимальную длину фрагмента',
  112. rules: 'Правила предварительной обработки текста',
  113. removeExtraSpaces: 'Заменить последовательные пробелы, новые строки и табуляции',
  114. removeUrlEmails: 'Удалить все URL-адреса и адреса электронной почты',
  115. removeStopwords: 'Удалить стоп-слова, такие как "a", "an", "the"',
  116. preview: 'Подтвердить и просмотреть',
  117. reset: 'Сбросить',
  118. indexMode: 'Режим индексации',
  119. qualified: 'Высокое качество',
  120. recommend: 'Рекомендуется',
  121. qualifiedTip: 'Вызов интерфейса встраивания системы по умолчанию для обработки, чтобы обеспечить более высокую точность при запросах пользователей.',
  122. warning: 'Пожалуйста, сначала настройте ключ API поставщика модели.',
  123. click: 'Перейти к настройкам',
  124. economical: 'Экономичный',
  125. economicalTip: 'Используйте автономные векторные движки, индексы ключевых слов и т. д., чтобы снизить точность, не тратя токены',
  126. QATitle: 'Сегментация в формате вопрос-ответ',
  127. QATip: 'Включение этой опции приведет к потреблению большего количества токенов',
  128. QALanguage: 'Сегментировать с помощью',
  129. estimateCost: 'Оценка',
  130. estimateSegment: 'Оценочное количество фрагментов',
  131. segmentCount: 'фрагментов',
  132. calculating: 'Вычисление...',
  133. fileSource: 'Предварительная обработка документов',
  134. notionSource: 'Предварительная обработка страниц',
  135. websiteSource: 'Предварительная обработка веб-сайта',
  136. other: 'и другие ',
  137. fileUnit: ' файлов',
  138. notionUnit: ' страниц',
  139. webpageUnit: ' страниц',
  140. previousStep: 'Предыдущий шаг',
  141. nextStep: 'Сохранить и обработать',
  142. save: 'Сохранить и обработать',
  143. cancel: 'Отмена',
  144. sideTipTitle: 'Зачем нужна фрагментация и предварительная обработка?',
  145. sideTipP1: 'При обработке текстовых данных фрагментация и очистка являются двумя важными этапами предварительной обработки.',
  146. sideTipP2: 'Сегментация разбивает длинный текст на абзацы, чтобы модели могли лучше его понимать. Это улучшает качество и релевантность результатов модели.',
  147. sideTipP3: 'Очистка удаляет ненужные символы и форматы, делая знания более чистыми и легкими для анализа.',
  148. sideTipP4: 'Правильная фрагментация и очистка улучшают производительность модели, обеспечивая более точные и ценные результаты.',
  149. previewTitle: 'Предварительный просмотр',
  150. previewTitleButton: 'Предварительный просмотр',
  151. previewButton: 'Переключение в формат вопрос-ответ',
  152. previewSwitchTipStart: 'Текущий предварительный просмотр фрагмента находится в текстовом формате, переключение на предварительный просмотр в формате вопрос-ответ',
  153. previewSwitchTipEnd: ' потребляет дополнительные токены',
  154. characters: 'символов',
  155. indexSettingTip: 'Чтобы изменить метод индексации, пожалуйста, перейдите в ',
  156. retrievalSettingTip: 'Чтобы изменить метод индексации, пожалуйста, перейдите в ',
  157. datasetSettingLink: 'настройки базы знаний.',
  158. separatorTip: 'Разделитель — это символ, используемый для разделения текста. \\n\\n и \\n — это часто используемые разделители для разделения абзацев и строк. В сочетании с запятыми (\\n\\n,\\n) абзацы будут сегментированы по строкам, если максимальная длина блока превышает их. Вы также можете использовать специальные разделители, определенные вами (например, ***).',
  159. maxLengthCheck: 'Максимальная длина блока должна быть меньше {{limit}}',
  160. switch: 'Выключатель',
  161. parentChunkForContext: 'Родительский блок для контекста',
  162. previewChunkTip: 'Нажмите кнопку «Предварительный просмотр фрагмента» слева, чтобы загрузить предварительный просмотр',
  163. notAvailableForParentChild: 'Недоступно для индекса типа "родитель-потомок"',
  164. parentChildChunkDelimiterTip: 'Разделитель — это символ, используемый для разделения текста. \\n рекомендуется для разбиения родительских блоков на небольшие дочерние блоки. Вы также можете использовать специальные разделители, определенные самостоятельно.',
  165. previewChunk: 'Предварительный просмотр фрагмента',
  166. previewChunkCount: '{{Количество}} Предполагаемые куски',
  167. generalTip: 'Общий режим фрагментации текста, извлекаемые и вызываемые фрагменты одинаковы.',
  168. general: 'Общее',
  169. useQALanguage: 'Фрагмент с использованием формата Q&A в',
  170. notAvailableForQA: 'Недоступно для индекса Q&A',
  171. paragraph: 'Параграф',
  172. parentChild: 'Родитель-дочерний',
  173. fullDoc: 'Полный документальный фильм',
  174. qaSwitchHighQualityTipTitle: 'Формат вопросов и ответов требует высококачественного метода индексации',
  175. parentChildDelimiterTip: 'Разделитель — это символ, используемый для разделения текста. \\n\\n рекомендуется для разделения исходного документа на большие родительские части. Вы также можете использовать специальные разделители, определенные самостоятельно.',
  176. parentChildTip: 'При использовании режима «родитель-потомок» дочерний блок используется для извлечения, а родительский блок — для вызова в качестве контекста.',
  177. paragraphTip: 'В этом режиме текст разбивается на абзацы на основе разделителей и максимальной длины блока, используя разделенный текст в качестве родительского блока для извлечения.',
  178. highQualityTip: 'После завершения встраивания в режиме «Высокое качество» возврат к экономичному режиму невозможен.',
  179. childChunkForRetrieval: 'Детский фрагмент для извлечения',
  180. qaSwitchHighQualityTipContent: 'В настоящее время только высококачественный метод индекса поддерживает фрагментацию формата Q&A. Хотели бы вы перейти в режим высокого качества?',
  181. fullDocTip: 'Весь документ используется в качестве родительского блока и извлекается напрямую. Обратите внимание, что по причинам производительности текст, превышающий 10000 токенов, будет автоматически обрезан.',
  182. },
  183. stepThree: {
  184. creationTitle: '🎉 База знаний создана',
  185. creationContent: 'Мы автоматически назвали базу знаний, вы можете изменить ее в любое время',
  186. label: 'Название базы знаний',
  187. additionTitle: '🎉 Документ загружен',
  188. additionP1: 'Документ был загружен в базу знаний',
  189. additionP2: ', вы можете найти его в списке документов базы знаний.',
  190. stop: 'Остановить обработку',
  191. resume: 'Возобновить обработку',
  192. navTo: 'Перейти к документу',
  193. sideTipTitle: 'Что дальше',
  194. sideTipContent: 'После завершения индексации документа база знаний может быть интегрирована в приложение в качестве контекста, вы можете найти настройку контекста на странице prompt orchestration. Вы также можете создать-workflow приложение как отдельный как независимый плагин.',
  195. modelTitle: 'Вы уверены, что хотите остановить встраивание?',
  196. modelContent: 'Если вам нужно будет возобновить обработку позже, вы продолжите с того места, где остановились.',
  197. modelButtonConfirm: 'Подтвердить',
  198. modelButtonCancel: 'Отмена',
  199. },
  200. jinaReader: {
  201. getApiKeyLinkText: 'Получите бесплатный ключ API в jina.ai',
  202. configJinaReader: 'Настройка Jina Reader',
  203. apiKeyPlaceholder: 'Ключ API от jina.ai',
  204. },
  205. otherDataSource: {
  206. learnMore: 'Подробнее',
  207. title: 'Подключаться к другим источникам данных?',
  208. description: 'В настоящее время база знаний Dify имеет лишь ограниченные источники данных. Добавление источника данных в базу знаний Dify — это отличный способ повысить гибкость и возможности платформы для всех пользователей. Наше руководство по вкладу поможет вам легко начать работу. Пожалуйста, нажмите на ссылку ниже, чтобы узнать больше.',
  209. },
  210. watercrawl: {
  211. getApiKeyLinkText: 'Получите свой API-ключ с watercrawl.dev',
  212. configWatercrawl: 'Настроить Watercrawl',
  213. apiKeyPlaceholder: 'API ключ с watercrawl.dev',
  214. },
  215. }
  216. export default translation