You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

dataset-creation.ts 13KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216
  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: 'Criar Conhecimento',
  5. update: 'Adicionar dados',
  6. fallbackRoute: 'Conhecimento',
  7. },
  8. one: 'Escolher fonte de dados',
  9. two: 'Pré-processamento e Limpeza de Texto',
  10. three: 'Executar e finalizar',
  11. },
  12. error: {
  13. unavailable: 'Este Conhecimento não está disponível',
  14. },
  15. stepOne: {
  16. filePreview: 'Visualização do arquivo',
  17. pagePreview: 'Visualização da página',
  18. dataSourceType: {
  19. file: 'Importar de arquivo de texto',
  20. notion: 'Sincronizar do Notion',
  21. web: 'Sincronizar de site',
  22. },
  23. uploader: {
  24. title: 'Enviar arquivo de texto',
  25. button: 'Arraste e solte arquivos ou pastas, ou',
  26. browse: 'Navegar',
  27. tip: 'Suporta {{supportTypes}}. Máximo de {{size}}MB cada.',
  28. validation: {
  29. typeError: 'Tipo de arquivo não suportado',
  30. size: 'Arquivo muito grande. Máximo é {{size}}MB',
  31. count: 'Vários arquivos não suportados',
  32. filesNumber: 'Limite de upload em massa {{filesNumber}}.',
  33. },
  34. cancel: 'Cancelar',
  35. change: 'Alterar',
  36. failed: 'Falha no envio',
  37. },
  38. notionSyncTitle: 'Notion não está conectado',
  39. notionSyncTip: 'Para sincronizar com o Notion, a conexão com o Notion deve ser estabelecida primeiro.',
  40. connect: 'Ir para conexão',
  41. button: 'Próximo',
  42. emptyDatasetCreation: 'Quero criar um Conhecimento vazio',
  43. modal: {
  44. title: 'Criar um Conhecimento vazio',
  45. tip: 'Um Conhecimento vazio não conterá documentos e você poderá fazer upload de documentos a qualquer momento.',
  46. input: 'Nome do Conhecimento',
  47. placeholder: 'Por favor, insira',
  48. nameNotEmpty: 'O nome não pode estar vazio',
  49. nameLengthInvalid: 'O nome deve ter entre 1 e 40 caracteres',
  50. cancelButton: 'Cancelar',
  51. confirmButton: 'Criar',
  52. failed: 'Falha na criação',
  53. },
  54. website: {
  55. fireCrawlNotConfiguredDescription: 'Configure o Firecrawl com a chave de API para usá-lo.',
  56. run: 'Correr',
  57. unknownError: 'Erro desconhecido',
  58. crawlSubPage: 'Rastrear subpáginas',
  59. selectAll: 'Selecionar tudo',
  60. resetAll: 'Redefinir tudo',
  61. includeOnlyPaths: 'Incluir apenas caminhos',
  62. configure: 'Configurar',
  63. limit: 'Limite',
  64. firecrawlDoc: 'Documentos do Firecrawl',
  65. preview: 'Visualizar',
  66. options: 'Opções',
  67. scrapTimeInfo: 'Páginas {{total}} raspadas no total dentro de {{time}}s',
  68. exceptionErrorTitle: 'Ocorreu uma exceção durante a execução do trabalho Firecrawl:',
  69. fireCrawlNotConfigured: 'O Firecrawl não está configurado',
  70. maxDepthTooltip: 'Profundidade máxima para rastrear em relação ao URL inserido. A profundidade 0 apenas raspa a página do url inserido, a profundidade 1 raspa o url e tudo depois de inseridoURL + um / e assim por diante.',
  71. firecrawlTitle: 'Extraia conteúdo da web com 🔥Firecrawl',
  72. maxDepth: 'Profundidade máxima',
  73. totalPageScraped: 'Total de páginas raspadas:',
  74. excludePaths: 'Excluir caminhos',
  75. extractOnlyMainContent: 'Extraia apenas o conteúdo principal (sem cabeçalhos, navs, rodapés, etc.)',
  76. jinaReaderNotConfiguredDescription: 'Configure o Jina Reader inserindo sua chave de API gratuita para acesso.',
  77. jinaReaderDoc: 'Saiba mais sobre o Jina Reader',
  78. chooseProvider: 'Selecione um provedor',
  79. jinaReaderNotConfigured: 'Jina Reader não está configurado',
  80. jinaReaderDocLink: 'https://jina.ai/reader',
  81. useSitemap: 'Usar o mapa do site',
  82. useSitemapTooltip: 'Siga o mapa do site para rastrear o site. Caso contrário, o Jina Reader rastreará iterativamente com base na relevância da página, produzindo menos páginas, mas de maior qualidade.',
  83. jinaReaderTitle: 'Converter todo o site em Markdown',
  84. watercrawlTitle: 'Extrair conteúdo da web com o Watercrawl',
  85. configureFirecrawl: 'Configurar o Firecrawl',
  86. configureJinaReader: 'Configurar o Leitor Jina',
  87. waterCrawlNotConfigured: 'Watercrawl não está configurado',
  88. waterCrawlNotConfiguredDescription: 'Configure o Watercrawl com a chave da API para usá-lo.',
  89. watercrawlDoc: 'Documentos do Watercrawl',
  90. configureWatercrawl: 'Configurar Watercrawl',
  91. },
  92. cancel: 'Cancelar',
  93. },
  94. stepTwo: {
  95. segmentation: 'Configurações de fragmentação',
  96. auto: 'Automático',
  97. autoDescription: 'Configura automaticamente as regras de fragmentação e pré-processamento. Usuários não familiarizados são recomendados a selecionar esta opção.',
  98. custom: 'Personalizado',
  99. customDescription: 'Personalize as regras de fragmentação, comprimento dos fragmentos e regras de pré-processamento, etc.',
  100. separator: 'Identificador de segmento',
  101. separatorPlaceholder: 'Por exemplo, nova linha (\\\\n) ou separador especial (como "***")',
  102. maxLength: 'Comprimento máximo do fragmento',
  103. overlap: 'Sobreposição de blocos',
  104. overlapTip: 'Configurar a sobreposição de blocos pode manter a relevância semântica entre eles, melhorando o efeito de recuperação. É recomendado definir de 10% a 25% do tamanho máximo do bloco.',
  105. overlapCheck: 'a sobreposição de blocos não deve ser maior que o comprimento máximo do bloco',
  106. rules: 'Regras de pré-processamento de texto',
  107. removeExtraSpaces: 'Substituir espaços consecutivos, quebras de linha e tabulações',
  108. removeUrlEmails: 'Excluir todos os URLs e endereços de e-mail',
  109. removeStopwords: 'Remover palavras irrelevantes como "um", "uma", "o"',
  110. preview: 'Confirmar e visualizar',
  111. reset: 'Redefinir',
  112. indexMode: 'Modo de índice',
  113. qualified: 'Alta qualidade',
  114. recommend: 'Recomendado',
  115. qualifiedTip: 'Chama a interface de incorporação do sistema padrão para processamento, fornecendo maior precisão ao consultar.',
  116. warning: 'Por favor, configure primeiro a chave da API do provedor do modelo.',
  117. click: 'Ir para configurações',
  118. economical: 'Econômico',
  119. economicalTip: 'Use motores de vetor offline, índices de palavras-chave, etc. para reduzir a precisão sem gastar tokens',
  120. QATitle: 'Fragmentação no formato de Perguntas e Respostas',
  121. QATip: 'Habilitar esta opção consumirá mais tokens',
  122. QALanguage: 'Fragmentar usando',
  123. estimateCost: 'Estimativa',
  124. estimateSegment: 'Fragmentos estimados',
  125. segmentCount: 'fragmentos',
  126. calculating: 'Calculando...',
  127. fileSource: 'Pré-processar documentos',
  128. notionSource: 'Pré-processar páginas',
  129. other: 'e outros ',
  130. fileUnit: ' arquivos',
  131. notionUnit: ' páginas',
  132. previousStep: 'Passo anterior',
  133. nextStep: 'Salvar e Processar',
  134. save: 'Salvar e Processar',
  135. cancel: 'Cancelar',
  136. sideTipTitle: 'Por que fragmentar e pré-processar?',
  137. sideTipP1: 'Ao processar dados de texto, fragmentar e limpar são duas etapas importantes de pré-processamento.',
  138. sideTipP2: 'A fragmentação divide um texto longo em parágrafos para que os modelos possam entender melhor. Isso melhora a qualidade e relevância dos resultados do modelo.',
  139. sideTipP3: 'A limpeza remove caracteres e formatos desnecessários, tornando o Conhecimento mais limpo e fácil de analisar.',
  140. sideTipP4: 'Fragmentação e limpeza adequadas melhoram o desempenho do modelo, fornecendo resultados mais precisos e valiosos.',
  141. previewTitle: 'Visualização',
  142. previewTitleButton: 'Visualização',
  143. previewButton: 'Alternar para visualização no formato de Perguntas e Respostas',
  144. previewSwitchTipStart: 'A visualização atual do fragmento está no formato de texto, alternar para uma visualização no formato de Perguntas e Respostas irá',
  145. previewSwitchTipEnd: ' consumir tokens adicionais',
  146. characters: 'caracteres',
  147. indexSettingTip: 'Para alterar o método de índice, por favor vá para as ',
  148. retrievalSettingTip: 'Para alterar o método de índice, por favor vá para as ',
  149. datasetSettingLink: 'configurações do Conhecimento.',
  150. websiteSource: 'Site de pré-processamento',
  151. webpageUnit: 'Páginas',
  152. separatorTip: 'Um delimitador é o caractere usado para separar o texto. \\n\\n e \\n são delimitadores comumente usados para separar parágrafos e linhas. Combinado com vírgulas (\\n\\n,\\n), os parágrafos serão segmentados por linhas ao exceder o comprimento máximo do bloco. Você também pode usar delimitadores especiais definidos por você (por exemplo, ***).',
  153. maxLengthCheck: 'O comprimento máximo do chunk deve ser inferior a {{limit}}',
  154. parentChildDelimiterTip: 'Um delimitador é o caractere usado para separar o texto. \\n\\n é recomendado para dividir o documento original em grandes partes pai. Você também pode usar delimitadores especiais definidos por você.',
  155. parentChildChunkDelimiterTip: 'Um delimitador é o caractere usado para separar o texto. \\n é recomendado para dividir partes pai em pequenas partes filhas. Você também pode usar delimitadores especiais definidos por você.',
  156. notAvailableForQA: 'Não disponível para o Índice de P e R',
  157. parentChild: 'Pai-filho',
  158. general: 'Geral',
  159. qaSwitchHighQualityTipTitle: 'O formato de perguntas e respostas requer um método de indexação de alta qualidade',
  160. parentChunkForContext: 'Parte-pai para contexto',
  161. switch: 'Interruptor',
  162. fullDoc: 'Doc completo',
  163. qaSwitchHighQualityTipContent: 'Atualmente, apenas o método de índice de alta qualidade dá suporte ao agrupamento no formato Q&A. Gostaria de mudar para o modo de alta qualidade?',
  164. childChunkForRetrieval: 'Filho-pedaço para recuperação',
  165. useQALanguage: 'Chunk usando o formato de perguntas e respostas em',
  166. previewChunk: 'Visualizar parte',
  167. notAvailableForParentChild: 'Não disponível para Índice pai-filho',
  168. paragraph: 'Parágrafo',
  169. parentChildTip: 'Ao usar o modo pai-filho, o filho-chunk é usado para recuperação e o pai-chunk é usado para recall como contexto.',
  170. generalTip: 'Modo de agrupamento de texto geral, os pedaços recuperados e recuperados são os mesmos.',
  171. highQualityTip: 'Depois de concluir a incorporação no modo de alta qualidade, a reversão para o modo econômico não estará disponível.',
  172. previewChunkTip: 'Clique no botão \'Preview Chunk\' à esquerda para carregar a visualização',
  173. fullDocTip: 'O documento inteiro é usado como parte pai e recuperado diretamente. Observe que, por motivos de desempenho, o texto que exceder 10000 tokens será truncado automaticamente.',
  174. paragraphTip: 'Esse modo divide o texto em parágrafos com base em delimitadores e no comprimento máximo da parte, usando o texto dividido como a parte pai para recuperação.',
  175. previewChunkCount: '{{contagem}} Partes estimadas',
  176. },
  177. stepThree: {
  178. creationTitle: '🎉 Conhecimento criado',
  179. creationContent: 'Nomeamos automaticamente o Conhecimento, você pode modificá-lo a qualquer momento',
  180. label: 'Nome do Conhecimento',
  181. additionTitle: '🎉 Documento enviado',
  182. additionP1: 'O documento foi enviado para o Conhecimento',
  183. additionP2: ', você pode encontrá-lo na lista de documentos do Conhecimento.',
  184. stop: 'Parar processamento',
  185. resume: 'Continuar processamento',
  186. navTo: 'Ir para documento',
  187. sideTipTitle: 'O que fazer em seguida',
  188. sideTipContent: 'Após a conclusão da indexação do documento, o Conhecimento pode ser integrado à aplicação como contexto. Você pode encontrar a configuração de contexto na página de orquestração de prompts. Você também pode criá-lo como um plugin de indexação ChatGPT independente para lançamento.',
  189. modelTitle: 'Tem certeza de que deseja parar a incorporação?',
  190. modelContent: 'Se você precisar continuar o processamento posteriormente, você continuará de onde parou.',
  191. modelButtonConfirm: 'Confirmar',
  192. modelButtonCancel: 'Cancelar',
  193. },
  194. firecrawl: {
  195. apiKeyPlaceholder: 'Chave de API do firecrawl.dev',
  196. configFirecrawl: 'Configurar 🔥o Firecrawl',
  197. getApiKeyLinkText: 'Obtenha sua chave de API do firecrawl.dev',
  198. },
  199. jinaReader: {
  200. getApiKeyLinkText: 'Obtenha sua chave de API gratuita em jina.ai',
  201. configJinaReader: 'Configurar o Jina Reader',
  202. apiKeyPlaceholder: 'Chave de API do jina.ai',
  203. },
  204. otherDataSource: {
  205. learnMore: 'Saiba Mais',
  206. description: 'Atualmente, a base de conhecimento da Dify possui apenas fontes de dados limitadas. Contribuir com uma fonte de dados para a base de conhecimento Dify é uma maneira fantástica de ajudar a aumentar a flexibilidade e o poder da plataforma para todos os usuários. Nosso guia de contribuição facilita o início. Clique no link abaixo para saber mais.',
  207. title: 'Conectar-se a outras fontes de dados?',
  208. },
  209. watercrawl: {
  210. apiKeyPlaceholder: 'Chave da API do watercrawl.dev',
  211. configWatercrawl: 'Configurar Watercrawl',
  212. getApiKeyLinkText: 'Obtenha sua chave de API em watercrawl.dev',
  213. },
  214. }
  215. export default translation