You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

dataset-creation.ts 15KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214
  1. const translation = {
  2. steps: {
  3. header: {
  4. fallbackRoute: 'ナレッジベース',
  5. },
  6. one: 'データソース',
  7. two: 'テキスト進行中',
  8. three: '実行と完成',
  9. },
  10. error: {
  11. unavailable: 'このナレッジベースは利用できません',
  12. },
  13. firecrawl: {
  14. configFirecrawl: '🔥Firecrawl の設定',
  15. apiKeyPlaceholder: 'firecrawl.dev からの API キー',
  16. getApiKeyLinkText: 'firecrawl.dev から API キーを取得する',
  17. },
  18. jinaReader: {
  19. getApiKeyLinkText: '無料の API キーを jina.ai で取得',
  20. apiKeyPlaceholder: 'jina.ai からの API キー',
  21. configJinaReader: 'Jina Reader の設定',
  22. },
  23. stepOne: {
  24. filePreview: 'ファイルプレビュー',
  25. pagePreview: 'ページプレビュー',
  26. dataSourceType: {
  27. file: 'テキストファイルからインポート',
  28. notion: 'Notion から同期',
  29. web: 'ウェブサイトから同期',
  30. },
  31. uploader: {
  32. title: 'テキストファイルをアップロード',
  33. button: 'ファイルまたはフォルダをドラッグアンドドロップする',
  34. browse: '参照',
  35. tip: '{{supportTypes}}をサポートしています。1 つあたりの最大サイズは{{size}}MB です。',
  36. validation: {
  37. typeError: 'サポートされていないファイルタイプです',
  38. size: 'ファイルサイズが大きすぎます。最大サイズは{{size}}MB です',
  39. count: '複数のファイルはサポートされていません',
  40. filesNumber: 'バッチアップロードの制限({{filesNumber}}個)に達しました。',
  41. },
  42. cancel: 'キャンセル',
  43. change: '変更',
  44. failed: 'アップロードに失敗しました',
  45. },
  46. notionSyncTitle: 'Notion が接続されていません',
  47. notionSyncTip: 'Notion と同期するには、まず Notion への接続が必要です。',
  48. connect: '接続する',
  49. cancel: 'キャンセル',
  50. button: '次へ',
  51. emptyDatasetCreation: '空のナレッジベースを作成します',
  52. modal: {
  53. title: '空のナレッジベースを作成',
  54. tip: '空のナレッジベースにはドキュメントが含まれず、いつでもドキュメントをアップロードできます。',
  55. input: 'ナレッジベースの名称',
  56. placeholder: '入力してください',
  57. nameNotEmpty: '名前は空にできません',
  58. nameLengthInvalid: '名前は 1〜40 文字である必要があります',
  59. cancelButton: 'キャンセル',
  60. confirmButton: '作成',
  61. failed: '作成に失敗しました',
  62. },
  63. website: {
  64. chooseProvider: 'プロバイダーを選択する',
  65. fireCrawlNotConfigured: 'Firecrawl が設定されていません',
  66. fireCrawlNotConfiguredDescription: 'Firecrawl を使用するには、Firecrawl の API キーを設定してください。',
  67. jinaReaderNotConfigured: 'Jina Reader が設定されていません',
  68. jinaReaderNotConfiguredDescription: '無料の API キーを入力して、Jina Reader を設定します。',
  69. configure: '設定',
  70. configureFirecrawl: '配置 Firecrawl',
  71. configureJinaReader: '配置 Jina Reader',
  72. run: '実行',
  73. firecrawlTitle: '🔥Firecrawl を使っでウエブコンテンツを抽出',
  74. firecrawlDoc: 'Firecrawl ドキュメント',
  75. jinaReaderTitle: 'サイト全体を Markdown に変換する',
  76. jinaReaderDoc: 'Jina Reader の詳細',
  77. jinaReaderDocLink: 'https://jina.ai/reader',
  78. useSitemap: 'sitemap(サイトマップ) を使用する',
  79. useSitemapTooltip: 'サイトマップに沿ってサイトをクロールします。そうでない場合、Jina Reader はページの関連性に基づいて繰り返しクロールし、ページ数は少なくなりますが、高品質のページが得られます。',
  80. options: 'オプション',
  81. crawlSubPage: 'サブページをクロールする',
  82. limit: '制限',
  83. maxDepth: '最大深度',
  84. excludePaths: 'パスを除外する',
  85. includeOnlyPaths: 'パスのみを含める',
  86. extractOnlyMainContent: 'メインコンテンツのみを抽出する (ヘッダー、ナビ、フッターなどは抽出しない)',
  87. exceptionErrorTitle: 'Firecrawl ジョブの実行中に例外が発生しました:',
  88. unknownError: '不明なエラー',
  89. totalPageScraped: 'スクレイピングされた総ページ数:',
  90. selectAll: 'すべて選択',
  91. resetAll: 'すべてリセット',
  92. scrapTimeInfo: '{{time}} 秒以内に合計 {{total}} ページをスクレイピングしました',
  93. preview: 'プレビュー',
  94. maxDepthTooltip: '入力された URL を基にしたクローリング作業での設定可能な最大深度について説明します。深度 0 は入力された URL 自体のページを対象としたスクレイピングを意味します。深度 1 では、元の URL の直下にあるページ(URL に続く最初の"/"以降の内容)もスクレイピングの対象になります。この深度は指定した数値まで増加させることができ、それに応じてスクレイピングの範囲も広がっていきます。',
  95. waterCrawlNotConfiguredDescription: 'API キーを使って Watercrawl を設定します。',
  96. configureWatercrawl: 'ウォータークローラーを設定する',
  97. watercrawlDoc: 'ウォータークローリングの文書',
  98. watercrawlTitle: 'Watercrawl を使用してウェブコンテンツを抽出する',
  99. waterCrawlNotConfigured: 'Watercrawl は設定されていません',
  100. },
  101. },
  102. stepTwo: {
  103. segmentation: 'チャンク設定',
  104. auto: '自動',
  105. autoDescription: 'チャンクと前処理ルールを自動的に設定します。初めてのユーザーはこれを選択することをおすすめします。',
  106. custom: 'カスタム',
  107. customDescription: 'チャンクのルール、チャンクの長さ、前処理ルールなどをカスタマイズします。',
  108. general: '汎用',
  109. generalTip: '汎用テキスト分割モードです。検索とコンテキスト抽出に同じチャンクを使用します。',
  110. parentChild: '親子',
  111. parentChildTip: '親子分割モード (階層分割モード) では、子チャンクを検索に、親チャンクをコンテキスト抽出に使用します。',
  112. parentChunkForContext: 'コンテキスト用親チャンク',
  113. childChunkForRetrieval: '検索用子チャンク',
  114. paragraph: '段落',
  115. paragraphTip: '区切り文字と最大チャンク長に基づいてテキストを段落に分割し、分割されたテキストを検索用の親チャンクとして使用します。',
  116. fullDoc: '全文',
  117. fullDocTip: 'ドキュメント全体を親チャンクとして使用し、直接検索します。パフォーマンス上の理由から、10000 トークンを超えるテキストは自動的に切り捨てられます。',
  118. separator: 'チャンク識別子',
  119. separatorPlaceholder: '例えば改行(\\\\n)や特殊なセパレータ(例:「***」)',
  120. maxLength: '最大チャンク長',
  121. overlap: 'チャンクのオーバーラップ',
  122. overlapTip: 'チャンクのオーバーラップを設定することで、それらの間の意味的な関連性を維持し、検索効果を向上させることができます。最大チャンクサイズの 10%〜25% を設定することをおすすめします。',
  123. overlapCheck: 'チャンクのオーバーラップは最大チャンク長を超えてはいけません',
  124. rules: 'テキストの前処理ルール',
  125. removeExtraSpaces: '連続するスペース、改行、タブを置換する',
  126. removeUrlEmails: 'すべての URL とメールアドレスを削除する',
  127. removeStopwords: '「a」「an」「the」などのストップワードを削除する',
  128. preview: 'プレビュー',
  129. previewChunk: 'チャンクをプレビュー',
  130. reset: 'リセット',
  131. indexMode: 'インデックス方法',
  132. qualified: '高品質',
  133. highQualityTip: '高品質モードで埋め込みを終了したら、経済的モードに戻すことはできません。',
  134. recommend: '推奨',
  135. qualifiedTip: '埋め込みモデルを呼び出してドキュメントを処理し、より正確な検索を行うと、LLM が高品質の回答を生成するのに役立ちます。',
  136. warning: 'モデルプロバイダの API キーを設定してください。',
  137. click: '設定に移動',
  138. economical: '経済的',
  139. economicalTip: '検索時にチャンクあたり 10 個のキーワードを使用することで、精度は低下しますが、トークン消費を抑えられます。',
  140. QATitle: '質問と回答形式でセグメント化',
  141. QATip: 'このオプションを有効にすると、追加のトークンが消費されます',
  142. QALanguage: '使用言語',
  143. useQALanguage: 'Q&A 形式で分割',
  144. estimateCost: '見積もり',
  145. estimateSegment: '推定チャンク数',
  146. segmentCount: 'チャンク',
  147. calculating: '計算中...',
  148. fileSource: 'ドキュメントの前処理',
  149. notionSource: 'ページの前処理',
  150. websiteSource: 'ウエブサイドの前処理',
  151. other: 'その他',
  152. fileUnit: 'ファイル',
  153. notionUnit: 'ページ',
  154. webpageUnit: ' ページ',
  155. previousStep: '前のステップ',
  156. nextStep: '保存して処理',
  157. save: '保存して処理',
  158. cancel: 'キャンセル',
  159. sideTipTitle: 'なぜチャンクと前処理が必要なのか',
  160. sideTipP1: 'テキストデータを処理する際、チャンクとクリーニングは 2 つの重要な前処理ステップです。',
  161. sideTipP2: 'セグメンテーションは長いテキストを段落に分割し、モデルがより理解しやすくします。これにより、モデルの結果の品質と関連性が向上します。',
  162. sideTipP3: 'クリーニングは不要な文字や書式を削除し、ナレッジベースをよりクリーンで解析しやすいものにします。',
  163. sideTipP4: '適切なチャンクとクリーニングはモデルのパフォーマンスを向上させ、より正確で価値のある結果を提供します。',
  164. previewTitle: 'プレビュー',
  165. previewTitleButton: 'プレビュー',
  166. previewButton: 'Q&A 形式に切り替える',
  167. previewSwitchTipStart: '現在のチャンクプレビューはテキスト形式です。質問と回答形式のプレビューに切り替えると、',
  168. previewSwitchTipEnd: ' 追加のトークンが消費されます',
  169. characters: '文字',
  170. indexSettingTip: 'インデックス方法を変更するには、',
  171. retrievalSettingTip: '検索方法を変更するには、',
  172. datasetSettingLink: 'ナレッジベース設定',
  173. separatorTip: '区切り文字は、テキストを区切るために使用される文字です。\\n\\n と \\n は、段落と行を区切るために一般的に使用される区切り記号です。カンマ (\\n\\n,\\n) と組み合わせると、最大チャンク長を超えると、段落は行で区切られます。自分で定義した特別な区切り文字を使用することもできます (例:***)。',
  174. maxLengthCheck: 'チャンクの最大長は {{limit}} 未満にする必要があります',
  175. previewChunkTip: 'プレビューを読み込むには、左側の \'チャンクをプレビュー\' ボタンをクリックしてください',
  176. previewChunkCount: '推定チャンク数:{{count}}',
  177. switch: '切り替え',
  178. qaSwitchHighQualityTipTitle: 'Q&A 形式には高品質なインデックスが必要です',
  179. qaSwitchHighQualityTipContent: '現在、高品質なインデックス作成のみが Q&A 形式の分割をサポートしています。高品質モードに切り替えますか?',
  180. notAvailableForParentChild: '親子インデックスでは利用できません',
  181. notAvailableForQA: 'Q&A インデックスでは利用できません',
  182. parentChildDelimiterTip: '区切り文字とは、テキストを分割するために使用される文字です。\\n\\n は、元のドキュメントを大きな親チャンクに分割する際におすすめです。独自の区切り文字も使用できます。',
  183. parentChildChunkDelimiterTip: '区切り文字とは、テキストを分割するために使用される文字です。\\n は、親チャンクを小さな子チャンクに分割する際におすすめです。独自の区切り文字も使用できます。',
  184. },
  185. stepThree: {
  186. creationTitle: '🎉 ナレッジベースが作成されました',
  187. creationContent: 'ナレッジベースの名前は自動的に設定されましたが、自由に変更できます。',
  188. label: 'ナレッジベース名',
  189. additionTitle: '🎉 ドキュメントがアップロードされました',
  190. additionP1: 'ドキュメントはナレッジベースにアップロードされました',
  191. additionP2: '、ナレッジベースのドキュメントリストで見つけることができます。',
  192. stop: '処理を停止',
  193. resume: '処理を再開',
  194. navTo: 'ドキュメントに移動',
  195. sideTipTitle: '次は何ですか',
  196. sideTipContent: 'ドキュメントのインデックスが完了したら、ナレッジベースをアプリケーションのコンテキストとして統合することができます。プロンプトオーケストレーションページでコンテキスト設定を見つけることができます。また、独立した ChatGPT インデックスプラグインとしてリリースすることもできます。',
  197. modelTitle: '埋め込みを停止してもよろしいですか?',
  198. modelContent: '後で処理を再開する必要がある場合は、中断した場所から続行します。',
  199. modelButtonConfirm: '確認',
  200. modelButtonCancel: 'キャンセル',
  201. },
  202. otherDataSource: {
  203. title: '他のデータソースと接続しますか?',
  204. description: '現在、Dify のナレッジベースには利用できるデータソースが限られています。Dify のナレッジベースにデータソースを提供いただくことは、プラットフォームの柔軟性と能力を向上させる上で非常に有益です。貢献ガイドをご用意していますので、ぜひご協力ください。詳細については、以下のリンクをクリックしてください。',
  205. learnMore: '詳細はこちら',
  206. },
  207. watercrawl: {
  208. getApiKeyLinkText: 'watercrawl.dev から API キーを取得してください。',
  209. configWatercrawl: 'ウォータークローラーを設定する',
  210. apiKeyPlaceholder: 'watercrawl.dev からの API キー',
  211. },
  212. }
  213. export default translation