您最多选择25个主题 主题必须以字母或数字开头,可以包含连字符 (-),并且长度不得超过35个字符

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382
  1. <div align="center">
  2. <a href="https://demo.ragflow.io/">
  3. <img src="web/src/assets/logo-with-text.png" width="520" alt="ragflow logo">
  4. </a>
  5. </div>
  6. <p align="center">
  7. <a href="./README.md">English</a> |
  8. <a href="./README_zh.md">简体中文</a> |
  9. <a href="./README_tzh.md">繁体中文</a> |
  10. <a href="./README_ja.md">日本語</a> |
  11. <a href="./README_ko.md">한국어</a> |
  12. <a href="./README_id.md">Bahasa Indonesia</a> |
  13. <a href="/README_pt_br.md">Português (Brasil)</a>
  14. </p>
  15. <p align="center">
  16. <a href="https://x.com/intent/follow?screen_name=infiniflowai" target="_blank">
  17. <img src="https://img.shields.io/twitter/follow/infiniflow?logo=X&color=%20%23f5f5f5" alt="seguir no X(Twitter)">
  18. </a>
  19. <a href="https://demo.ragflow.io" target="_blank">
  20. <img alt="Badge Estático" src="https://img.shields.io/badge/Online-Demo-4e6b99">
  21. </a>
  22. <a href="https://hub.docker.com/r/infiniflow/ragflow" target="_blank">
  23. <img src="https://img.shields.io/badge/docker_pull-ragflow:v0.19.0-brightgreen" alt="docker pull infiniflow/ragflow:v0.19.0">
  24. </a>
  25. <a href="https://github.com/infiniflow/ragflow/releases/latest">
  26. <img src="https://img.shields.io/github/v/release/infiniflow/ragflow?color=blue&label=Última%20Relese" alt="Última Versão">
  27. </a>
  28. <a href="https://github.com/infiniflow/ragflow/blob/main/LICENSE">
  29. <img height="21" src="https://img.shields.io/badge/License-Apache--2.0-ffffff?labelColor=d4eaf7&color=2e6cc4" alt="licença">
  30. </a>
  31. </p>
  32. <h4 align="center">
  33. <a href="https://ragflow.io/docs/dev/">Documentação</a> |
  34. <a href="https://github.com/infiniflow/ragflow/issues/4214">Roadmap</a> |
  35. <a href="https://twitter.com/infiniflowai">Twitter</a> |
  36. <a href="https://discord.gg/NjYzJD3GM3">Discord</a> |
  37. <a href="https://demo.ragflow.io">Demo</a>
  38. </h4>
  39. <details open>
  40. <summary><b>📕 Índice</b></summary>
  41. - 💡 [O que é o RAGFlow?](#-o-que-é-o-ragflow)
  42. - 🎮 [Demo](#-demo)
  43. - 📌 [Últimas Atualizações](#-últimas-atualizações)
  44. - 🌟 [Principais Funcionalidades](#-principais-funcionalidades)
  45. - 🔎 [Arquitetura do Sistema](#-arquitetura-do-sistema)
  46. - 🎬 [Primeiros Passos](#-primeiros-passos)
  47. - 🔧 [Configurações](#-configurações)
  48. - 🔧 [Construir uma imagem docker sem incorporar modelos](#-construir-uma-imagem-docker-sem-incorporar-modelos)
  49. - 🔧 [Construir uma imagem docker incluindo modelos](#-construir-uma-imagem-docker-incluindo-modelos)
  50. - 🔨 [Lançar serviço a partir do código-fonte para desenvolvimento](#-lançar-serviço-a-partir-do-código-fonte-para-desenvolvimento)
  51. - 📚 [Documentação](#-documentação)
  52. - 📜 [Roadmap](#-roadmap)
  53. - 🏄 [Comunidade](#-comunidade)
  54. - 🙌 [Contribuindo](#-contribuindo)
  55. </details>
  56. ## 💡 O que é o RAGFlow?
  57. [RAGFlow](https://ragflow.io/) é um mecanismo RAG (Geração Aumentada por Recuperação) de código aberto baseado em entendimento profundo de documentos. Ele oferece um fluxo de trabalho RAG simplificado para empresas de qualquer porte, combinando LLMs (Modelos de Linguagem de Grande Escala) para fornecer capacidades de perguntas e respostas verídicas, respaldadas por citações bem fundamentadas de diversos dados complexos formatados.
  58. ## 🎮 Demo
  59. Experimente nossa demo em [https://demo.ragflow.io](https://demo.ragflow.io).
  60. <div align="center" style="margin-top:20px;margin-bottom:20px;">
  61. <img src="https://github.com/infiniflow/ragflow/assets/7248/2f6baa3e-1092-4f11-866d-36f6a9d075e5" width="1200"/>
  62. <img src="https://github.com/user-attachments/assets/504bbbf1-c9f7-4d83-8cc5-e9cb63c26db6" width="1200"/>
  63. </div>
  64. ## 🔥 Últimas Atualizações
  65. - 19-03-2025 Suporta o uso de um modelo multi-modal para entender imagens dentro de arquivos PDF ou DOCX.
  66. - 28-02-2025 combinado com a pesquisa na Internet (T AVI LY), suporta pesquisas profundas para qualquer LLM.
  67. - 26-01-2025 Otimize a extração e aplicação de gráficos de conhecimento e forneça uma variedade de opções de configuração.
  68. - 18-12-2024 Atualiza o modelo de Análise de Layout de Documentos no DeepDoc.
  69. - 01-11-2024 Adiciona extração de palavras-chave e geração de perguntas relacionadas aos blocos analisados para melhorar a precisão da recuperação.
  70. - 22-08-2024 Suporta conversão de texto para comandos SQL via RAG.
  71. ## 🎉 Fique Ligado
  72. ⭐️ Dê uma estrela no nosso repositório para se manter atualizado com novas funcionalidades e melhorias empolgantes! Receba notificações instantâneas sobre novos lançamentos! 🌟
  73. <div align="center" style="margin-top:20px;margin-bottom:20px;">
  74. <img src="https://github.com/user-attachments/assets/18c9707e-b8aa-4caf-a154-037089c105ba" width="1200"/>
  75. </div>
  76. ## 🌟 Principais Funcionalidades
  77. ### 🍭 **"Qualidade entra, qualidade sai"**
  78. - Extração de conhecimento baseada em [entendimento profundo de documentos](./deepdoc/README.md) a partir de dados não estruturados com formatos complicados.
  79. - Encontra a "agulha no palheiro de dados" de literalmente tokens ilimitados.
  80. ### 🍱 **Fragmentação baseada em templates**
  81. - Inteligente e explicável.
  82. - Muitas opções de templates para escolher.
  83. ### 🌱 **Citações fundamentadas com menos alucinações**
  84. - Visualização da fragmentação de texto para permitir intervenção humana.
  85. - Visualização rápida das referências chave e citações rastreáveis para apoiar respostas fundamentadas.
  86. ### 🍔 **Compatibilidade com fontes de dados heterogêneas**
  87. - Suporta Word, apresentações, excel, txt, imagens, cópias digitalizadas, dados estruturados, páginas da web e mais.
  88. ### 🛀 **Fluxo de trabalho RAG automatizado e sem esforço**
  89. - Orquestração RAG simplificada voltada tanto para negócios pessoais quanto grandes empresas.
  90. - Modelos LLM e de incorporação configuráveis.
  91. - Múltiplas recuperações emparelhadas com reclassificação fundida.
  92. - APIs intuitivas para integração sem problemas com os negócios.
  93. ## 🔎 Arquitetura do Sistema
  94. <div align="center" style="margin-top:20px;margin-bottom:20px;">
  95. <img src="https://github.com/infiniflow/ragflow/assets/12318111/d6ac5664-c237-4200-a7c2-a4a00691b485" width="1000"/>
  96. </div>
  97. ## 🎬 Primeiros Passos
  98. ### 📝 Pré-requisitos
  99. - CPU >= 4 núcleos
  100. - RAM >= 16 GB
  101. - Disco >= 50 GB
  102. - Docker >= 24.0.0 & Docker Compose >= v2.26.1
  103. - [gVisor](https://gvisor.dev/docs/user_guide/install/): Necessário apenas se você pretende usar o recurso de executor de código (sandbox) do RAGFlow.
  104. > [!TIP]
  105. > Se você não instalou o Docker na sua máquina local (Windows, Mac ou Linux), veja [Instalar Docker Engine](https://docs.docker.com/engine/install/).
  106. ### 🚀 Iniciar o servidor
  107. 1. Certifique-se de que `vm.max_map_count` >= 262144:
  108. > Para verificar o valor de `vm.max_map_count`:
  109. >
  110. > ```bash
  111. > $ sysctl vm.max_map_count
  112. > ```
  113. >
  114. > Se necessário, redefina `vm.max_map_count` para um valor de pelo menos 262144:
  115. >
  116. > ```bash
  117. > # Neste caso, defina para 262144:
  118. > $ sudo sysctl -w vm.max_map_count=262144
  119. > ```
  120. >
  121. > Essa mudança será resetada após a reinicialização do sistema. Para garantir que a alteração permaneça permanente, adicione ou atualize o valor de `vm.max_map_count` em **/etc/sysctl.conf**:
  122. >
  123. > ```bash
  124. > vm.max_map_count=262144
  125. > ```
  126. 2. Clone o repositório:
  127. ```bash
  128. $ git clone https://github.com/infiniflow/ragflow.git
  129. ```
  130. 3. Inicie o servidor usando as imagens Docker pré-compiladas:
  131. > [!CAUTION]
  132. > Todas as imagens Docker são construídas para plataformas x86. Atualmente, não oferecemos imagens Docker para ARM64.
  133. > Se você estiver usando uma plataforma ARM64, por favor, utilize [este guia](https://ragflow.io/docs/dev/build_docker_image) para construir uma imagem Docker compatível com o seu sistema.
  134. > O comando abaixo baixa a edição `v0.19.0-slim` da imagem Docker do RAGFlow. Consulte a tabela a seguir para descrições de diferentes edições do RAGFlow. Para baixar uma edição do RAGFlow diferente da `v0.19.0-slim`, atualize a variável `RAGFLOW_IMAGE` conforme necessário no **docker/.env** antes de usar `docker compose` para iniciar o servidor. Por exemplo: defina `RAGFLOW_IMAGE=infiniflow/ragflow:v0.19.0` para a edição completa `v0.19.0`.
  135. ```bash
  136. $ cd ragflow/docker
  137. # Use CPU for embedding and DeepDoc tasks:
  138. $ docker compose -f docker-compose.yml up -d
  139. # To use GPU to accelerate embedding and DeepDoc tasks:
  140. # docker compose -f docker-compose-gpu.yml up -d
  141. ```
  142. | Tag da imagem RAGFlow | Tamanho da imagem (GB) | Possui modelos de incorporação? | Estável? |
  143. | --------------------- | ---------------------- | ------------------------------- | ------------------------ |
  144. | v0.19.0 | ~9 | :heavy_check_mark: | Lançamento estável |
  145. | v0.19.0-slim | ~2 | ❌ | Lançamento estável |
  146. | nightly | ~9 | :heavy_check_mark: | _Instável_ build noturno |
  147. | nightly-slim | ~2 | ❌ | _Instável_ build noturno |
  148. 4. Verifique o status do servidor após tê-lo iniciado:
  149. ```bash
  150. $ docker logs -f ragflow-server
  151. ```
  152. _O seguinte resultado confirma o lançamento bem-sucedido do sistema:_
  153. ```bash
  154. ____ ___ ______ ______ __
  155. / __ \ / | / ____// ____// /____ _ __
  156. / /_/ // /| | / / __ / /_ / // __ \| | /| / /
  157. / _, _// ___ |/ /_/ // __/ / // /_/ /| |/ |/ /
  158. /_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
  159. * Rodando em todos os endereços (0.0.0.0)
  160. ```
  161. > Se você pular essa etapa de confirmação e acessar diretamente o RAGFlow, seu navegador pode exibir um erro `network anormal`, pois, nesse momento, seu RAGFlow pode não estar totalmente inicializado.
  162. 5. No seu navegador, insira o endereço IP do seu servidor e faça login no RAGFlow.
  163. > Com as configurações padrão, você só precisa digitar `http://IP_DO_SEU_MÁQUINA` (**sem** o número da porta), pois a porta HTTP padrão `80` pode ser omitida ao usar as configurações padrão.
  164. 6. Em [service_conf.yaml.template](./docker/service_conf.yaml.template), selecione a fábrica LLM desejada em `user_default_llm` e atualize o campo `API_KEY` com a chave de API correspondente.
  165. > Consulte [llm_api_key_setup](https://ragflow.io/docs/dev/llm_api_key_setup) para mais informações.
  166. _O show está no ar!_
  167. ## 🔧 Configurações
  168. Quando se trata de configurações do sistema, você precisará gerenciar os seguintes arquivos:
  169. - [.env](./docker/.env): Contém as configurações fundamentais para o sistema, como `SVR_HTTP_PORT`, `MYSQL_PASSWORD` e `MINIO_PASSWORD`.
  170. - [service_conf.yaml.template](./docker/service_conf.yaml.template): Configura os serviços de back-end. As variáveis de ambiente neste arquivo serão automaticamente preenchidas quando o contêiner Docker for iniciado. Quaisquer variáveis de ambiente definidas dentro do contêiner Docker estarão disponíveis para uso, permitindo personalizar o comportamento do serviço com base no ambiente de implantação.
  171. - [docker-compose.yml](./docker/docker-compose.yml): O sistema depende do [docker-compose.yml](./docker/docker-compose.yml) para iniciar.
  172. > O arquivo [./docker/README](./docker/README.md) fornece uma descrição detalhada das configurações do ambiente e dos serviços, que podem ser usadas como `${ENV_VARS}` no arquivo [service_conf.yaml.template](./docker/service_conf.yaml.template).
  173. Para atualizar a porta HTTP de serviço padrão (80), vá até [docker-compose.yml](./docker/docker-compose.yml) e altere `80:80` para `<SUA_PORTA_DE_SERVIÇO>:80`.
  174. Atualizações nas configurações acima exigem um reinício de todos os contêineres para que tenham efeito:
  175. > ```bash
  176. > $ docker compose -f docker-compose.yml up -d
  177. > ```
  178. ### Mudar o mecanismo de documentos de Elasticsearch para Infinity
  179. O RAGFlow usa o Elasticsearch por padrão para armazenar texto completo e vetores. Para mudar para o [Infinity](https://github.com/infiniflow/infinity/), siga estas etapas:
  180. 1. Pare todos os contêineres em execução:
  181. ```bash
  182. $ docker compose -f docker/docker-compose.yml down -v
  183. ```
  184. Note: `-v` irá deletar os volumes do contêiner, e os dados existentes serão apagados.
  185. 2. Defina `DOC_ENGINE` no **docker/.env** para `infinity`.
  186. 3. Inicie os contêineres:
  187. ```bash
  188. $ docker compose -f docker-compose.yml up -d
  189. ```
  190. > [!ATENÇÃO]
  191. > A mudança para o Infinity em uma máquina Linux/arm64 ainda não é oficialmente suportada.
  192. ## 🔧 Criar uma imagem Docker sem modelos de incorporação
  193. Esta imagem tem cerca de 2 GB de tamanho e depende de serviços externos de LLM e incorporação.
  194. ```bash
  195. git clone https://github.com/infiniflow/ragflow.git
  196. cd ragflow/
  197. docker build --platform linux/amd64 --build-arg LIGHTEN=1 -f Dockerfile -t infiniflow/ragflow:nightly-slim .
  198. ```
  199. ## 🔧 Criar uma imagem Docker incluindo modelos de incorporação
  200. Esta imagem tem cerca de 9 GB de tamanho. Como inclui modelos de incorporação, depende apenas de serviços externos de LLM.
  201. ```bash
  202. git clone https://github.com/infiniflow/ragflow.git
  203. cd ragflow/
  204. docker build --platform linux/amd64 -f Dockerfile -t infiniflow/ragflow:nightly .
  205. ```
  206. ## 🔨 Lançar o serviço a partir do código-fonte para desenvolvimento
  207. 1. Instale o `uv`, ou pule esta etapa se ele já estiver instalado:
  208. ```bash
  209. pipx install uv pre-commit
  210. ```
  211. 2. Clone o código-fonte e instale as dependências Python:
  212. ```bash
  213. git clone https://github.com/infiniflow/ragflow.git
  214. cd ragflow/
  215. uv sync --python 3.10 --all-extras # instala os módulos Python dependentes do RAGFlow
  216. uv run download_deps.py
  217. pre-commit install
  218. ```
  219. 3. Inicie os serviços dependentes (MinIO, Elasticsearch, Redis e MySQL) usando Docker Compose:
  220. ```bash
  221. docker compose -f docker/docker-compose-base.yml up -d
  222. ```
  223. Adicione a seguinte linha ao arquivo `/etc/hosts` para resolver todos os hosts especificados em **docker/.env** para `127.0.0.1`:
  224. ```
  225. 127.0.0.1 es01 infinity mysql minio redis sandbox-executor-manager
  226. ```
  227. 4. Se não conseguir acessar o HuggingFace, defina a variável de ambiente `HF_ENDPOINT` para usar um site espelho:
  228. ```bash
  229. export HF_ENDPOINT=https://hf-mirror.com
  230. ```
  231. 5. Se o seu sistema operacional não tiver jemalloc, instale-o da seguinte maneira:
  232. ```bash
  233. # ubuntu
  234. sudo apt-get install libjemalloc-dev
  235. # centos
  236. sudo yum instalar jemalloc
  237. ```
  238. 6. Lance o serviço de back-end:
  239. ```bash
  240. source .venv/bin/activate
  241. export PYTHONPATH=$(pwd)
  242. bash docker/launch_backend_service.sh
  243. ```
  244. 7. Instale as dependências do front-end:
  245. ```bash
  246. cd web
  247. npm install
  248. ```
  249. 8. Lance o serviço de front-end:
  250. ```bash
  251. npm run dev
  252. ```
  253. _O seguinte resultado confirma o lançamento bem-sucedido do sistema:_
  254. ![](https://github.com/user-attachments/assets/0daf462c-a24d-4496-a66f-92533534e187)
  255. 9. Pare os serviços de front-end e back-end do RAGFlow após a conclusão do desenvolvimento:
  256. ```bash
  257. pkill -f "ragflow_server.py|task_executor.py"
  258. ```
  259. ## 📚 Documentação
  260. - [Quickstart](https://ragflow.io/docs/dev/)
  261. - [Configuration](https://ragflow.io/docs/dev/configurations)
  262. - [Release notes](https://ragflow.io/docs/dev/release_notes)
  263. - [User guides](https://ragflow.io/docs/dev/category/guides)
  264. - [Developer guides](https://ragflow.io/docs/dev/category/developers)
  265. - [References](https://ragflow.io/docs/dev/category/references)
  266. - [FAQs](https://ragflow.io/docs/dev/faq)
  267. ## 📜 Roadmap
  268. Veja o [RAGFlow Roadmap 2025](https://github.com/infiniflow/ragflow/issues/4214)
  269. ## 🏄 Comunidade
  270. - [Discord](https://discord.gg/NjYzJD3GM3)
  271. - [Twitter](https://twitter.com/infiniflowai)
  272. - [GitHub Discussions](https://github.com/orgs/infiniflow/discussions)
  273. ## 🙌 Contribuindo
  274. O RAGFlow prospera por meio da colaboração de código aberto. Com esse espírito, abraçamos contribuições diversas da comunidade.
  275. Se você deseja fazer parte, primeiro revise nossas [Diretrizes de Contribuição](https://ragflow.io/docs/dev/contributing).