Ver código fonte

enable 3 char words to finegrind tokenize (#2210)

### What problem does this PR solve?


### Type of change


- [x] Performance Improvement
tags/v0.11.0
Kevin Hu 1 ano atrás
pai
commit
6d232f1bdb
Nenhuma conta vinculada ao e-mail do autor do commit
1 arquivos alterados com 1 adições e 1 exclusões
  1. 1
    1
      rag/nlp/query.py

+ 1
- 1
rag/nlp/query.py Ver arquivo

@@ -83,7 +83,7 @@ class EsQueryer:
), tks

def need_fine_grained_tokenize(tk):
if len(tk) < 4:
if len(tk) < 3:
return False
if re.match(r"[0-9a-z\.\+#_\*-]+$", tk):
return False

Carregando…
Cancelar
Salvar