Quellcode durchsuchen

enable 3 char words to finegrind tokenize (#2210)

### What problem does this PR solve?


### Type of change


- [x] Performance Improvement
tags/v0.11.0
Kevin Hu vor 1 Jahr
Ursprung
Commit
6d232f1bdb
Es ist kein Account mit der E-Mail-Adresse des Committers verbunden
1 geänderte Dateien mit 1 neuen und 1 gelöschten Zeilen
  1. 1
    1
      rag/nlp/query.py

+ 1
- 1
rag/nlp/query.py Datei anzeigen

@@ -83,7 +83,7 @@ class EsQueryer:
), tks

def need_fine_grained_tokenize(tk):
if len(tk) < 4:
if len(tk) < 3:
return False
if re.match(r"[0-9a-z\.\+#_\*-]+$", tk):
return False

Laden…
Abbrechen
Speichern