62 Incheckningar (Hacked_v0.17.2)

Upphovsman SHA1 Meddelande Datum
  yihong 4326873af6
refactor: no need to inherit in python3 clean the code (#5659) 8 månader sedan
  非法操作 ca04ae9540
Minor: improve doc and rm unused file (#5634) 8 månader sedan
  Zhichang Yu c813c1ff4c
Made task_executor async to speedup parsing (#5530) 8 månader sedan
  yihong 8a2542157f
Fix: possible memory leaks close #5277 (#5500) 8 månader sedan
  yihong 37aacb3960
Refa: drop useless fasttext (#5470) 8 månader sedan
  Zhichang Yu db42d0e0ae
Optimize ocr (#5297) 8 månader sedan
  Zhichang Yu 0151d42156
Reuse loaded modules if possible (#5231) 8 månader sedan
  Zhichang Yu c326f14fed
Optimized Recognizer.sort_X_firstly and Recognizer.sort_Y_firstly (#5182) 8 månader sedan
  Kevin Hu b08bb56f6c
Display thinking for deepseek r1 (#4904) 8 månader sedan
  Mathias Panzenböck 6b389e01b5
Remove use of eval() from operators.py (#4888) 8 månader sedan
  Zhichang Yu 3411d0a2ce
Added cuda_is_available (#4725) 8 månader sedan
  Zhichang Yu e1526846da
Fixed GPU detection on CPU only environment (#4711) 8 månader sedan
  Kevin Hu 1bff6b7333
Fix t_ocr.py for PNG image. (#4625) 9 månader sedan
  Zhichang Yu 4230402fbb
deepdoc use GPU if possible (#4618) 9 månader sedan
  Mathias Panzenböck 1a367664f1
Remove usage of eval() from postprocess.py (#4571) 9 månader sedan
  Jin Hai 3894de895b
Update comments (#4569) 9 månader sedan
  Mathias Panzenböck 75e1981e13
Remove use of eval() from recognizer.py (#4480) 9 månader sedan
  Mathias Panzenböck 4f9f9405b8
Remove use of eval() from ocr.py (#4481) 9 månader sedan
  Kevin Hu c852a6dfbf
Accelerate titles' embeddings. (#4492) 9 månader sedan
  Zhi-Qiang You b7ce4e7e62
fix:t_recognizer TypeError: 'super' object is not callable (#4404) 9 månader sedan
  Kevin Hu 2e40c2a6f6
Fix t_recognizer issue. (#4387) 9 månader sedan
  Kevin Hu 983ec0666c
Fix param error. (#4355) 9 månader sedan
  Kevin Hu 59a78408be
Fix t_recognizer.py after model updating. (#4330) 10 månader sedan
  Kevin Hu 2cbe064080
Add Llama3.3 (#4174) 10 månader sedan
  Kevin Hu ce1e855328
Upgrades Document Layout Analysis model. (#4054) 10 månader sedan
  Zhichang Yu 1254ecf445
Added static check at PR CI (#3921) 10 månader sedan
  Zhichang Yu 0d68a6cd1b
Fix errors detected by Ruff (#3918) 10 månader sedan
  Zhichang Yu bc701d7b4c
Edit chunk shall update instead of insert it (#3709) 11 månader sedan
  Zhichang Yu 2249d5d413
Always open text file for write with UTF-8 (#3688) 11 månader sedan
  Zhichang Yu 30f6421760
Use consistent log file names, introduced initLogger (#3403) 11 månader sedan
  Zhichang Yu a2a5631da4
Rework logging (#3358) 11 månader sedan
  Ikko Eltociear Ashimine c552a02e7f
chore: update operators.py (#2724) 1 år sedan
  Jin Hai 6b3a40be5c
Format file format from Windows/dos to Unix (#1949) 1 år sedan
  H c943517932
Fix pdfparser error (#1707) 1 år sedan
  Kevin Hu 99adeabc85
remove dependency (#1536) 1 år sedan
  Jin Hai cdea1d0a85
Update readme and add license (#1018) 1 år sedan
  KevinHuSh 46454362d7
fix raptor bugs (#928) 1 år sedan
  dashi6174 fe18627ebc
Fix some syntax errors, re not import (#904) 1 år sedan
  KevinHuSh cab274f560
remove PyMuPDF (#618) 1 år sedan
  KevinHuSh 8c07992b6c
refine code (#595) 1 år sedan
  KevinHuSh 9d60a84958
refactor code (#583) 1 år sedan
  KevinHuSh 453c29170f
make sure the models will not be load twice (#422) 1 år sedan
  KevinHuSh 38e5737067
add base url for OpenAI (#166) 1 år sedan
  KevinHuSh a5384446e3
let's load model from local (#163) 1 år sedan
  KevinHuSh fd7fcb5baf
apply pep8 formalize (#155) 1 år sedan
  KevinHuSh 979b3a5b4b
support snapshot download from local (#153) 1 år sedan
  KevinHuSh da21320b88
fix plainPdf bugs (#152) 1 år sedan
  KevinHuSh 71fe314955
refine page ranges (#147) 1 år sedan
  KevinHuSh 6c6b144de2
refine manual parser (#140) 1 år sedan
  KevinHuSh 9da671b951
refine manul parser (#131) 1 år sedan