69 Commits (Hacked_v0.19.0)

Autor SHA1 Mensaje Fecha
  Kevin Hu ed5f81b02e
Fix: abnormal cell mergeing. (#6991) hace 6 meses
  Kevin Hu 3bb1e012e6
Fix: assistant deleteion issue. (#6906) hace 6 meses
  Kevin Hu 2caf15b24c
Refa: trival. (#6802) hace 7 meses
  Stephen Hu b0b4b7ba33
Feat: Improve Recognizer.py performance (#6185) hace 7 meses
  Kevin Hu 3a99c2b5f4
Refa: PARALLEL_DEVICES is a static parameter. (#6168) hace 7 meses
  Debug Doctor 3e19044dee
Feat: add OCR's muti-gpus and parallel processing support (#5972) hace 7 meses
  Yongteng Lei 4ff609b6a8
Fix: optimize OCR garbage identification to reduce unnecessary filtering (#6027) hace 7 meses
  yihong 4326873af6
refactor: no need to inherit in python3 clean the code (#5659) hace 8 meses
  非法操作 ca04ae9540
Minor: improve doc and rm unused file (#5634) hace 8 meses
  Zhichang Yu c813c1ff4c
Made task_executor async to speedup parsing (#5530) hace 8 meses
  yihong 8a2542157f
Fix: possible memory leaks close #5277 (#5500) hace 8 meses
  yihong 37aacb3960
Refa: drop useless fasttext (#5470) hace 8 meses
  Zhichang Yu db42d0e0ae
Optimize ocr (#5297) hace 8 meses
  Zhichang Yu 0151d42156
Reuse loaded modules if possible (#5231) hace 8 meses
  Zhichang Yu c326f14fed
Optimized Recognizer.sort_X_firstly and Recognizer.sort_Y_firstly (#5182) hace 8 meses
  Kevin Hu b08bb56f6c
Display thinking for deepseek r1 (#4904) hace 8 meses
  Mathias Panzenböck 6b389e01b5
Remove use of eval() from operators.py (#4888) hace 8 meses
  Zhichang Yu 3411d0a2ce
Added cuda_is_available (#4725) hace 9 meses
  Zhichang Yu e1526846da
Fixed GPU detection on CPU only environment (#4711) hace 9 meses
  Kevin Hu 1bff6b7333
Fix t_ocr.py for PNG image. (#4625) hace 9 meses
  Zhichang Yu 4230402fbb
deepdoc use GPU if possible (#4618) hace 9 meses
  Mathias Panzenböck 1a367664f1
Remove usage of eval() from postprocess.py (#4571) hace 9 meses
  Jin Hai 3894de895b
Update comments (#4569) hace 9 meses
  Mathias Panzenböck 75e1981e13
Remove use of eval() from recognizer.py (#4480) hace 9 meses
  Mathias Panzenböck 4f9f9405b8
Remove use of eval() from ocr.py (#4481) hace 9 meses
  Kevin Hu c852a6dfbf
Accelerate titles' embeddings. (#4492) hace 9 meses
  Zhi-Qiang You b7ce4e7e62
fix:t_recognizer TypeError: 'super' object is not callable (#4404) hace 9 meses
  Kevin Hu 2e40c2a6f6
Fix t_recognizer issue. (#4387) hace 9 meses
  Kevin Hu 983ec0666c
Fix param error. (#4355) hace 10 meses
  Kevin Hu 59a78408be
Fix t_recognizer.py after model updating. (#4330) hace 10 meses
  Kevin Hu 2cbe064080
Add Llama3.3 (#4174) hace 10 meses
  Kevin Hu ce1e855328
Upgrades Document Layout Analysis model. (#4054) hace 10 meses
  Zhichang Yu 1254ecf445
Added static check at PR CI (#3921) hace 10 meses
  Zhichang Yu 0d68a6cd1b
Fix errors detected by Ruff (#3918) hace 10 meses
  Zhichang Yu bc701d7b4c
Edit chunk shall update instead of insert it (#3709) hace 11 meses
  Zhichang Yu 2249d5d413
Always open text file for write with UTF-8 (#3688) hace 11 meses
  Zhichang Yu 30f6421760
Use consistent log file names, introduced initLogger (#3403) hace 11 meses
  Zhichang Yu a2a5631da4
Rework logging (#3358) hace 11 meses
  Ikko Eltociear Ashimine c552a02e7f
chore: update operators.py (#2724) hace 1 año
  Jin Hai 6b3a40be5c
Format file format from Windows/dos to Unix (#1949) hace 1 año
  H c943517932
Fix pdfparser error (#1707) hace 1 año
  Kevin Hu 99adeabc85
remove dependency (#1536) hace 1 año
  Jin Hai cdea1d0a85
Update readme and add license (#1018) hace 1 año
  KevinHuSh 46454362d7
fix raptor bugs (#928) hace 1 año
  dashi6174 fe18627ebc
Fix some syntax errors, re not import (#904) hace 1 año
  KevinHuSh cab274f560
remove PyMuPDF (#618) hace 1 año
  KevinHuSh 8c07992b6c
refine code (#595) hace 1 año
  KevinHuSh 9d60a84958
refactor code (#583) hace 1 año
  KevinHuSh 453c29170f
make sure the models will not be load twice (#422) hace 1 año
  KevinHuSh 38e5737067
add base url for OpenAI (#166) hace 1 año