Ucas-HaoranWei/GOT-OCR2.0

Official code implementation of General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model

Python

Issues

latex output instead of mathpix
#279 opened 13 days ago by devops724
0
可以输出文本对应的位置标定吗？
#278 opened 13 days ago by oushu1zhangxiangxuan1
0
群二维码过期了
#277 opened 13 days ago by oushu1zhangxiangxuan1
0
请问latex这块儿数据集用的是哪个呢？想单独针对这个场景ft优化下
#274 opened 13 days ago by xsank
1
请问对于上下行文字存在粘连的如何调整才能进行识别呢
#276 opened 13 days ago by Giserlei123
1
OpenVINO for GOT
#275 opened 14 days ago by can-gaa-hou
1
请问能否将pdf导入到ocr进行扫描呢？
#273 opened 17 days ago by aqiuX17
3
第一行文字会被识别为标题
#242 opened 2 months ago by jiandandema
3
How to Train a GOT OCR 2.0 Model on a YOLO Dataset?
#246 opened 2 months ago by chelsea1212
1
[Tokenizer] Fine Tuning on handwritten text for a new langage
#272 opened 19 days ago by SkanderBS2024
4
Open source GGUF and Llama.cpp inference
#266 opened a month ago by MosRat
2
Docker and web api to using it
#271 opened 20 days ago by gamersalpha
0
pdf demo
#260 opened 2 months ago by Airseai6
1
Image cropping inquiry
#270 opened a month ago by cryingjin
0
方向类的可以识别不
#269 opened a month ago by monkeycc
0
七群也需要成员邀请，请问如何加入？
#267 opened a month ago by lihui52
3
为什么box先归一化再乘上1000
#268 opened a month ago by GuoQuanhao
1
能否多卡运行
#265 opened 2 months ago by ye7love7
0
是否有微调的演示小数据集
#264 opened 2 months ago by monkeycc
0
Bounding boxes of the text detected and layout detection
#263 opened 2 months ago by ep0p
0
怎么获取每个字符的坐标和准确率？
#262 opened 2 months ago by nissansz
0
https://huggingface.co/spaces/stepfun-ai/GOT_official_online_demo 好像没法识别韩文，有支持其它语种的模型吗?
#261 opened 2 months ago by nissansz
0
plain multi-crop OCR这种模式如何配置
#259 opened 2 months ago by fastdebuger
0
基于GOT-OCR2.0做视觉信息抽取
#254 opened 2 months ago by ignore1999
1
参数位置是否传反了
#258 opened 2 months ago by qazwsx74269
1
Recognize matrices as chemical expressions
#249 opened 2 months ago by junjiemao
2
Stage-1 batchsize>4 CUDA out of memory
#240 opened 3 months ago by Niujunbo2002
7
why did not compare with generalist models, including GPT-4o, Gemini-1.5, Claude-3.5- Sonnet, Qwen2-VL-72B, and InternVL2
#257 opened 2 months ago by guangdongliang
2
Need suggestion for finetuning this model for DOC-VQA task
#256 opened 2 months ago by shubhamReal
1
使用模型train失败
#255 opened 2 months ago by lifejwang11
0
七群wx二维码失效了，能再发一个吗
#230 opened 3 months ago by micrazy
14
Is there a step-by-step instruction for training the model for the Arabic language?
#253 opened 2 months ago by AboulfazlSeilsepour
0
是否可以自定义数字参数
#252 opened 2 months ago by monkeycc
0
如何优化速度
#251 opened 2 months ago by monkeycc
0
如何只输出结果
#250 opened 2 months ago by monkeycc
0
按照官网文档执行这条命令报错：pip install -e .
#241 opened 3 months ago by freezehe
2
GOT-OCR2_0 is supported in PaddleMIX by Paddle Team
#247 opened 2 months ago by luyao-cv
1
微调后模型推理自定义数据集方式
#232 opened 2 months ago by katie312
0
Val 資料集
#245 opened 2 months ago by claineycku
0
请问可以限制模型预测时的显存上限吗？
#244 opened 2 months ago by 4majesty
0
How to training again GOT-OCR2.0 in Stage 2, Stage 3
#238 opened 3 months ago by C0NGTRI123
2
ValueError: Please set --model <model_id_or_path>`, model: None
#239 opened 3 months ago by rahulverma7788
6
model is taking long inference time after training, can i reduce it? have you any idea about it?
#243 opened 2 months ago by rahulverma7788
2
单页PDF解析需要将近20秒，有没有推理加速的方案？比如vllm或者lmdeploy
#236 opened 3 months ago by FanWan
2
图片上没有文字，需要输出 ""，但是现在会输出一些错误的信息
#235 opened 3 months ago by xiaolongc929
1
Pre-training Vision encoder
#229 opened 3 months ago by cryingjin
1
Asking about dataset preparing
#237 opened 3 months ago by tadkt
0
insights on noise in got dataset and fine-tuning issues
#234 opened 3 months ago by ep0p
0
Format类型的输出到底是一种什么格式，该如何转换成Latex
#233 opened 3 months ago by Elton-Yang
1
视觉的编码模块显存消耗过大的问题？
#231 opened 3 months ago by QiusongYang
2