Codestin Search App

This repository is an unofficial attempt to recreate the core ideas of DeepSeek-OCR.

Training Loss (W&B Logs)

Evaluation

Training

To train the model, simply run:

python train.py

Modify the configuration values directly inside train.py.
(CLI arguments will be added soon.)

Text Generation

You can generate text using:

generate_text(
    deep_encoder   = deep_encoder,
    gpt2           = deep_decoder,
    projector      = deep_encoder.projector,
    tokenizer      = tokenizer,
    image          = next(iter(val_loader))['images'][0],
    prompt         = "<image>\n",
    max_new_tokens = max_new_tokens,
    temperature    = 1.5,
    top_k          = 50,
    device         = device
)

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
assets		assets
gpt2/774M		gpt2/774M
notebooks		notebooks
.gitignore		.gitignore
build.py		build.py
dataloader.py		dataloader.py
deepencoder.py		deepencoder.py
helper.py		helper.py
inference.ipynb		inference.ipynb
knowledge_transfer.py		knowledge_transfer.py
model.py		model.py
pipeline.py		pipeline.py
readme.md		readme.md
requirements.txt		requirements.txt
the-verdict.txt		the-verdict.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Training Loss (W&B Logs)

Evaluation

Training

Text Generation

About

Uh oh!

Releases

Packages

Languages

Mafaz03/OCR-Model

Folders and files

Latest commit

History

Repository files navigation

Training Loss (W&B Logs)

Evaluation

Training

Text Generation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages