Từ điển tiếng Việt dành cho máy đọc sách Kindle, Kobo, Pocketbook, Boox v.v. cũng như trên điện thoại và máy tính, như StarDict, Lingvo, Yomichan/Yomitan, v.v.
Mã nguồn cho từ điển dành cho máy đọc sách Kindle. Để sử dụng từ điển, download tại đây http://catusf.github.io/.
- Setup môi trường
make setup
- Test môi trường
make test
- Build mẫu vài từ điển
make sample
- Build tất cả từ điển
make all
- Khi tạo khởi động CodeSpace để dev, thực hiện lệnh sau để đồng bộ SSH Private Key từ CodeSpace secret vào SSH Agent
eval $(ssh-agent -s)
ssh-add <(echo "$SSH_PRIVATE_TUDIEN_CODESPACE")
- Sync submodule về bằng lệnh
git submodule update --init --recursive
Khi dùng Codespaces để develop, ban đầu hãy chạy 2 lệnh sau để cài đặt tool:
./bin/install_utilities.sh
./bin/install_wine32.sh
Sau đó test lại bằng
make sample
Do tôi thấy cần:
- Có các từ điển có chất lượng để giúp việc học hỏi của bản thân và mọi người
- Lập trình viên bất kỳ có thể dùng dữ liệu đầu vào ở đây để tạo output khác
- Có thể dễ dàng bổ sung từ điển - chỉ cần tạo 1 file văn bản phân cách bằng dấu \t (.tab) và 1 file mô tả .dfo
Các từ điển cần:
- Chính xác và dễ tra cứu
- Dùng được trên nhiều thiết bị (Kindle, Kobo, Onyx, mobile và PC apps)
- Cài Python 3.x
- Cài các package cần thiết
pip install -r requirements.txt - Tạo mới hay sửa file định nghĩa từ điển (như
./dict/TudienCuatoi.tab) - Tạo một file mô tả từ điển (như
./dict/TudienCuatoi.dfo) - Chạy dòng lệnh
python ./bin/convert_all.pyđể tạo từ điển. Kết quả sẽ có trong thư mụcoutput
Việc còn lại là copy file .mobi vừa được tạo ra bằng dây cáp USB vào thư mục documents trên Kindle để bắt đầu sử dụng.
graph LR;
ReadMetadata(File mô tả <.toml>) --> GenTab(File định nghĩa <.tab>);
ReadMetadata(File mô tả <.toml>) --> GenTxt(File định nghĩa Pleco <.txt>);
GenTab -- tool tab2opf --> HTML_File(File <.opf/html>) -- mobigen --> KindleDict(Từ điển Kindle <.mobi>);
GenTab -- tool convert2mdict --> HTML_TXT_File(File <.txt/html>) -- mdict_utils --> Mdict(Từ điển Mdict <.mdx>);
GenTab -- chạy PyGlossary --> EpubDict(Từ điển <.epub>);
GenTab -- chạy PyGlossary --> KoboDict(Từ điển Kobo <.kobo.zip>);
GenTab -- chạy PyGlossary --> StarDict(Từ điển StarDict <.ifo>);
GenTab -- chạy PyGlossary --> dictd(Từ điển dictd <.index>);
GenTab -- chạy PyGlossary --> Yomitan(Từ điển dictd <.zip>);
GenTab -- chạy DSL Tools --> DSLDict(Từ điển Lingvo <.dsl.dz>);
GenTxt -- Dùng app Pleco import --> Pleco_PQB(Từ điển Pleco <.pqb>);
Xem danh sách đầy đủ ở đây catusf.