Rječnik za računalnu provjeru pravopisa skup je pravila koja omogućuju računalnu provjeru pravopisa hrvatskoga jezika alatom Hunspell. Rječnik čine dvije datoteke: popis riječi nalazi se u hr_HR.dic, a pravila za stvaranje oblika riječi nalazi se u datoteci hr_HR.aff.
Sve ostalo je opis projekta, dokumentacija ili alat(i) za njegovo održavanje i ne koristi se za provjeru pravopisa.
Rječnik nije Hunspell i nije njegov dio. Pravila postoje neovisno o njemu, ali i drugim aplikacijama koja za računalnu provjeru pravopisa koriste Hunspell i ova pravila, zato različite aplikacije mogu imati različite inačice istoga rječnika ili pak potpuno različite rječnike: različiti izvori, popisi rječi i pravila za razradu oblika, a bez ikakve međusobne koordinacije. Za ažuriranje rječnika pojedinih aplikacija zaduženi su isključivo održavatelji dodataka pojedine aplikacije ili njezini razvijatelji. Nasreću i nažalost, u slučaju hrvatskoga jezika riječ je o različitim inačicama istoga rječnika.
Izvornu inačicu napravio je Denis Lacković 2003. g.; dostupna je na cvs.linux.hr/spell. Dodavati riječi počeo sam 2014. g., ali za ispravljanje, dopunjavanje i unaprjeđenje – onako kako to izgleda danas – zaslužan je Mirko Kos (2016.) Većim brojem riječi doprinio je i Boris Jurić (2017.) 1
hr_HR.dicsadrži popis riječihr_HR.affsadrži pravila za razradu oblika riječi iz datotekehr_HR.dicREADME_hr_HR.txtsadrži informacije o licenciji2izmjene-u-rječniku.mdprate izmjene u datotekamahr_HR.dicihr_HR.affREADME.mdupravo čitate- mapa
tools/dplsadrži skriptu kojom sam pokušao automatski izraditi pravila na nekoliko primjera. Daleko od upotrebljivoga. Ako će se nešto po tom pitanju i događati, događat će se u mapitoolsisključujućidpl - skripta
tools/dictman.phpmože generirati sve oblike svih riječi iz rječnika, ali em jePHPem rezultat nije detaljno testiran.3 Možda bi se na ovome moglo dalje graditi, kad bi se napisalo kako treba - datoteka
tools/wordlistrezultat je skriptedictman.php tools/rpm/sadrži skriptu za generiranjerpminstalacijskoga paketa (doprinositelj: asmolcic)
Nažalost, ne postoji automatiziran način dodavanja riječi. S jedne strane zato što nove riječi nema u rječniku pa nema reference za provjeru, a s druge strane zbog velikog broja klasa, kombinacija klasa i broja oblika u klasama, pa automatizirano dodavanje ne može biti precizno i potrebna je ručna provjera.
Nove riječi primam na kruno.se na domeni gmx com, ali bilo bi dobro kada bi naslov takve poruke bio "Rječnik hr_HR: dodavanje riječi" radi filtriranja i naknadnoga pretraživanja.
Onaj tko ima račun na GitHubu i želi dodati pridjev "riječni", može
- napraviti vlastitu kopiju repozitorija
- otvoriti
hr_HR.dici potražiti riječi koje završavaju na -čni - izvaditi broj iza znaka
/, u ovom slučaju353i347 - u
hr_HR.affpotražiti# 353i# 347te izvući dvoslovne klase. U prvom slučajuUM, u drugomeUOiUE - pronaći te klase u nastavku
hr_HR.affi vidjeti što od toga bolje odgovara - dodati riječ u
hr_HR.dics klasom (brojčanom), sortirati prema abecedi i promijentiti broj na početku te datoteke da odgovara ukupnom broju riječi - napraviti Pull Request
Svjestan sam da bi ove upute mogle više pitanja otvoriti negoli zatvorit, pa ću rado odgovoriti na mejl. Od pomoći može biti i sljedeće:
Postoji i nešto što se zove ProofingToolGui iliti PTG, izgleda prilično dobro, ali nisam radio s time.
Footnotes
-
Ako sam koga izostavio ili želi kakvu izmjenu, može me kontaktirati na
kruno.sena domenigmx com. ↩ -
Prilikom preuzimanja rječnika, bezobrazno sam promijenio sadržaj datoteke
README_hr_HR.txt. Sada se u ovoj datoteci nalazi njezin izvorni sadržaj. ↩ -
U tom kontekstu spominju se
unmunch,unmunch.shtewordform. Navodno, ovo posljednje radi s Hunspellom, ali za pojedinu riječ. Možda bi se mogla napraviti skripta koja bi za svaku riječ u rječniku pozivalawordform, ali u danom trenutku bilo mi je previše za prožvakati (github.com/hunspell/issues/404, hunspell/src/tools/wordforms). ↩