Thanks to visit codestin.com
Credit goes to github.com

Skip to content

ebolblga/Yo

Repository files navigation

[RU] Нужна ли буква «ё» русскому языку?

ru en DeepWiki

Краткий ответ - да.

Введение

Чтобы ответить на этот вопрос, для начала откроем правила русской орфографии и прочитаем:

Употребление буквы ё может быть последовательным и выборочным.

Последовательное употребление буквы ё обязательно в следующих разновидностях печатных текстов:

  • в текстах с последовательно поставленными знаками ударения;

  • в книгах, адресованных детям младшего возраста;

  • в учебных текстах для школьников младших классов и иностранцев, изучающих русский язык.

Примечание 1.

Последовательное употребление ё принято для иллюстративной части настоящих правил.

Примечание 2.

По желанию автора или редактора любая книга может быть напечатана последовательно с буквой ё.

Примечание 3.

В словарях слова с буквой ё размещаются в общем алфавите слов с буквой е, напр.: еле, елейный, ёлка, еловый, елозить, ёлочка, ёлочный, ель; веселеть, веселить(ся), весёлость, весёлый, веселье.

В обычных печатных текстах буква ё употребляется выборочно. Рекомендуется употреблять её в следующих случаях.

  1. Для предупреждения неправильного опознания слова, напр.: всё, нёбо, лётом, совершённый (в отличие соответственно от слов все, небо, летом, совершенный), в том числе для указания на место ударения в слове, напр.: вёдро, узнаём (в отличие от ведро, узнаем).

  2. Для указания правильного произношения слова — либо редкого, недостаточно хорошо известного, либо имеющего распространенное неправильное произношение, напр.: гёзы, сёрфинг, флёр, твёрже, щёлочка, в том числе для указания правильного ударения, напр.: побасёнка, приведённый, унесённый, осуждённый, новорождённый, филёр.

  3. В собственных именах — фамилиях, географических названиях, напр.: Конёнков, Неёлова, Катрин Денёв, Шрёдингер, Дежнёв, Кошелёв, Чебышёв, Вёшенская, Олёкма.

Исследование

Омографы — это слова, которые пишутся одинаково, но произносятся и/или имеют разные значения в зависимости от ударения. В русском языке омографы часто возникают из-за факультативного написания буквы «ё».

Источник: Омографы -Википедия.

В русском языке существуют омографы, различающиеся только наличием или отсутствием буквы «ё». Это может приводить к изменению смысла слова. В таких случаях буква «ё» играет роль диакритического знака, указывая на ударение и, следовательно, на различие в значении слова.

Целью дальнейшего исследования было выявление возможных омографов с буквой «ё», где после замены буквы на «е», будь то умысленно или же случайно, смысл слова, а то и всего предложения, менялся.

Важно: омографы и омонимы - разные вещи.

Омо́нимы — одинаковые по написанию и звучанию, но разные по значению слова и другие единицы языка.

Источник: Омонимы -Википедия.

Алгоритм

В предыдущей итерации проекта поступило предложение отсортировать итоговую таблицу по популярности слов. Для того, чтобы это было возможно для алгоритма поиска пар была использованна база данных, включающая в себя частоту возникновения слов: Baksalyar/mc.hertzbeat.ru-Frequency-Dictionaries - 480092 слова.

Далее формировался список слов, которые встречались как с буквой «ё», так и с буквой «е» и сортировался по сумме частот. Это дало таблицу с 4929 уникальными парами.

К сожалению, таблица содержала огромное количество пар, где слово с буквой «е» являлось попросту опечаткой.

Теперь требовалось отфильтровать эту таблицу так, чтобы остались лишь строки, где оба слова существуют. Для этого идеально подошёл список русских лемм и их производных форм от Андрея Усачева, который в свою очередь использовал материалы из морфологического словаря А. А. Зализняка - 86839 лемм и 1558781 производных форм слов.

После фильтрации остался список из всего 198 пар слов, первые 10 пар представлены ниже, полная же версия находится в /output/result.md.

Индекс Слово с 'ё' Леммы и производные формы Слово с 'е' Леммы и производные формы Комбинированная частота
1 чём что: чего́, че́м, чему́, что́, чём чем чем: че́м / что: чего́, че́м, чему́, что́, чём 48094
2 лёт лёт: ле́ту, лёт, лёта, лётам, лётами, лётах, лёте, лётов, лётом, лёту, лёты лет лета: ле́т, ле́та, ле́там, ле́тами, ле́тах / лето: ле́т, ле́та, ле́там, ле́тами, ле́тах, ле́те, ле́то, ле́том, ле́ту 40662
3 всём весь: ве́сь, все́, всего́, все́й, все́м, все́ми, всему́, все́х, все́ю, всю́, вся́, всём всем весь: ве́сь, все́, всего́, все́й, все́м, все́ми, всему́, все́х, все́ю, всю́, вся́, всём 11847
4 своё свой: сва́я, сво́го, сво́е, своего́, свое́й, своему́, свое́ю, свои́, свои́м, свои́ми, свои́х, сво́й, сво́м, сво́му, сво́ю, своя́, своё, своём, сву́ю, свы́е, свы́м, свы́ми, свы́х свое свой: сва́я, сво́го, сво́е, своего́, свое́й, своему́, свое́ю, свои́, свои́м, свои́ми, свои́х, сво́й, сво́м, сво́му, сво́ю, своя́, своё, своём, сву́ю, свы́е, свы́м, свы́ми, свы́х 9592
5 нём он: его́, е́й, ему́, е́ю, её, и́м, и́ми, и́х, него́, не́й, нему́, не́ю, неё, ни́м, ни́ми, ни́х, нём, о́н, она́, они́, оно́ нем немой: не́м, нема́, нема́я, неме́е, неме́й, немо́, немо́го, немо́е, немо́й, немо́м, немо́му, немо́ю, нему́ю, немы́, немы́е, немы́м, немы́ми, немы́х, понеме́е, понеме́й 9170
6 объём объём: объём, объёма, объёмам, объёмами, объёмах, объёме, объёмов, объёмом, объёму, объёмы объем объесть: объе́вшая, объе́вшего, объе́вшее, объе́вшей, объе́вшем, объе́вшему, объе́вшею, объе́вшие, объе́вший, объе́вшим, объе́вшими, объе́вших, объе́вшую, объе́ден, объе́дена, объе́денная, объе́денного, объе́денное, объе́денной, объе́денном, объе́денному, объе́денною, объе́денную, объе́денные, объе́денный, объе́денным, объе́денными, объе́денных, объе́дено, объе́дены, объеди́м, объеди́те, объедя́т, объе́л, объе́ла, объе́ли, объе́ло, объе́м, объе́ст, объе́сть, объе́шь, объе́шьте 6933
7 звёзды звезда: звезда́, звезде́, звездо́й, звездо́ю, звезду́, звезды́, звёзд, звёздам, звёздами, звёздах, звёзды звезды звезда: звезда́, звезде́, звездо́й, звездо́ю, звезду́, звезды́, звёзд, звёздам, звёздами, звёздах, звёзды 3133
8 днём день: де́нь, дне́, дне́й, дни́, дню́, дня́, дня́м, дня́ми, дня́х, днём днем днем: днем 2343
9 полёт полёт: полёт, полёта, полётам, полётами, полётах, полёте, полётов, полётом, полёту, полёты полет полоть: по́лем, по́лемся, по́лет, по́лете, по́летесь, по́лется, по́лешь, по́лешься, поли́, поли́сь, поли́те, поли́тесь, поло́вшая, поло́вшего, поло́вшее, поло́вшей, поло́вшем, поло́вшему, поло́вшею, поло́вшие, поло́вший, поло́вшим, поло́вшими, поло́вших, поло́вшую, поло́л, поло́ла, поло́лась, поло́ли, поло́лись, поло́ло, поло́лось, поло́лся, по́лот, по́лота, по́лотая, полоте́й, по́лоти, по́лото, по́лотого, по́лотое, по́лотой, по́лотом, по́лотому, по́лотою, по́лотую, по́лоты, по́лотые, по́лотый, по́лотым, по́лотыми, по́лотых, по́лоть, по́лотью, полотя́м, полотя́ми, полотя́х, по́лю, полю́сь, по́лют, по́лются, по́лющая, по́лющаяся, по́лющего, по́лющегося, по́лющее, по́лющееся, по́лющей, по́лющейся, по́лющем, по́лющемся, по́лющему, по́лющемуся, по́лющею, по́лющеюся, по́лющие, по́лющиеся, по́лющий, по́лющийся, по́лющим, по́лющими, по́лющимися, по́лющимся, по́лющих, по́лющихся, по́лющую, по́лющуюся, по́ля 2187
10 счёта счёт: счета́, сче́там, сче́тами, сче́тах, сче́тов, сче́ты, счёт, счёта, счёте, счётом, счёту счета счёт: счета́, сче́там, сче́тами, сче́тах, сче́тов, сче́ты, счёт, счёта, счёте, счётом, счёту 1676

Стоит отметить, что список можно отфильтровать дальше: убрать слова с единой леммой, то есть опечатка лишь меняет производную форму слова.

Вывод

При свободном использовании буквы «ё» есть небольшая вероятность изменить значение предложения, поэтому изменения правил орфографии в 1956 году, допускающие добровольное использование данной буквы, являются объективно неправильными.

Да, они похожи в написании, но на этом их сходства заканчиваются. Фонетически у них разное звучание, и человек может не правильно трактовать смысл вашего текста.

Примеры предложений

Можно использовать силы LLM там, где LLM действительно хороши - составление текста. Для этого была выбрана модель ChatGPT-5:

«У нас всё в порядке.»
«У нас все в порядке.»
— с ё: «всё» = «всё (целое, всё вместе)» — «всё в порядке» = «всё (вещи/дела) в порядке».
— с е: «все в порядке» = «все (люди) в порядке» — смысл иной (целое ≠ люди).

«Чтобы рассмешить публику, актёр надел маску и в шутку изображал, будто он — осёл, привлекая внимание к своей нелепой походке.»
«Чтобы рассмешить публику, актёр надел маску и в шутку изображал, будто он — осел, привлекая внимание к своей нелепой походке.»
— с ё: осёл = животное (donkey).
— с е: осел (без ё) читается как прошедшее время от «осесть» — «уселся/осел» (в зависимости от контекста) — смысл: «изображал, что он усел(ся)» — совсем другое действие.

«При обследовании полости рта врач аккуратно осмотрел нёбо, отметив участки с изменённым цветом.»
«При обследовании полости рта врач аккуратно осмотрел небо, отметив участки с изменённым цветом.»
— с ё: в первом варианте слово однозначно про рот.
— с е: задуманный смысл внезапно переносится на небесную сферу.

Ещё один замечательный пример, где без смыслового анализа ситуации невозможно понять, ставить ли букву «ё» в последнем слове следующей фразы из романа А. Толстого «Пётр I»:

«Вот, скажут, такого господина нам бог послал, при таком-то передохнём…».
«Вот, скажут, такого господина нам бог послал, при таком-то передохнем…».
— с ё: «передохнём (отдохнём)» — все отдохнём.
— с е: «передохнем (умрём)» — все поумираем.

Ёфикаторы и деёрификаторы

Уже после завершения проекта я открыл для себя кроличью нору в виде ёрификаторов...

Ёфика́тор — программа или программный модуль для текстового редактора, заменяющий букву «е» на букву «ё» в русскоязычных текстах в соответствии с правилами русского языка там, где она должна употребляться.

Деёфика́тор — программа или программный модуль для текстового редактора, заменяющий букву «ё» на букву «е» в русскоязычных текстах в соответствии с правилами русского языка там, где она должна употребляться.

Источник: Ёфикатор - Википедия.

У всех ёрификаторов есть свои списки спорных слов, где без смыслового анализа ситуации невозможно понять, исправлять ли «е» на «ё» — буквально та же задача, что и у данного проекта. Даже имена репозиториев в GitHub очень похожи. Изучив списки слов из репозиториев с открытым исходным кодом сложно сказать у кого самый полноценный список слов. Они почти везде отличаются и без более глубокого анализа тут не обойтись.

Полезные ресурсы и open source ёфикаторы

  • e2yo/eyo — ёфикатор с открытым кодом на Node.js
  • rin-nas/php-yoficator — ёфикатор с открытым кодом на PHP
  • vgiv/yo — ёфикатор с открытым кодом на Pascal
  • yomaker — cайт «главного ёфикатора России» Виктора Трофимовича Чумакова
  • Ёфикатор — онлайн-ёфикатор
  • Ёфицирующие скрипты — скрипты для текстовых редакторов VIM и XEmacs
  • Пишите по-русски — макрос для документов MS Word с функцией ёфикации

Техническая информация

Для запуска скрипта через терминал:

# Установка менеджера пакетов UV
curl -LsSf https://astral.sh/uv/install.sh | sh
# powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex" на Windows

# Создание виртуальной среды и установка зависимостей
uv sync

# Активация виртуальной среды
. .venv/bin/activate
# .venv\Scripts\activate на Windows

# Установка pre-commit хуков
uv run pre-commit install

# Запуск pre-commit
uv run pre-commit run --all-files

# Ruff
uv run ruff format
uv run ruff check --fix

# Запуск скрипта
uv run python -m src.yo_pairs --validate both

# Возможные аргументы:
# --output: путь для сохранения результата
# --validate {none,first,second,both}: фильтровать ли полученный после первого шага список
# --no-download: не скачивать списки слов

Эта программа распространяется под лицензией MIT License. Пожалуйста, прочтите файл лицензии, чтобы узнать об условиях использования.


«День за днём горим огнём,
Не вздохнём, не охнем,
Если не передохнём,
Значит, передохнем...»

Валентин Бересто

About

Нужна ли буква «ё» русскому языку?

Topics

Resources

License

Contributing

Stars

Watchers

Forks

Languages