Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Commit 31ccd92

Browse files
committed
[en] improve rules
1 parent 52387af commit 31ccd92

File tree

9 files changed

+106
-12
lines changed

9 files changed

+106
-12
lines changed

languagetool-language-modules/de/src/test/java/org/languagetool/rules/de/AgreementRuleTest.java

Lines changed: 35 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -652,6 +652,41 @@ public void testDetNounRule() throws IOException {
652652
assertGood("Die Adelmanns wohnen in Herford.");
653653
assertBad("Die Idee des Werbekaufmann kam gut an.");
654654
assertGood("Die Idee des Werbekaufmanns kam gut an.");
655+
assertGood("Solch harte Worte!");
656+
assertGood("Es besteht durchaus die Gefahr, dass die Telekom eine solch starke monopolistische Stellung auf dem Markt hat, dass sich kaum Wettbewerb entfalten kann.");
657+
assertBad("Ich habe keine Zeit für solche kleinlichen Belangen.");
658+
// TODO:
659+
// assertBad("Solch hartes Worte!");
660+
// unsure:
661+
// assertGood("Wie konnte mir solch Feindseligkeit innerhalb meiner Familie entgehen?");
662+
// assertGood("Es ist schon faszinierend wie verzaubernd solch Klänge wirken und dann die facettenreiche Programmzusammenstellung bei Tango und Polka die Besucher im „Sturm“ mitreißen. ");
663+
assertBad("Solche kleinen Anbietern nutzen dann eines der drei großen Mobilfunknetze Deutschlands.");
664+
assertGood("Solch frivolen Gedanken wollen wir gar nicht erst nachgehen.");
665+
assertGood("Er erwartete solch aggressives Verhalten.");
666+
assertGood("Eine solch schöne Frau.");
667+
assertGood("Einer solch schönen Frau.");
668+
assertGood("Ein solch schöner Tisch.");
669+
assertGood("Ein solch schöner neuer Tisch.");
670+
assertGood("Eine solch begnadete Fotografin mit dabei zu haben und Tipps für die Fotosession zu bekommen, wäre schon toll.");
671+
assertGood("Wie können wir als globale Gemeinschaft solch brennende Themen wie Klimawandel und Rezession in entwickelten Märkten in Angriff nehmen?");
672+
assertGood("Wir waren überrascht, von ihm solch beißende Bemerkungen über seinen besten Freund zu hören.");
673+
assertGood("Worten, wohl gewählt, wohnt solch große Macht inne.");
674+
assertGood("Warum gelingt es den Stuten die Hengste in solch großen Rennen zu schlagen.");
675+
assertGood("Eine solch gute Beratung kann natürlich nicht kostenlos sein, daher lassen Sie mich bitte wissen welche Kosten für die PKV und BU-Beratung auf mich zukommen werden.");
676+
assertGood("Ein solch großer Ausbruch außerhalb des Nahen Ostens ist eine neue Entwicklung, heißt es weiter.");
677+
assertGood("Natürlich dürfen unsere Sporteinheiten nicht fehlen, vor allem nicht bei solch gutem Essen.");
678+
assertGood("Wie konnten Sie solch harte Songs gegen Ihre Familie schreiben?");
679+
assertGood("Zur Krönung auf dem schönsten Aussichtsberg in der Ferienregion Tirol West gelegen, bietet die Venet Gipfelhütte alle Annehmlichkeiten, die man sich auf solch hohem Niveau (2.212 m) wünschen kann.");
680+
assertGood("Vor allem nicht einen, der sich ein solch hohen Ballbesitz organisierte und die Berliner nicht zur Entfaltung kommen ließ.");
681+
assertGood("Du solltest im Winter keinen solch hohen Berg besteigen.");
682+
assertGood("Man darf an dieser Stelle fragen, wie ein solch hoher Verlust zustande kommt, wo doch der Stuttgarter Weg aus Sparen bestand.");
683+
assertGood("Kann der Patient eine solch lange Operation überstehen?");
684+
assertGood("Er kennt sich aus mit solch monumentalen Projekten.");
685+
assertGood("Eine solch schöne hübsche Frau.");
686+
assertGood("Bisher hat Gül einen solch offenen Affront gegen die ErdoganRegierung vermieden.");
687+
assertBad("..., das heißt solche natürliche Personen, welche unsere Leistungen in Anspruch nehmen, ...");
688+
assertBad("Der Erwerb solcher kultureller Güter ist natürlich stark an das ökonomische Kapital gebunden.");
689+
assertGood("Umso dankbarer bin ich für Brüder, die klare Kante in theologischer Hinsicht zeigen und nachvollziehbar die Bibel auch in solch schwierigen unpopulären Themen auslegen.");
655690
// TODO: not yet detected:
656691
//assertBad("Erst recht wir fleißiges Arbeiter.");
657692
//assertBad("Erst recht ich fleißiges Arbeiter.");

languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/added.txt

Lines changed: 4 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -33313,4 +33313,7 @@ Powerball Powerball NNP
3331333313
Aleksandar Aleksandar NNP
3331433314
ManageBac ManageBac NNP
3331533315
Bowerman Bowerman NNP
33316-
round round RB
33316+
round round RB
33317+
Weizsäcker Weizsäcker NNP
33318+
Éveline Éveline NNP
33319+
Marie-Élaine Marie-Élaine NNP

languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/disambiguation.xml

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -3281,6 +3281,10 @@ Incorrectly touched. <example type="untouched">Incorrect grammar. Those present
32813281
<token regexp="yes">are|is|was|been</token>
32823282
<token postag="VBP" chunk_re=".-VP" />
32833283
</antipattern>
3284+
<antipattern>
3285+
<token regexp="yes">are|is|was|been</token>
3286+
<token regexp="yes">kill|take|drive</token>
3287+
</antipattern>
32843288
<pattern>
32853289
<token regexp="yes">are|is|was|been</token><!-- MFU 2020-02-21 Why doesn't this also have 'were'? -->
32863290
<marker>

languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/hunspell/ignore.txt

Lines changed: 2 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -596,4 +596,5 @@ FMF
596596
dL
597597
ManageBac
598598
QOTD
599-
Bowerman
599+
Bowerman
600+
Weizsäcker

languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/hunspell/spelling.txt

Lines changed: 9 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -33719,4 +33719,12 @@ beardier
3371933719
beardiest
3372033720
commensalist
3372133721
commensalists
33722-
commensalistic
33722+
commensalistic
33723+
nonmentalistic
33724+
Éveline
33725+
archosaur
33726+
archosaurs
33727+
archosaurian
33728+
Carnosauria
33729+
Archosauria
33730+
Marie-Élaine

languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/multiwords.txt

Lines changed: 4 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -6067,4 +6067,7 @@ Jennifer Wexton NNP
60676067
Gretchen Whitmer NNP
60686068
Tudor Dixon NNP
60696069
Chichén Itzá NNP
6070-
Bill Bowerman NNP
6070+
Bill Bowerman NNP
6071+
Lenovo ThinkStation NNP
6072+
Richard von Weizsäcker NNP
6073+
von Weizsäcker NNP

languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/specific_case.txt

Lines changed: 2 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -5473,4 +5473,5 @@ Nova Kakhovka
54735473
Whac-A-Mole
54745474
Süddeutsche Zeitung
54755475
Aleph Alpha
5476-
Kari Lake
5476+
Kari Lake
5477+
Lenovo ThinkStation

languagetool-language-modules/en/src/main/resources/org/languagetool/rules/en/diacritics.txt

Lines changed: 2 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1254,4 +1254,5 @@ Ferdinand Piech=Ferdinand Piëch
12541254
Rene Benko=René Benko
12551255
Edin Terzic=Edin Terzić
12561256
Hernan Crespo=Hernán Crespo
1257-
Bjorn Gulden=Bjørn Gulden
1257+
Bjorn Gulden=Bjørn Gulden
1258+
von Weizsacker=von Weizsäcker

languagetool-language-modules/en/src/main/resources/org/languagetool/rules/en/grammar.xml

Lines changed: 44 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -464,7 +464,7 @@ USA
464464
'>
465465

466466
<!ENTITY nouns_with_a 'series?|slot|(sub-?)?section|angle|choice|point|plan|exhibit|annex|part|person|group|team|participant|patient|level|probant|type|region|zone|band|source|influenza|hepatitis|grade|formula|document|division|class|category|dock|column|appendix|macro|criterion|vitamin|model|graph|tier|option|party|enzyme|object|genotype|cohort|rank|bisphenol|copulative|sample|subject|line'>
467-
<!ENTITY nouns_with_i 'axis|appendix|unit|article|block|phase|class|grade|part|exhibit|semester|paragraph|section|chaos|enigma|book|war|king|current|mustang|type|division|level|bi\-?polar|century|tier|numeral|algorithm|auschwitz|charles|fukushima|algebra|angiotensin|diablo|yaroslav|yazid|alaric|sigismund|darius|charibert|bolesław|justinian|mhc|radama|xerxes|gregory|stage|salt|elizabeth|zog|amendment|antigonus|otto|calculus|bayezid|leonidas|cleomenes|anaxandridas|francois|plaza'>
467+
<!ENTITY nouns_with_i 'axis|appendix|unit|article|block|phase|class|grade|part|exhibit|semester|paragraph|section|chaos|enigma|book|war|king|current|mustang|type|division|level|bi\-?polar|century|tier|numeral|algorithm|auschwitz|charles|fukushima|algebra|angiotensin|diablo|yaroslav|yazid|alaric|sigismund|darius|charibert|bolesław|justinian|mhc|radama|xerxes|gregory|stage|salt|elizabeth|zog|amendment|antigonus|otto|calculus|bayezid|leonidas|cleomenes|anaxandridas|francois|plaza|william'>
468468
<!ENTITY given_names_that_are_also_nouns 'romeo|matt|mike|trump|jack|tom|mark|nick|chad|robin|laura|clement|victor|martin|bob|bobby|steven|morgan|john|peter|rick|sally|carol|jerry|anna|jessie|eric'>
469469

470470
<!-- These can be adjectives or VBNs in passive constructions AND are more likely to be passive voice VBNs -->
@@ -47066,6 +47066,11 @@ USA
4706647066
<token>n't</token>
4706747067
<token postag="PRP" />
4706847068
</antipattern>
47069+
<antipattern>
47070+
<token regexp="yes">&nouns_with_i;</token>
47071+
<token>I</token>
47072+
<token postag="JJ" />
47073+
</antipattern>
4706947074
<antipattern><!-- Neither did I on ... -->
4707047075
<token inflected="yes" regexp="yes">be|do</token>
4707147076
<token postag="PRP" />
@@ -70912,6 +70917,7 @@ USA
7091270917
<example correction="had|having">...signs have the advantages that they are <marker>have</marker> been well tested for strength, stability...</example><!-- #4883 -->
7091370918
<example correction="done|doing">What he is <marker>do</marker> helps us all.</example>
7091470919
<example correction="asked|asking">As per Sonja Galloway's request, we have been <marker>ask</marker> to supply this information no later than close of business tomorrow.</example>
70920+
<example correction="killed|killing">He did that three times until Harold was <marker>kill</marker>.</example>
7091570921
<example>The park has been open for many years.</example>
7091670922
<example>It has been done.</example>
7091770923
<example>It has been love's whip.</example>
@@ -114542,7 +114548,7 @@ The accident victim died from her injuries.
114542114548
<token>instead</token>
114543114549
<token>off</token>
114544114550
</pattern>
114545-
<message>In this context the correct preposition seems to be <suggestion>\1 of</suggestion>.</message>
114551+
<message>In this context, the correct preposition appears to be <suggestion>\1 of</suggestion>.</message>
114546114552
<url>https://www.merriam-webster.com/dictionary/instead%20of</url>
114547114553
<example correction="instead of">I would rather like to this <marker>instead off</marker> that.</example>
114548114554
</rule>
@@ -114560,7 +114566,7 @@ The accident victim died from her injuries.
114560114566
</marker>
114561114567
<token>all</token>
114562114568
</pattern>
114563-
<message>It seems that <suggestion>of</suggestion> is the correct preposition here.</message>
114569+
<message>It appears that <suggestion>of</suggestion> is the correct preposition here.</message>
114564114570
<example correction="of">First <marker>off</marker> all, I have to apologize.</example>
114565114571
<example>First off all animals were rescued.</example><!-- missing comma after "all" -->
114566114572
</rule>
@@ -114572,7 +114578,7 @@ The accident victim died from her injuries.
114572114578
<token>off</token>
114573114579
</marker>
114574114580
</pattern>
114575-
<message>It seems that <suggestion>of</suggestion> is the correct preposition here.</message>
114581+
<message>It appears that <suggestion>of</suggestion> is the correct preposition here.</message>
114576114582
<example correction="of">He stepped down as leader in favour <marker>off</marker> his rival.</example>
114577114583
</rule>
114578114584
<rule>
@@ -114583,7 +114589,7 @@ The accident victim died from her injuries.
114583114589
<token>off</token>
114584114590
</marker>
114585114591
</pattern>
114586-
<message>It seems that <suggestion>of</suggestion> is the correct preposition here.</message>
114592+
<message>It appears that <suggestion>of</suggestion> is the correct preposition here.</message>
114587114593
<example correction="of">That is a four-year course taught by means <marker>off</marker> lectures and seminars.</example>
114588114594
</rule>
114589114595
<rule>
@@ -114594,9 +114600,41 @@ The accident victim died from her injuries.
114594114600
</marker>
114595114601
<token regexp="yes">yesterday|tomorrow|today|tonight|&weekdays;|&months;|next|last</token>
114596114602
</pattern>
114597-
<message>It seems that <suggestion>of</suggestion> is the correct preposition here.</message>
114603+
<message>It appears that <suggestion>of</suggestion> is the correct preposition here.</message>
114598114604
<example correction="of">As <marker>off</marker> yesterday, we are live!</example>
114599114605
</rule>
114606+
<rule>
114607+
<antipattern>
114608+
<token>one</token>
114609+
<token>'s</token>
114610+
</antipattern>
114611+
<antipattern>
114612+
<token>top</token>
114613+
<token>on</token>
114614+
<token>top</token>
114615+
</antipattern>
114616+
<pattern>
114617+
<token>on</token>
114618+
<token>top</token>
114619+
<marker>
114620+
<token>off</token>
114621+
</marker>
114622+
<token postag="PRP.*|P?DT" postag_regexp="yes" />
114623+
</pattern>
114624+
<message>It seems that <suggestion>of</suggestion> is the correct preposition here.</message>
114625+
<example correction="of">And on top <marker>off</marker> that, we have decided the following:</example>
114626+
</rule>
114627+
<rule>
114628+
<pattern>
114629+
<token>because</token>
114630+
<marker>
114631+
<token>off</token>
114632+
</marker>
114633+
<token regexp="yes">that|this</token>
114634+
</pattern>
114635+
<message>It seems that <suggestion>of</suggestion> is the correct preposition here.</message>
114636+
<example correction="of">And because <marker>off</marker> that, we have decided the following:</example>
114637+
</rule>
114600114638
</rulegroup>
114601114639
<rulegroup id="DO_TO" name="do vs to">
114602114640
<antipattern><!-- smartphone mode -->

0 commit comments

Comments
 (0)