logo-opentaal

Intro
Nieuws
Documentatie
Spellingbestanden
Software
Bestanden
Projecten
Woorddetails
Woorden bijdragen
Synoniemen
Grammatica
Statistiek
Suggesties?
Mailinglists
Licentie
Wie zijn wij?
English
Zoeken
Links

Grammaticacontrole

De grammaticacontrole voor de Nederlandse taal is sterk in ontwikkeling.

De basis voor deze controle is de bestaande tool 'languagetool', zodat niet het wiel volledig opnieuw uitgevonden hoeft te worden qua technologie. Daniel Naber heeft met deze tool al een heel goede basis gelegd voor grammaticacontrole die zowel binnen OOO als door welke applicatie dan ook gebruikt kan worden. Door het in java te bouwen is ook de platformonafhankelijkheid door hem gegarandeerd. Complimenten !

Languagetool kan gemakkelijk uitgebreid worden met andere talen. Dus ook met Nederlands. Dat is precies wat dit project aan het doen is. Behalve enige java-programmering voor het invoegen van de taal Nederlands en wat specifieke regels, moet vooral aandacht besteed worden aan het vinden van de meest voorkomende grammaticafouten en het bedenken van slimme regels hiervoor, die (bijna) alleen een waarschuwing geven als dat terecht is. Door de complexiteit van de taal is dat niet eenvoudig.

Gelukkig ondersteunt languagetool ook geavanceerde mogelijkheden als 'tagging' van woorden, waardoor de woordsoort bekend is. Hiermee zijn geavanceerde regels te maken.
We hebben een set 'getagde' woorden gedoneerd gekregen vanuit de RijkUniversiteit Groningen, wat meer algemene regels mogelijk maakt.

Het is mogelijk om grammaticafouten aan te dragen.

Installatie

1) Download Languagetool 0.9. (De officiële versie ondersteunt inmiddels Nederlands. Voor mensen die willen testen is er op verzoek een nieuwere testversie beschikbaar.)
2) Kies in OOO : Extra, Pakketbeheer, Toevoegen. 3) Navigeer naar de uitgepakte files en kies daar de languagetool[versie].zip 4) Sluit OOO af en start het opnieuw. Als het goed is is in het scherm een nieuwe optie Grammatica beschikbaar gekomen.

Bekende verbeterpunten in LanguageTool

Languagetool heeft (nog) de volgende bekende gebreken/verbeterpunten:
* het window komt (onder Windows in elk geval) soms onder OOO te liggen, en dus niet eroverheen.

Bekende verbeterpunten in de Nederlandse regels

Ook de Nederlandse invulling kent een aantal gebreken:
* Veel regels zijn nog niet geïmplementeerd (Tja, niet alles kan tegelijk.)

Meehelpen bij ontwikkelen regels

Meehelpen kan al duur de grammaticacontrole te gebruiken en te rapporteren welke taalgebreken deze (nog) niet meldt.

Voor de fanatiekelingen onder jullie de uitdaging om ook zelf regels uit te pluizen, of de bestaande te verbeteren.
De regels zijn voornamelijk te vinden in 'grammar.xml' in de rules-directory van de distirbutie-set.
Uitleg over de xml kun je vinden op de site van languageTool zelf.
Je kunt die file gewoon editen met een goede XML-editor en meteen de gevolgen testen.
In de regels kun je gebruik maken van java-regular expressions. Mocht je daarmee aan de slag gaan, dan kan ik een tooltje leveren die alle woorden weergeeft die aan de regular expression voldoen, op basis van onze woordendatabase. Dat voorkomt fouten.
Het uittesten van regels kan ook tegen onze testset aan zinnen.
Neem voor meer info contact op via de mailing list. Dan zal ik meer beschrijven ...


Voor de juridische voorwaarden van OpenTaal, zie:http://www.opentaal.org/licentie.php