Opentaal.org

  • Vergroot lettergrootte
  • Standaard lettergrootte
  • Verklein lettergrootte
Welkom bij OpenTaal

Fout? Verbeteren!

Met het oogsten hebben we veel voorbeeldzinnen gekregen. Hieruit is een selectie gemaakt (ruim 1 miljoen) waarin zeker een fout of een onbekend woord staat. Door alle fouten te corrigeren (zowel fouten die 1 woord beslaan als fouten die meerdere woorden beslaan)  ontstaat een goed beeld van de meest gemaakte fouten. Wat weer zinvolle informatie is voor spelling- of grammaticacontrole.

Fouten van een enkel woord kun je corrigeren na het klikken op het woord; voor het corrigeren van fouten die meerdere woorden beslaan, kun je achtereenvolgens de linker en rechter grens markeren.

Laatst aangepast op dinsdag 28 juni 2011 10:16
 

Wat is OpenTaal (video)

Dit is een video die getoond is tijdens het symposium "De automatische taalhulp". Het beschrijft in een vogelvlucht de activiteiten van OpenTaal.

Laatst aangepast op woensdag 12 oktober 2011 17:42 Lees meer...
 

Meer zeldzame woorden vinden

We doen ons uiterste best om de Nederlandse taal zo volledig mogelijk te ondersteunen.

Het Nederlands kent echter nogal wat mogelijkheden om woorden te verzinnen op een correcte manier. Daarom is het belangrijk om het gebruik van zeldzame woorden goed in kaart te hebben.

Zeldzame woorden zoeken we met Harvester.

Kijk hier wie er al helpen in de grafieken van bijdragen.

Laatst aangepast op zaterdag 12 maart 2011 11:36
 

Woordlengte

Na het doen van een klein onderzoek op de woordenlijst 2.00 van OpenTaal heb ik enkele overzichten weten samen te stellen. In een aantal kleine artikelen wil ik deze met jullie delen. Bij dezen deel 1, waarin ik het histogram van woordlengtes en het langste woord bespreek.

Als men eigennamen buiten beschouwing laat, zijn er bijna 320.000 goedgekeurde woorden te onderzoeken op woordlengte. Deze bevatten ook vervoegingen en verbuigingen. Door geautomatiseerd de woordlengte te tellen van alle woorden in de woordenlijst is het mogelijk om daar een histogram te maken zoals in de volgende grafiek te zien is. Let op, dit zegt verder niets over hoe vaak woorden van een bepaalde lengte worden gebruikt.

Vanwege de grote aantallen was het nodig te werken met een logaritmische schaal waardoor er, naar mijn idee, de vorm van een walvis ontstaat. De onregelmatigheden aan de rechterzijde zijn overigens te verwaarlozen omdat door de schaal deze specifieke staart ontstaat. In de woordenlijst versie 2.00 is één woord het langst, namelijk ontwikkelingssamenwerkingsorganisaties van maar liefst 38 letters.

Ten slotte is hier het bestand te vinden met de tellingen waar bovenstaande grafiek uit vervaardigd is en hier diezelfde tabel in Wiki-opmaak. Zie de licentie van OpenTaal voor hergebruik van dit bestand en de grafiek.

See also the English version of the graph, histogram and table in Wiki markup. All are licensed BSD and Creative Commons.

Laatst aangepast op zondag 12 mei 2013 18:03
 


Pagina 7 van 12
Banner

Bijdragen vanuit je luie stoel

Zoeken

Webopentaal.org