Opentaal.org

  • Vergroot lettergrootte
  • Standaard lettergrootte
  • Verklein lettergrootte
Home Nieuws


OpenTaal als RSS-feed

Wist u al dat u de nieuwe inhoud van deze site kunt zien als RSS-feed?

Helemaal rechts onderaan staat een RSS-icoon. Maar op de link hierboven klikken werkt ook.

Laatst aangepast op zondag 23 mei 2010 14:11
 

Spellingcontrole en functies

Een van de uitdagingen bij de spellingcontrole zijn de 'gelijkwaardige begrippen' , die vereisen dat er een koppelteken wordt geplaatst. Woorden als chef-kok en minister-president zijn hiervan vaak gebruikte voorbeelden.

Door alle woorden die eindigen op schap te selecteren, want dat zijn vaak functies (behalve bood, land, gemeen en zo) en die te combineren met en zonder koppelteken zijn zowel de correcte als foute vorm gemaakt.

Die resultaten zijn dan weer tegen de woordfrequenties gehouden. De correcte vormen die voorkomen, kunnen ter keuring opnemen; de fout vormen van de correcte, voorkomende vormen kunnen we in de spellingcontrole blokkeren.

Dezelfde truc kunnen we nog doen voor ingrediënten, als we daar een lijst van kunnen vinden.

Laatst aangepast op vrijdag 21 mei 2010 10:33
 

Woordfrequenties gepubliceerd

De meest recente export van de telling van 'woorden', verzameld uit onze oogst, is nu ook gepubliceerd onder Downloads, naslagwerken.

Dit bestand bevat niet alleen correcte woorden. Voor allerlei onderzoek kan het nuttig zijn om ook de tellingen te hebben van woorden die fout zijn.

Om alleen de tellingen van correcte woorden te krijgen is natuurlijk eenvoudig een combinatie te maken met onze woordenlijst, het bronbestand.

Laatst aangepast op woensdag 28 april 2010 11:46
 

Uitgangspunten voor woordenlijst

Omdat er over veel woorden gediscussieerd kan worden, is het goed om de uitgangspunten vast te stellen.

Goed of fout

Voor de ' groene' versie van de woordenlijst (momenteel de enige) hanteren we de richtlijnen van de Taalunie als uitgangspunt, zowel de leidraad als de woordenlijst op www.woordenlijst.org.

Daar waar we het gevoel hebben dat er iets niet klopt, gaan we de discussie met ze aan. Wat er uiteindelijk correct en niet correct is bepaalt de Taalunie, met het keuringsproces.

Nu keurt de Taalunie momenteel niet de afgeleide woordvormen (flexievormen). Flexievormen nemen we alleen op als het basiswoord correct bevonden is, en de flexievorm door ons akkoord is bevonden.

Opnemen of niet

Niet alle woorden die correct zijn, nemen we ook op. Woorden die verwarrend zouden kunnen zijn, controleren we op de verhouding tussen correct en incorrect gebruik. Is het gebruik te vaak verkeerd, dan markeren we het woord als ' verwarrend' . Dan nemen we het ook niet op in de spellingcontrole.

De mate van gebruik van een woord is altijd al bepalend of een woord ook wordt opgenomen.

Eigennamen

Eigennamen worden niet gekeurd. Achternamen worden door ons zelf gevalideerd.Bedrijfsnamen op de site van het bedrijf zelf (donorprincipe). Familienamen controleren we in de openbare registers en telefoongidsen.

Namen van landen worden gevalideerd bij de Taalunie in het register. We nemen alleen de officiële Nederlandse namen over. Zijn er meerdere schrijfwijzen, dan hanteren we de meest Nederlandse (bijvoorbeeld Kenia, niet Kenya). Omdat deze lijst nogal veranderlijk is, is dit lastig bij te houden.

 

Wikken en wegen rond de spellingcontrole

Soms moeten we lastige keuzes maken bij het samenstellen van de woordenlijst en spellingcontrole. De woordenlijst is daarbij vooral bedoeld om een zo compleet mogelijk overzicht te geven van correcte woorden, terwijl de spellingcontrole vooral bedoeld is om de gebruiker op taalfouten te wijzen.

Soms is het dan lastig kiezen.

Verwarrende woorden

Sommige woorden zijn correct, maar komen aanzienlijk vaker voor als typefout dan juist gebruikt. Voorbeelden hiervan zijn 'verassen' en 'si'. Dit soort correcte woorden nemen we in de woordenlijst op als verwarrend, en laten ze door de spellingcontrole als fout melden.

Het liefst zouden we in de spellingcontrole waarschuwen voor verwarrende woorden in plaats van gewoon afkeuren, maar dat kan (nog) niet.

Koppelteken

In het Nederlands is in een woord op sommige plaatsen om diverse redenen een koppelteken verplicht, zoals in 'assistent-arts' , 'auto-onderdeel', 'tv-meubel' of 'woon-werkverkeer'. Maar het koppelteken mag ook worden gebruikt als de schrijver het woord anders moeilijk leesbaar vindt, zoals bijvoorbeeld in 'fiets-ster'.

We doen daarom ons best om het facultatieve koppelteken wel te ondersteunen. (Dit in tegenstelling tot alle andere bekende spellingcontrolemechanismen.)

Samenstellingen

In het Nederlands mag je woorden aan elkaar plakken als het om één begrip gaat: adv-dag, meerdagentest, kinderschoenenwinkel.  We proberen dat zo goed mogelijk te ondersteunen met de mogelijkheden die de onderliggende software ons biedt.

Hier ontstaat echter ook het risico van onzinwoorden. Of van woorden die technisch gezien wel juist zijn, maar vaker een typefout zijn. Door zeer kritisch te zijn met de woorden die we wel en niet laten samenstellen (peil bijv. niet, in verband met de verwarring met pijl; ook niet woorden die met en zonder s aan het begin voorkomen (panne en spanne) om problemen met de routines voor  de tussen-s te voorkomen).

Dan blijven er nog typefouten over die toch nog correct worden bevonden. Door de door de spellingcontrole correct bevonden geoogste woorden van intensief naar minder gebruik stuk voor stuk na te kijken onderdrukken we elke gevonden fout.

Elk woord dat u zelf meldt, helpt ons ook weer.

Nadruktekens

Schrijfwijzen als 'vóór' en 'níét' zijn natuurlijk correct, maar worden bij de keuring niet geaccepteerd door de Taalunie. Hierover gaan we nog een keer met ze praten.We willen namelijk graag voorkomen dat mensen 'vóor', 'níet'  of 'wèl' schrijven door hiervoor het juiste alternatief aan te bieden.

En dat zonder in conflict te komen met het keurmerk.

Namen

Eigennamen van personen, organisaties en producten zijn weliswaar basiswoorden, maar worden niet door de Taalunie meegenomen in de keurmerkprocedure. We nemen veel gebruikte eigennamen op, na een eigen controle van de juiste schrijfwijze. Dit om fouten te voorkomen als 'pvda', 'groenlinks', 'FireFox', 'microsoft'. Alleen de gebruiksfrequentie en correctheid zijn hier argument voor opname. Echter, wanneer een organisatie expliciet opname verbiedt, geven we daar natuurlijk gehoor aan.

Samenstellingen met gelijkwaardige begrippen

Wanneer we de verhouding tussen prijs en kwaliteit bedoelen, moeten we prijs-kwaliteitverhouding schrijven. Sommige eindwoorden zijn goede indicatoren van voorafgaande gelijkwaardige begrippen (relatie, verhouding) en kunnen dus van samenstellen worden uitgesloten om prijskwaliteitverhouding en ouderkindrelatie  te voorkomen. Ook kan worden bestreden dat de (meest gebruikte) gecombineerde gelijkwaardige begrippen aan elkaar worden geplakt.

Laatst aangepast op maandag 15 maart 2010 12:37
 


Pagina 1 van 6
Banner

Zoeken

Webopentaal.org