Wordfeud heeft uitgebreidere lijst gekregen

Wordfeud heeft het nodige gedaan om de woordenlijst te verbeteren, uit te breiden, en beter aan te laten sluiten bij de spelregels van het originele spel.

Nog steeds is de OpenTaal-lijst de basis, en voldoen de aanvullingen aan onze spellingcontrole, maar deze lijst is niet de onze meer. Grappig dat hun lijst nu groter is dan die van ons. De woorden in onze lijst zijn echter correct bevonden, voor die in hun lijst geldt dat niet!

Veel plezier met spelen weer.

Lees meer: Wordfeud heeft uitgebreidere lijst gekregen

Vragen & antwoorden - Wordfeud en OpenTaal (update)

V: Komen de onterechte afkeuringen in Wordfeud door OpenTaal?
A: Nee, de makers van Wordfeud zijn hiervoor verantwoordelijk. Zij hebben de OpenTaal-woordenlijst gebruikt. Dat mogen ze doen, maar ze hebben de woordenlijst nu niet op de goede manier gebruikt. Daardoor worden bepaalde woorden ('Nederlands', 'touw', 'gauw' en 'lul') in Wordfeud onterecht afgekeurd. Deze woorden staan wel in de OpenTaal-woordenlijst. Het probleem ligt dus bij Wordfeud en niet bij OpenTaal.

V: Waarvoor is de OpenTaal-woordenlijst bedoeld?
A: De OpenTaal-woordenlijst is primair bedoeld voor spellingcontrole en zit in OpenOffice.org, Firefox en Chrome. De woordenlijst wordt onderhouden door vrijwilligers en is vrij beschikbaar voor iedereen. Het gebruik door Wordfeud is dus toegestaan, alhoewel een woordspel iets anders is dan spellingcontrole. Woordspelen hanteren namelijk vaak naast de officiële spellingregels ook nog aanvullende spelregels. Zo heeft de Nederlandse Scrabblebond eigen taalregels waarbij bijvoorbeeld bepaalde afkortingen en initiaalwoorden niet zijn toegestaan die wel zijn opgenomen in de OpenTaal-woordenlijst.

V: Gaat Wordfeud dit verbeteren?
A: Ja, naar verwachting wel. OpenTaal heeft contact gezocht met Wordfeud. Ze werken ondertussen aan een nieuwe verbeterde versie van hun Nederlandstalige versie. Binnen redelijke termijn is dus verbetering te verwachten. OpenTaal heeft hierop echter geen directe invloed.

Update: Inmiddels heeft Wordfeud TaalTik in de arm genomen om de woordenlijst te verbeteren.

V: Kan het ook aan gebruikers van Wordfeud liggen?
A: Ja, van sommige woorden zijn gebruikers onterecht overtuigd dat ze correct zijn gespeld: 'sex', 'sexe' (correct: 'seks', 'sekse'). Daarnaast zitten er nogal wat correcte woorden in onze woordenlijst die bij velen niet bekend zijn, zoals 'gres', 'keen', 'pooi', 'henry'. De eerste drie woorden staan ook allemaal in het Groene Boekje van de Nederlandse Taalunie en 'henry' is een natuurkundige eenheid. Ook een interessante is 'yel' (verbuiging van het werkwoord 'yellen') naast 'yell' (het zelfstandig naamwoord).

V: Waar kan ik het melden als ik fouten in Wordfeud tegenkom?
A: Neem contact op met Wordfeud via hun website.

Update: Controleer het woord op taaltik.nl en maak daar eventueel uw bezwaar kenbaar.

V: Is de woordenlijst van OpenTaal kwalitatief hoogwaardig?
A: De woordenlijst van OpenTaal is één van de meest omvangrijke woordenlijsten met correct gespelde Nederlandstalige woorden. Deze bevat meer dan 400.000 woorden en is goedgekeurd door de Nederlandse Taalunie dat de officiële regels voor de Nederlandse taal opstelt. In de spellingcontrole worden bovendien geautomatiseerd ook nog zeldzame samenstellingen, zoals 'hondenhokkenwedstrijd', ondersteund.

V: Kan ik meehelpen met OpenTaal?
A: "Nobody is perfect"; het zou kunnen dat er ondanks de omvang en zorgvuldigheid onvolkomenheden in de woordenlijst zitten. Suggesties voor verbetering vernemen we graag. Iedereen is uitgenodigd om actief deel te nemen aan het project. Ook is eenieder van harte uitgenodigd om als "vriend van OpenTaal" het project financieel te steunen.

-----

Toelichting op Radio 2
Op 30 september heeft Bart Knubben namens OpenTaal een toelichting in het radioprogramma Knooppunt Kranenbarg gegeven.

Wordfeud en OpenTaal

De laatste tijd komen er veel vragen over de woorden die Wordfeud van OpenTaal heeft overgenomen.

Onze woordenlijst heeft als doel om de Nederlandse taal zo goed mogelijk te ondersteunen. Dat is een ander doel dan een woordspelletje heeft. Welke gegevens Wordfeud heeft overgenomen is hun zaak. Ze hebben wel een aantal handelingen gedaan om eigennamen en afkortingen te weren, maar andere woorden die niet volgens de regels van het klassieke spel zijn noodgedwongen laten zitten. Ook zijn kennelijk niet alle woorden overgenomen, zelfs woorden die wel overgenomen hadden kunnen worden volgens de regels van het spel. Ze kennen namelijk zelf de taal niet.

Ze komen over enige tijd met een nieuwe Nederlandse woordenlijst met de nodige verbeteringen.

Veel mensen geven ook aan dat heel normale woorden niet ' gesnapt' worden. Dat kan; kennelijk zijn dus niet alle ' normale' woorden overgenomen, en onze woordenlijst bevat alleen correct bevonden woorden. Het Nederlands heeft een oneindige voorraad woordsamenstellingen. Geen enkele lijst zal dus ooit alle woorden kunnen bevatten.

Naast het spelen van een woordspelletje kun je ook OpenTaal helpen met het uitbreiden van de woordenlijst, door woorden te beoordelen op juistheid. Zie ' Tussendoortjes' , rechtsboven op deze site. Daarvoor is wel een behoorlijke kennis van het Nederlands nodig.

O, ja: er zijn 1500 woorden met een x, en 500 met een q.

Karakterfrequentie

Zoals eerder vermeld heb ik enkele overzichten samengesteld na het doen van een klein onderzoek op de woordenlijst 2.00 van OpenTaal. In een aantal kleine artikelen wil ik de resultaten met jullie delen. Bij dezen deel 2, waarin ik het histogram van karakterfrequenties bespreek.

Als men wederom eigennamen buiten beschouwing laat, is het voorkomen van letters te tellen in bijna 320.000 goedgekeurde woorden. Deze bevatten ook vervoegingen en verbuigingen. Door geautomatiseerd de tellingen van karakters, de karakterfrequentie, bij te houden van alle woorden in de woordenlijst is het mogelijk om daar een histogram van te maken. Het eindresultaat is in de volgende grafiek te zien. Let op, dit zegt verder niets over hoe vaak karakters gebruikt worden.

Vanwege de grote aantallen was het nodig te werken met een logaritmische schaal. Hierdoor zijn duidelijk drie gebieden te herkennen. Aan de linkerzijde zijn is eenvoudig een groep te herkennen van letters die het vaakst voorkomen. Deze wordt gevolgd door een groep karakters in het midden die minder vaak voorkomen. Dit zijn met name de y, z, x en q en klinkers met gangbare diakritische tekens zoals de ë, ï, é en è. Deze groep bevat overigens ook het koppelteken, de apostrof en de spatie. Deze leestekens kunnen namelijk deel uit kunnen maken van Nederlandse woorden. De karakterfrequentie neemt in deze groep overigens sterk af.

Als laatste is aan de rechterzijde een groep te vinden van karakters die zelden voorkomen. De voor Nederlandse begrippen exotische ñ maakt hier bijvoorbeeld deel van uit. Deze wordt overigens gebruikt in Spaanse leenwoorden zoals señor, señorita en doña. Verder worden de ä en ô gebruikt in Duitse en Franse leenwoorden zoals aufklärung, hüttenkäse, salonfähig, hôtelier en maîtres d'hôtel. Het wordt nog duidelijker waarom hier over karakters in plaats van letters wordt gesproken omdat deze groep zelfs cijfers bevat. Als men dit overzicht rustig aanschouwt is er heel wat handige informatie in te vinden. Kortom, doe hier je voordeel mee als je weer eens een spelletje galgje speelt.

Ten slotte is hier het bestand te vinden met de tellingen waar bovenstaande grafiek uit vervaardigd is en hier diezelfde tabel in Wiki-opmaak. Zie de licentie van OpenTaal voor hergebruik van dit bestand en de grafiek.

See also the English version of the graph, histogram and table in Wiki markup. All are licensed BSD and Creative Commons.

Keuring succesvol afgesloten

We hebben weer een keuringsronde netjes af kunnen ronden.

Zo'n 6500 nieuwe basiswoorden kunnen dus aan de woordenlijst worden toegevoegd, met al hun afgeleiden.

De nieuwe basiswoordenlijst krijgt mogelijk het predicaat 'editie zomer 2011' . Downloaden van deze lijst is nog niet mogelijk; even geduld a.u.b.

Dat levert een nieuwe woordenlijst op, en op termijn ook een nieuwe spellingcontrole.

Er is ook dit keer een aantal woorden voor overleg aangehouden. Die mogelijk de volgende keer opnieuw meedoen.