Opentaal.org

  • Vergroot lettergrootte
  • Standaard lettergrootte
  • Verklein lettergrootte
Welkom bij OpenTaal

Vragen & antwoorden - Worfeud en OpenTaal

V: Komen de onterechte afkeuringen in Wordfeud door OpenTaal?
A: Nee, de makers van Wordfeud zijn hiervoor verantwoordelijk. Zij
hebben de OpenTaal-woordenlijst gebruikt. Dat mogen ze doen, maar ze
hebben de woordenlijst nu niet op de goede manier gebruikt. Daardoor
worden bepaalde woorden ('Nederlands', 'touw', 'gauw' en 'lul') in
Wordfeud onterecht afgekeurd. Deze woorden staan wel in de
OpenTaal-woordenlijst. Het probleem ligt dus bij Wordfeud en niet bij
OpenTaal.

V: Gaat Wordfeud dit verbeteren?
A: Ja, naar verwachting wel. OpenTaal heeft contact gezocht met
Wordfeud. Ze werken ondertussen aan een nieuwe verbeterde versie van
hun Nederlandstalige versie. Binnen redelijke termijn is dus
verbetering te verwachten. OpenTaal heeft hierop echter geen directe
invloed.

V: Kan het ook aan gebruikers van Wordfeud liggen?
A: Ja, van sommige woorden zijn gebruikers onterecht overtuigd dat ze
correct zijn gespeld: 'sex', 'sexe' (correct: 'seks', 'sekse').
Daarnaast zitten er nogal wat correcte  woorden in onze woordenlijst
die bij velen niet bekend zijn, zoals 'gres', 'keen', 'pooi', 'henry'.
De eerste drie woorden staan ook allemaal in het Groene Boekje van de
Nederlandse Taalunie en 'henry' is een natuurkundige eenheid. Ook een
interessante is 'yel' (verbuiging van het werkwoord 'yellen') naast
'yell' (het zelfstandig naamwoord).

V: Waar kan ik het melden als ik fouten in Wordfeud tegenkom?
A: Neem contact op met Wordfeud via hun website: http://wordfeud.uservoice.com/

V: Waarvoor is de OpenTaal-woordenlijst bedoeld?

A: De woordenlijst is primair bedoeld voor spellingcontrole en zit in
OpenOffice.org, Firefox en Chrome. De woordenlijst wordt onderhouden
door vrijwilligers en is vrij beschikbaar voor iedereen. Het gebruik
door Wordfeud is dus toegestaan, alhoewel scrabble net iets anders is
dan spellingcontrole. Zo is er bijvoorbeeld de Nederlandse
Scrabblebond die eigen taalregels hanteert. De OpenTaal-woordenlijst
is eerder ook al gebruikt voor het oplossen van woordpuzzels en voor
het optimaliseren van een virtueel toetsenbord.

V: Is de woordenlijst van OpenTaal kwalitatief hoogwaardig?

A: De woordenlijst van OpenTaal is één van de meest omvangrijke
woordenlijsten met correct gespelde Nederlandstalige woorden. Deze
bevat meer dan 400.000 woorden en is goedgekeurd door de Nederlandse
Taalunie dat de officiële regels voor de Nederlandse taal opstelt.
"Nobody is perfect"; het zou kunnen dat er ondanks de omvang en
zorgvuldigheid onvolkomenheden in de woordenlijst zitten. Graag
vernemen we eventuele suggesties via: http://opentaal.org/suggesties

 

Wordfeud en OpenTaal

De laatste tijd komen er veel vragen over de woorden die Wordfeud van OpenTaal heeft overgenomen.

Onze woordenlijst heeft als doel om de Nederlandse taal zo goed mogelijk te ondersteunen. Dat is een ander doel dan een woordspelletje heeft. Welke gegevens Wordfeud heeft overgenomen is hun zaak. Ze hebben wel een aantal handelingen gedaan om eigennamen en afkortingen te weren, maar andere woorden die niet volgens de regels van het klassieke spel zijn noodgedwongen laten zitten. Ook zijn kennelijk niet alle woorden overgenomen, zelfs woorden die wel overgenomen hadden kunnen worden volgens de regels van het spel. Ze kennen namelijk zelf de taal niet.

Ze komen over enige tijd met een nieuwe Nederlandse woordenlijst met de nodige verbeteringen.

Veel mensen geven ook aan dat heel normale woorden niet ' gesnapt' worden. Dat kan; kennelijk zijn dus niet alle ' normale' woorden overgenomen, en onze woordenlijst bevat alleen correct bevonden woorden. Het Nederlands heeft een oneindige voorraad woordsamenstellingen. Geen enkele lijst zal dus ooit alle woorden kunnen bevatten.

Naast het spelen van een woordspelletje kun je ook OpenTaal helpen met het uitbreiden van de woordenlijst, door woorden te beoordelen op juistheid. Zie ' Tussendoortjes' , rechtsboven op deze site. Daarvoor is wel een behoorlijke kennis van het Nederlands nodig.

O, ja: er zijn 1500 woorden met een x, en 500 met een q.

Laatst aangepast op vrijdag 30 september 2011 18:09
 

Traditie: een nieuwe woordenlijst

Het begint al een traditie te worden dat we op de Europese dag van de talen de nieuwe woordenlijst publiceren.

Dit keer ruim 6500 woorden meer, en natuurlijk wat correcties. U vindt de woordenlijst 2.10 onder Downloads.

Ook wordt gelijk de nieuwe spellingcontrole vrijgegeven. Deze is ook flink verbeterd doordat meer samenstellingen worden ondersteund, maar er minder onzinsuggesties worden getoond. Die trend willen we doorzetten.

Het is wel zo dat de nieuwe spellingcontrole, te vinden  onder Downloads, alleen goed werkt met Hunspell 1.32. Dus met Libreoffice 3.4, Firefox 6 en Thunderbird 6 op Windows. Op Linux kunt u beter eerst controleren (hunspell -v) of u wel versie 1.3.2 op het systeem hebt. Eventueel kunt u het zelf ophalen en installeren, maar ook wachten op de volgende grote update van uw Linux.

Voorstellen tot verbetering en vragen kunnen altijd worden doorgegeven via 'Suggesties'.

Op de 'Europese dag van de talen' vragen we ook alle maatjes, vrienden en partners van OpenTaal ook weer om ons te steunen.

Laatst aangepast op zondag 09 oktober 2011 17:46
 

Karakterfrequentie

Zoals eerder vermeld heb ik enkele overzichten samengesteld na het doen van een klein onderzoek op de woordenlijst 2.00 van OpenTaal. In een aantal kleine artikelen wil ik de resultaten met jullie delen. Bij dezen deel 2, waarin ik het histogram van karakterfrequenties bespreek.

Als men wederom eigennamen buiten beschouwing laat, is het voorkomen van letters te tellen in bijna 320.000 goedgekeurde woorden. Deze bevatten ook vervoegingen en verbuigingen. Door geautomatiseerd de tellingen van karakters, de karakterfrequentie, bij te houden van alle woorden in de woordenlijst is het mogelijk om daar een histogram van te maken. Het eindresultaat is in de volgende grafiek te zien. Let op, dit zegt verder niets over hoe vaak karakters gebruikt worden.

Vanwege de grote aantallen was het nodig te werken met een logaritmische schaal. Hierdoor zijn duidelijk drie gebieden te herkennen. Aan de linkerzijde zijn is eenvoudig een groep te herkennen van letters die het vaakst voorkomen. Deze wordt gevolgd door een groep karakters in het midden die minder vaak voorkomen. Dit zijn met name de y, z, x en q en klinkers met gangbare diakritische tekens zoals de ë, ï, é en è. Deze groep bevat overigens ook het koppelteken, de apostrof en de spatie. Deze leestekens kunnen namelijk deel uit kunnen maken van Nederlandse woorden. De karakterfrequentie neemt in deze groep overigens sterk af.

Als laatste is aan de rechterzijde een groep te vinden van karakters die zelden voorkomen. De voor Nederlandse begrippen exotische ñ maakt hier bijvoorbeeld deel van uit. Deze wordt overigens gebruikt in Spaanse leenwoorden zoals señor, señorita en doña. Verder worden de ä en ô gebruikt in Duitse en Franse leenwoorden zoals aufklärung, hüttenkäse, salonfähig, hôtelier en maîtres d'hôtel. Het wordt nog duidelijker waarom hier over karakters in plaats van letters wordt gesproken omdat deze groep zelfs cijfers bevat. Als men dit overzicht rustig aanschouwt is er heel wat handige informatie in te vinden. Kortom, doe hier je voordeel mee als je weer eens een spelletje galgje speelt.

Ten slotte is hier het bestand te vinden met de tellingen waar bovenstaande grafiek uit vervaardigd is en hier diezelfde tabel in Wiki-opmaak. Zie de licentie van OpenTaal voor hergebruik van dit bestand en de grafiek.

See also the English version of the graph, histogram and table in Wiki markup. All are licensed BSD and Creative Commons.

Laatst aangepast op zondag 12 mei 2013 18:03
 


Pagina 5 van 12
Banner

Bijdragen vanuit je luie stoel

Zoeken

Webopentaal.org