Opentaal.org

  • Vergroot lettergrootte
  • Standaard lettergrootte
  • Verklein lettergrootte
Welkom bij OpenTaal

Alfa-2-versie van spellingcontrole 1.10G-flexibel

E-mailadres Afdrukken PDF

Eindelijk is het zo ver dat ik het aandurf om een publieke alfaversie van de spellingcontrole met herkenning van (veel) samenstellingen te publiceren.

Wat een puzzel was het.

Een 2e alfaversie kent natuurlijk nog gebreken. Je mag ook niet anders verwachten. Van diegenen die deze alfaversie aandurven hoop ik dan ook veel terugkoppeling te krijgen op het e-mailadres Dit e-mailadres is beschermd tegen spambots. U heeft Javascript nodig om het te kunnen zien. .

Wat echt anders is aan deze spellingcontrole is:

  • Veel geldige woordsamenstellingen worden geaccepteerd
  • het optionele koppelteken in woorden wordt (meestal) geaccepteerd.
  • bij de foute splitsing automatiserings machine wordt automatiserings- gesuggereerd en geaccepteerd (werkt nu nog alleen correct in OpenOffice.org 3.2).

Geldige samenstellingen die niet als zodanig worden onderkend, foute woorden die als correct worden gezien, alles wil ik weten om een nog betere versie kunnen maken.

Structurele hulp kan ik ook goed gebruiken. Moeilijk is het niet. Het gaat dan om het nakijken van de meest gebruikte woorden, die niet correct zijn voor de gewone 1.10 (en dus niet in onze woordenlijst staan) maar wel door de alfa worden geaccepteerd. Correcte woorden kunnen we opnemen in de lijst voor de keuring, foute of riskante moeten we blokkeren.

Ik hoop bij de laatste actie vooral op de inbreng van de taalkundigen onder ons.

Downloaden? Klik op ' Mozilla'  of 'OpenOffice.org 3.2' .

Na de alfa-fase volgt overigens nog een bètafase. Pas in september zullen we officieel de nieuwe spellingcontrole vrijgeven, met daarin ook de nieuwe door de keuringsprocedure correct bevonden woorden.


Testresultaten:

- 5-3-2010, Jan de R:: samenstellingen werken niet goed in Opera; dezelfde woorden gaan wel goed in Firefox 3.5.8.  Opera heeft kennelijk nieuwere versie van Hunspell nodig.

-5-3-2010, Jan de R: Mozilla-plug-in installeert niet in Firefox 3.6. (Inmiddels aangepast)

-6-3-2010, Jan de R: platteland stelt niet samen; de suggesties zijn wild. (Platteland samensteller gemaakt, samenstellen met tel stopgezet)

-8-3-2010, Peter: plug-in voor OOo is niet correct. (inmiddels gecorrigeerd)

-8-3-2010, Peter: man-vrouwwoorden gaan nog niet goed. (Inmiddels aangepast) Dit heeft gelijk een gebrek in Hunspell 1.2.8 aangetoond. (Voorlopig opgelost door de geoogste fouten als blokkering op te nemen.)

-8-3-2010, Jan de R: Nog voorzichtiger samenstellen met woorden met een tussen-s en woorden die met en zonder s kunnen beginnen. Dat betekende 1400 woorden controleren en aanpassen. (Opgelost door alle woorden die hier een probleem kunnen geven niet meer als samensteller te gebruiken.)

Al met al reden genoeg voor een update. Dus bijwerken maar weer!



-11-3-2010 Ruud B: de volgorde van aanbieden van de suggesties is nog niet best. Dat wordt beter als we aan uiteindelijk de meest voorkomende woorden los gaan toevegen.

-11-3-2010 Ruud B: Veel van de suggesties bij samenstellingen zijn nogal wild. We hebben een filter op te groot verschil van de invoer- en uitvoerwoorden voorgesteld aan de maker van Hunspell. Het verschijnsel wordt naarmate er meer woorden correct met samenstellingen worden gedaan ook minder.


Laatst aangepast op donderdag, 11 maart 2010 13:11
 

Wat is de juiste apostrof ?

E-mailadres Afdrukken PDF

Tot nu toe hebben we in de spellingcontrole steeds de ' gebruikt in woorden als: programma's.

Professionele schrijvers kiezen echter voor de nette, kromme apostrof. Dat ziet er ook mooier uit, maar typt een stuk lastiger in. Gelukkig passen (sommige)  tekstverwerkers de ' zelf aan in de nette apostrof (‘) . (Helaas deze waarmee het artikel wordt gemaakt niet.)

Uit de gedachtewisseling op de mailing list is duidelijk geworden dat er voor onze apostrof eigenlijk geen teken is gereserveerd in unicode! Deze groep adviseert om het aanhalingsteken sluiten te gebruiken. Onderscheid tussen vorm en functie wordt daar niet volledig gemaakt.

Momenteel doen we een experiment wat het betekent voor de verschillende gebruikende producten als we de spellingcontrole omzetten in utf-8, en de nette apostrof gebruiken.

Goede testgevallen zijn:

  • bureau's, wat altijd fout is (met wat voor apostrof ook), maar als de software foutief apart bureau en s aanlevert aan Hunspell, dan wordt het woord correct bevonden.
  • programmas, wat altijd fout is, en waarvoor de suggestie van programma's zou moeten geven (met de gekozen apostrof)
  • programma's (met de gekozen apostrof) dient altijd correct te worden bevonden

De resultaten tot nu toe zijn:

Testgeval Met normale 1.10 Met aangepaste 110
Mozilla (Tb+Ff) bureau's
ziet fout, suggereert bureaus
bureau’s ziet fout, geen suggestie
programma's acht dit correct
programma’s acht dit correct
programmas ziet fout, suggereert programma's ziet fout, suggereert  ’
OpenOffice.org bureau's ziet fout, suggereert bureaus
bureau’s ziet fout, suggereert bureaus
programma's acht dit correct
programma’s acht dit correct
programmas ziet fout, suggereert programma's
Google Chrome bureau's ziet fout niet
ziet fout niet
bureau’s ziet fout niet
ziet fout niet
programma's acht het goed
acht het goed
programma’s acht het goed
acht het goed
programmas ziet fout, suggereert programma's
ziet fout, suggereert programma’s
Opera bureau's ziet fout, suggereert bureaus ziet fout, suggereert bureaus
bureau’s ziet fout, suggereert bureaus ziet fout, suggereert bureaus
programma's acht dit correct acht dit fout, suggereert programma’s
programma’s acht dit fout, suggereert programma's acht dit goed
programmas ziet fout, suggereert programma's ziet fout, suggereert programma’s
Snow Leopard bureau's ziet fout niet ziet fout niet
bureau’s ziet fout niet ziet fout niet
programma's acht dit correct
programma’s acht dit correct
programmas ziet fout, suggereert programma's ziet fout, suggereert programma’s

In OpenOffice.org zit kennelijk een vertaling van de ene naar de andere apostrof; anders zijn de resultaten van 1.10 niet te verklaren. In elk geval gaat het grotendeels goed.

Bij Snow leopard lijkt het structureel fout te gaan. Beide typen apostrof worden niet als deel van het woord gezien. Dat is een gebrek in de software in de interface met Hunspell. Tijd voor een probleemmelding aan Apple. Joost doet hiertoe een poging.

Ook Chrome gaat structureel fout.. Tijd om een bug te melden. Die contacten hebben we wel.

 


 

Voorstel voor implementatie in toekomstige woordenlijsten:

1) elke teken dat veel als apostrof wordt gebruikt (', ’ en ´, mogelijk ook de ` ) accepteren als teken van woord, zodat bureau's, bureau’s en bureau´s fout worden gerekend.

2) De makers van de gebruikende software op hun verantwoordelijkheid wijzen.

Er is nog geen uniformiteit in de mening over:

3a) in de suggesties alleen de ’ aanbieden (Reinout)

3b) In de suggesties alleen de ' aanbieden en de rest aan de softwaremakers overlaten (Simon)

3c) Zowel de ' als de ’ aanbieden. (Jan)

 

acht dit fout, suggereert programma’s
Laatst aangepast op donderdag, 18 februari 2010 20:50
 

Steun ons

E-mailadres Afdrukken PDF

Wellicht wist je het niet, maar OpenTaal is een groepje onbetaalde vrijwilligers.

Om deze vrijwilligers te ondersteunen als rechtspersoon is de Stichting OpenTaal opgericht. Zonder winstoogmerk dus. Alles wat we maken is gratis en voor niets.

Wanneer je blij bent met de producten van OpenTaal kunt je dat laten merken door bij te dragen.

Eventueel ook financieel. Met financiële bijdragen kunnen we nog meer dan nu, bijvoorbeeld wijzigingen in de software laten aanbrengen die specifiek voor het Nederlands zijn. Of meedoen aan internationale projecten.

Je kunt je bijdrage eventueel storten op rekening 15.62.32.782 van de Stichting OpenTaal.

Het bedrag laten we natuurlijk helemaal aan jou over. Hoe meer je het waard vindt, des te meer je stort. Er gaat per storting wel een bedrag van € 0,75 naar de bank voor de transactie.

Wanneer je er prijs op stelt als sponsor te worden genoemd, meldt je dat dan bij de transactie?

We zullen regelmatig laten weten wat we met de sponsoring doen.

Werk je in een organisatie die wel wil helpen, maar waarbij financiële sponsoring onmogelijk of moeilijk is (bijvoorbeeld overheden), dan is wellicht sponsoring in natura iets voor je? Neem dan even contact op met Dit e-mailadres is beschermd tegen spambots. U heeft Javascript nodig om het te kunnen zien. .

Allemaal alvast bedankt namens alle gebruikers van onder meer (in alfabetische volgorde) Chrome, Firefox, Linux, OpenOffice.org, Thunderbird en vele ander producten en sites

 


 

De sponsoring bestand tot nu toe uit:

December 2009: Donatie van de NLUUG om de stichtingskosten te dekken van de Stichting OpenTaal

November 2009: 4 oude servers gedoneerd gekregen.

Oktober 2009:

Donaties van de NLUUGG en individuen om het bezoek van de Hongaarse programmeur die Hunspell onderhoudt te financieren.

2006-2009: Geen sponsoring.

Laatst aangepast op dinsdag, 16 februari 2010 14:54
 

Ongewenst gebruik van de site

E-mailadres Afdrukken PDF

Soms is er een gebruiker die slim denkt te zijn en alle pagina's van de OpenTaal-database te dupliceren met een script. Hierdoor brengt deze gebruiker de site in gevaar.

Ik heb net zo'n gebruiker laten blokkeren en zijn provider geïnformeerd over deze ongewenste werkwijze.

Mocht er behoefte zijn aan de gegevens van OpenTaal, ga ze dan niet op een dergelijke manier ophalen zonder toestemming, maar neem gewoon contact op via de mailing list of info(@)opentaal.org.

Gaat het om legale, bij voorkeur maatschappelijk betrokken doeleinden, dan vinden we altijd een modus. Zelfs als het doel commercieel is.

Laatst aangepast op zondag, 24 januari 2010 10:56
 

Spellingcontrole met ondersteuning van samenstellingen (update)

E-mailadres Afdrukken PDF

Eerder is aangegeven dat ergens eind januari een 2e versie van de spellingcontrole met ondersteuning van samenstellingen beschikbaar zou komen.

Dat is flink vertraagd. Maar het is eind februari wel zo ver. Binnenkort komt deze als download beschikbaar.

De uitdaging waar we nog wel mee zitten, is dat deze spellingcontrole ook tolerant is waar je dat niet wilt.

Dat betekent dat ook woorden die niet in de lijst staan, maar een correcte combinatie zijn van bestaande woorden (rekening houdend met tussen-s, verplicht en optioneel koppelteken) met die spellingcontrole worden herkend als correct.

Dat houdt natuurlijk wel het risico in dat er ook woorden die fout zijn (woonzorgcentrum en niet woon-zorgcentrum) correct bevonden zouden kunnen worden.  Een grondige test is daarom noodzakelijk, ook al kost dat veel tijd en mensenwerk.

Ben je bereid om de tweede alfa-versie van deze spellingcontrole te gebruiken  en mee te helpen met het verder verbeteren ervan, download deze dan, en geef woorden die onjuist worden weergegeven (correct als het een fout woord is, of juist fout als het een correct woord is) netjes door.

Dat draagt dan weer bij aan een kwalitatief goede definitieve versie.

De officiële vrijgave van een nieuwe spellingcontrole is overigens pas in september 2010 te verwachten, na alle keurings- en testactiviteiten.

Laatst aangepast op donderdag, 18 februari 2010 20:52
 


JPAGE_CURRENT_OF_TOTAL
Banner

Zoeken

Webopentaal.org