Opentaal.org

  • Vergroot lettergrootte
  • Standaard lettergrootte
  • Verklein lettergrootte
Welkom bij OpenTaal

Wat is de juiste apostrof ?

E-mailadres Afdrukken PDF

Tot nu toe hebben we in de spellingcontrole steeds de ' gebruikt in woorden als: programma's.

Professionele schrijvers kiezen echter voor de nette, kromme apostrof. Dat ziet er ook mooier uit, maar typt een stuk lastiger in. Gelukkig passen (sommige)  tekstverwerkers de ' zelf aan in de nette apostrof ‘ . (Helaas deze waarmee het artikel wordt gemaakt niet.)

Uit de gedachtewisseling op de mailing list is duidelijk geworden dat er voor onze apostrof eigenlijk geen teken is gereserveerd in unicode! Deze groep adviseert om het aanhalingsteken sluiten te gebruiken. Onderscheid tussen vorm en functie wordt daar niet volledig gemaakt.

Momenteel doen we een experiment wat het betekent voor de verschillende gebruikende producten als we de spellingcontrole omzetten in utf-8, en de nette apostrof gebruiken.

Goede testgevallen zijn:

  • bureau's, wat altijd fout is (met wat voor apostrof ook), maar als de software foutief apart bureau en s aanlevert aan Hunspell, dan wordt het woord correct bevonden.
  • programmas, wat altijd fout is, en waarvoor de suggestie van programma's zou moeten geven (met de gekozen apostrof)
  • programma's (met de gekozen apostrof) dient altijd correct te worden bevonden

De resultaten tot nu toe zijn:

Testgeval Met normale 1.10 Met aangepaste 110
Mozilla (Tb+Ff) bureau's
ziet fout, suggereert bureaus
bureau’s ziet fout, geen suggestie
programma's acht dit correct
programma’s acht dit correct
programmas ziet fout, suggereert programma's ziet fout, suggereert  ’
OpenOffice.org bureau's ziet fout, suggereert bureaus
bureau’s ziet fout, suggereert bureaus
programma's acht dit correct
programma’s acht dit correct
programmas ziet fout, suggereert programma's
Google Chrome bureau's ziet fout niet
ziet fout niet
bureau’s ziet fout niet
ziet fout niet
programma's acht het goed
acht het goed
programma’s acht het goed
acht het goed
programmas ziet fout, suggereert programma's
ziet fout, suggereert programma’s
Opera bureau's ziet fout, suggereert bureaus ziet fout, suggereert bureaus
bureau’s ziet fout, suggereert bureaus ziet fout, suggereert bureaus
programma's acht dit correct acht dit fout, suggereert programma’s
programma’s acht dit fout, suggereert programma's acht dit goed
programmas ziet fout, suggereert programma's ziet fout, suggereert programma’s
Snow Leopard bureau's ziet fout niet ziet fout niet
bureau’s ziet fout niet ziet fout niet
programma's acht dit correct
programma’s acht dit correct
programmas ziet fout, suggereert programma's ziet fout, suggereert programma’s

In OpenOffice.org zit kennelijk een vertaling van de ene naar de andere apostrof; anders zijn de resultaten van 1.10 niet te verklaren. In elk geval gaat het grotendeels goed.

Bij Snow leopard lijkt het structureel fout te gaan. Beide typen apostrof worden niet als deel van het woord gezien. Dat is een gebrek in de software in de interface met Hunspell. Tijd voor een probleemmelding aan Apple. Joost doet hiertoe een poging.

Ook Chrome gaat structureel fout.. Tijd om een bug te melden. Die contacten hebben we wel.

 


 

Voorstel voor implementatie in toekomstige woordenlijsten:

1) elke teken dat veel als apostrof wordt gebruikt (', ’ en ´, mogelijk ook de ` ) accepteren als teken van woord, zodat bureau's, bureau’s en bureau´s fout worden gerekend.

2) De makers van de gebruikende software op hun verantwoordelijkheid wijzen.

Er is nog geen uniformiteit in de mening over:

3a) in de suggesties alleen de ’ aanbieden (Reinout)

3b) In de suggesties alleen de ' aanbieden en de rest aan de softwaremakers overlaten (Simon)

3c) Zowel de ' als de ’ aanbieden. (Jan)

 

acht dit fout, suggereert programma’s
Laatst aangepast op maandag, 08 februari 2010 08:18
 

Ongewenst gebruik van de site

E-mailadres Afdrukken PDF

Soms is er een gebruiker die slim denkt te zijn en alle pagina's van de OpenTaal-database te dupliceren met een script. Hierdoor brengt deze gebruiker de site in gevaar.

Ik heb net zo'n gebruiker laten blokkeren en zijn provider geïnformeerd over deze ongewenste werkwijze.

Mocht er behoefte zijn aan de gegevens van OpenTaal, ga ze dan niet op een dergelijke manier ophalen zonder toestemming, maar neem gewoon contact op via de mailing list of info(@)opentaal.org.

Gaat het om legale, bij voorkeur maatschappelijk betrokken doeleinden, dan vinden we altijd een modus. Zelfs als het doel commercieel is.

Laatst aangepast op zondag, 24 januari 2010 10:56
 

Persbericht: OpenTaal is een stichting

E-mailadres Afdrukken PDF

PERSBERICHT, d.d. 15-12-2009
OpenTaal (www.opentaal.org)
===============================

STICHTING OPENTAAL OPGERICHT

-- Vandaag (15 december 2009) is de Stichting OpenTaal opgericht. Deze
stichting heeft tot doel om het vrijwilligersproject OpenTaal te
ondersteunen en daarmee de ontwikkeling van vrije Nederlandstalige
taalhulpbestanden te stimuleren. De oprichting van de stichting is
mogelijk gemaakt door NLUUG, de Nederlandse vereniging voor
(professionele) gebruikers van Open Systemen en Open Standaarden. --

Met het oprichten van de Stichting OpenTaal beoogt het project zijn
activiteiten een solide basis te geven. Met organisaties zoals de
Nederlandse Taalunie en het Instituut voor Nederlandse Lexicologie
bestonden reeds goede banden. Door de stichting kunnen zulke vormen
van samenwerking worden uitgebreid en bestendigd. Daarnaast maakt de
stichtingsvorm het mogelijk om beter gebruik te maken van sponsoring
en subsidies.

Het project OpenTaal is vooral bekend door zijn Nederlandstalige
spellingwoordenlijst, die in veel opensourceprogramma's wordt
gebruikt, waaronder het kantoorpakket OpenOffice.org, de webbrowsers
Firefox en Google Chrome, en het e-mailprogramma Thunderbird. De lijst
bevat ongeveer 170.000 woorden en is voorzien van het Keurmerk
Spelling van de Nederlandse Taalunie. De woordenlijst heeft
ondertussen haar weg naar miljoenen eindgebruikers gevonden. Naast de
spellingwoordenlijst ontwikkelt OpenTaal een synoniemenlijst,
woordafbreekpatronen en materiaal voor grammaticacontrole.

Het project is eind 2005 ontstaan op initiatief van het
overheidsprogramma voor open standaarden en opensourcesoftware OSOSS
(nu: Nederland Open in Verbinding, NOiV). Vanaf het begin zijn er
leden van de Nederlandstalige TeX Gebruikersgroep (NTG) en van het
Nederlandstalige deel van het project OpenOffice.org bij betrokken.
OpenTaal heeft inmiddels goede banden met verschillende andere
Nederlandstalige afdelingen van opensourceprojecten, zoals NLLGG,
Debian, GNOME, KDE en Mozilla. Het geniet ondersteuning van sponsors
zoals KovoKs (webhosting) en Zarafa.

Binnen het project OpenTaal zijn tal van Nederlandse en Belgische
vrijwilligers, onder wie taalwetenschappers, actief. Wie zich
interesseert voor de activiteiten van het project is van harte welkom
om er aan deel te nemen.

Bronnen:
OpenTaal - http://www.opentaal.org/
NLUUG - http://www.nluug.nl/

Laatst aangepast op dinsdag, 15 december 2009 17:06
 

Voortgang oogsten

E-mailadres Afdrukken PDF

Op dit moment wordt door de gezamenlijk oogstroutines het volgende bereikt:

Harvester telt zo'n 1000 woorden per dag

Harvester en distributedHarvester melden samen 1500 nieuwe te oogsten pagina's en documenten per dag.

DistributedHarvester oogst 110.000 documenten per dag, wat 750.000 nieuwe zinnen per dag oplevert.

Hiervan worden er zo'n 250.000 per dag omgezet in zinvolle voorbeeldzinnen.

Al met al indrukwekkende getallen.

En toch, ondanks nadrukkelijk zoeken met Harvester, hebben we voor sommige woorden in onze lijst nog geen enkel voorbeeld gevonden. Dat betekent dat die woorden wel erg zeldzaam ziijn, mogelijk gelegenheidswoorden.

 

De tussen-s

E-mailadres Afdrukken PDF

De tussen-s in het Nederlands is een beetje een mysterie. Sommige woorden krijgen er altijd een , sommige nooit. Vreemd genoeg zelfs als het om dezelfde grensklanken gaat.

Toch is er ook regelmaat:

  • na een woord dat al een s heeft, komt nooit een tussen-s (regel van de leidraad van de Taalunie). fiets+test, geen fiets+s+test)
  • na een voorzetsel komt (bijna) nooit een tussen-s (af+stellen, niet af+s+stellen)
  • na een werkwoordstam komt nooit een tussen-s (loop+test, niet loop+s+test)
  • na -heid altijd een tussen-s
  • na -eit komt altijd een tussen-s
  • na -ing komt meestal een s als het gaat om een afleiding van een werkwoord, behalve bij belasting en een aantal andere uitzonderingen, waaronder de Engelse werkwoorden. (Maar ook bij belasting zijn er uitzonderingen die woordenlijst.org gehaald hebben.)

tenzij:

  • het einddeel begint met: schap, en schap de betekenis heeft van rol, functie
  • meer?

Met een analyse van de totale woordenschat probeer in nog meer grip te krijgen op deze materie. Dat is handig voor het beoordelen van woorden en het maken van correcte afbrekingen.

Na de analyse publiceren we de resultaten.

Laatst aangepast op maandag, 30 november 2009 14:47
 
Meer artikelen...


JPAGE_CURRENT_OF_TOTAL
Banner

Zoeken

Webopentaal.org