Innoverende aspecten

Er zijn reeds een aantal woordpredictors op de markt. Deze werden echter vooral voor het Engels ontwikkeld, hetgeen betekent dat ze niet gemakkelijk toepasbaar zijn op morfologisch rijke talen zoals Nederlands, Frans, Duits en Zweeds. Zou men enkel de Engelstalige woordenboeken van deze bestaande systemen vervangen, dan zou dit een grote vermindering van de efficiëntie van het systeem betekenen. Dit effect wordt veroorzaakt door de eerder simpele taaldescriptie die wordt gebruikt voor het voorspellen van Engelstalige teksten en die geenszins de correcte morfologische vormen van een woord in een inflectionele taal kan voorspellen. De Engelse taaldescriptie houdt immers enkel rekening met frekwentiedata over geïsoleerde woorden (unigrammen) en sekwenties van woorden (bigrammen, trigrammen). Men heeft wel geprobeerd in experimentele systemen om voor het Zweeds en het Spaans een meer uitgebreide taaldescriptie te gebruiken, waarbij n-grammen en syntactische grammatica's gebruikt werden. De experimenten van deze projecten werden herbruikt in het FASTY-project. Ze laten echter niet toe om een aanslagbesparing van meer dan 50% te realiseren voor de FASTY-talen. Een bijkomend probleem met de meeste van de FASTY-talen is het feit dat nieuwe samenstellingen vrij kunnen gemaakt worden, hetgeen het streven naar een volledig lexicon hopeloos maakt. Andere methodes moeten dus gebruikt worden als men wil omgaan met dynamische woordvormingsprocessen. Het is belangrijk dat het systeem kan omgaan met nieuwe samenstellingen, aangezien deze meestal nogal lange woorden zijn en als men ze niet kan voorspellen dan zal de aanslagbesparing gevoelig dalen. Aangezien op dit moment geen enkel woordpredictiesysteem met samenstellingen kan omgaan, is dit aspect van FASTY een ware nieuwe ontwikkeling.

Algemeen gezien kan men de nieuwe ontwikkeling binnen FASTY zo voorstellen:

De vernieuwende aard van het FASTY-systeem is vooral terug te vinden in volgende eigenschappen:

Naar FASTY's DoelstellingenNaar FASTY's Contacten