Linguistic Development Kit (LDK)

Maak oplossingen waar uw klanten van dromen

Elke module is op zich een efficiënte tool voor het verwerken van taal, documenten of namen. Combineer de modules en geniet van krachtige meertalige capaciteiten voor data mining of semantische zoekoplossingen.

Wat uw eindklanten ook nodig hebben (eDiscovery en digitaal forensisch onderzoek, OSINT- of COMINT-analyse, kennis van concurrentie en marketing, monitoring van e-reputation, gevoelsanalyse voor meer inzicht in klanten), SYSTRAN's LDK biedt u de mogelijkheden om zowel gestructureerde als niet-gestructureerde meertalige content te gebruiken en te analyseren, bijvoorbeeld door de gebruiker gegenereerde content, sociale media, webinhoud enz.

Nu kunt u krachtige oplossingen voor data mining of intelligence bouwen voor uw klanten die houden van innovatie!

Documenten filteren

Importeer verschillende documentformaten om ze te verwerken in andere modules en importeer nieuwe samenstellingen van het document in het oorspronkelijke formaat met gewijzigde of inhoud met aantekeningen en met behoud van lay-out.

Taalherkenning

Herkent automatisch in welke taal documenten geschreven zijn door specifieke woord- of zinssjabloondetectie.

Segmentering en tokenization

Segmenteert tekst in zinnen en zinnen in "tokens" (minimale verwerkingseenheden).

Taalnormalisatie

Normaliseert tekst uit blogs, e-mails, chatforums en door de gebruiker gemaakte content en corrigeert gebruikelijke fouten en taalafwijkingen.

Documentclassificatie

Bepaalt het "documentdomein" op basis van vooraf gedefinieerde modellen en toont "hot topic" sleutelwoorden.

Herkenning van entiteiten met een naam

Op basis van de analyse van de documentinhoud herkent en toont de module automatisch persoonsnamen, locaties, cijfers, data en bedrijfsnamen.

Woordenboek

Maakt zoeken in een- en tweetalige woordenboeken mogelijk, met bijkomende contextuele informatie zoals frequentie van betekenissen, domeinen en contexten, uitdrukkingen en voorbeelden.

Morfologische analyse

Maakt morfologische analyse mogelijk voor individuele woorden en maakt een lijst van mogelijke lemmata en woordsoorten voor een verbogen form.

Syntactische analyse

Maakt syntactische analyse mogelijk op zinsniveau, met de niveaus van linguïstische analyse: woordherkenning, tagging van woordsoorten, afhankelijkheidsanalyse en analyse van zinsdelen.

Transliteratie

Maakt een transcriptie en transliteratie van woorden of entiteiten tussen talen met verschillende scripts en detecteert de oorsprong van eigennamen.

WSD (Word Sense Disambiguation)

Selecteert de beste betekenis van een woord, afhankelijk van de context.

Ondersteunde besturingssystemen zijn: Windows, Linux, Mac OS, iOS, Android.

*Verplichte velden

We respect your privacy, and will use this information only for contact purposes.