Välkommen till Språkteknologigruppen på KTH:s API för satsextraktion!För fler verktyg, se sidan med Språkteknologigruppens verktyg Program som använder satsextraktionOm du skriver ett program som anropar vår parsningstjänst kan du använda POST och denna URL: "POST https://skrutten4.sys.kth.se/granskaapi/clause.php" med texten i kroppen till postningen. För ett exempel på hur det kan se ut och vilka olika valmöjligheter som finns kan du titta på källkoden till denna hemsida och se hur formuläret nedan gör. Om du istället för satser är intresserad av fraser finns en variant av denna tjänst som matar ut fraser istället tillgänglig här: https://skrutten4.sys.kth.se/granskaapi/chunk. Det finns även en tjänst som matar ut all information från Granskas parser, inklusive fraser och satsgränser: https://skrutten4.sys.kth.se/granskaapi/parse.php. Vad betyder utmatningen?Om vi analyserar meningen "Jag skriver text och datorn parsar meningarna." får vi tillbaka följande utmatning: Jag, CLB Det ska tolkas såhär:
Det finns ingen explicit markör för att en sats är slut. Att en sats är slut anges implicit av att det inte följer fler taggar med "I" för inside. I exemplet ovan finns det således en sats "Jag skriver text", eftersom "Jag" har en tagg "CLB" som alltså betyder "här börjar en sats" och orden "skriver text" har taggar "CLI" som alltså betyder "fortsättning på en redan påbörjad fras". Det finns också en fras "och datorn parsar meningarna", eftersom ordet "och" har taggen "CLB" ("här börjar en ny fras") och de följande orden alla har "CLI". Att ordet "och" inte har någon "CLI"-tagg indikerar också att den tidigare frasen ("Jag skriver text") är slut. Utförlig information om Granskas parser finns i denna artikel (PDF). Ett formulär att testa med |