{"id":29,"date":"2019-10-22T09:13:00","date_gmt":"2019-10-22T09:13:00","guid":{"rendered":"http:\/\/komma.projects.unibz.it\/?page_id=29"},"modified":"2021-03-05T09:17:39","modified_gmt":"2021-03-05T08:17:39","slug":"datenaufbereitung","status":"publish","type":"page","link":"https:\/\/komma.projects.unibz.it\/?page_id=29","title":{"rendered":"Datenaufbereitung"},"content":{"rendered":"\r\n<p><span style=\"font-family: times new roman,times,serif; font-size: 14pt;\"><strong>Datenaufbereitung<\/strong><\/span><\/p>\r\n<p><span style=\"font-family: times new roman,times,serif;\">\r\n\r\n<\/span><\/p>\r\n<p><span style=\"font-family: times new roman,times,serif;\">Das kostenlose Transkriptionsprogramm ELAN (https:\/\/archive.mpi.nl\/tla\/elan, Max Planck Institute) erm\u00f6glicht die Transkription von Audio- und Videodateien, die anschlie\u00dfend bearbeitet, annotiert und durchsucht werden k\u00f6nnen. <span style=\"font-family: times new roman,times,serif;\">F\u00fcr das POS-Tagging und die Lemmatisierung wurden der Tree-Tagger und das Stuttgart-T\u00fcbingen-TagSet (STTS) verwendet.<\/span><\/span><\/p>\r\n<p><span style=\"font-family: times new roman,times,serif;\">Nachdem die schriftlichen Daten transliteriert wurden, wurden sie in ELAN importiert, manuell normalisiert, automatisch tokenisiert, lemmatisiert und POS-getaggt (Klassifizierung nach Wortarten).<\/span><\/p>\r\n<p><span style=\"font-family: times new roman,times,serif;\">\r\n\r\n<\/span><\/p>\r\n<p><span style=\"font-family: times new roman,times,serif;\">Nach der Transkription der m\u00fcndlichen Daten erfolgte auf der Ebene der manuellen Normalisierung die automatische Tokenisierung, wobei die einzelnen Tokens wiederum automatisch in Lemmata und Wortarten klassifiziert wurden.<\/span><\/p>\r\n<p><span style=\"font-family: times new roman,times,serif;\">\r\n\r\n<\/span><\/p>\r\n\r\n\r\n","protected":false},"excerpt":{"rendered":"<p>Datenaufbereitung Das kostenlose Transkriptionsprogramm ELAN (https:\/\/archive.mpi.nl\/tla\/elan, Max Planck Institute) erm\u00f6glicht die Transkription von Audio- und Videodateien, die anschlie\u00dfend bearbeitet, annotiert und durchsucht werden k\u00f6nnen. F\u00fcr das POS-Tagging und die Lemmatisierung wurden der Tree-Tagger und das Stuttgart-T\u00fcbingen-TagSet (STTS) verwendet. Nachdem die schriftlichen Daten transliteriert wurden, wurden sie in ELAN importiert, manuell normalisiert, automatisch tokenisiert, lemmatisiert und POS-getaggt (Klassifizierung nach Wortarten). Nach der Transkription der m\u00fcndlichen Daten erfolgte auf der Ebene der manuellen Normalisierung die automatische Tokenisierung, wobei die einzelnen Tokens wiederum automatisch in Lemmata und Wortarten klassifiziert wurden.<\/p>\n","protected":false},"author":4,"featured_media":0,"parent":6,"menu_order":2,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-29","page","type-page","status-publish","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.6 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Datenaufbereitung - demo.unibz.it<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/komma.projects.unibz.it\/?page_id=29\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Datenaufbereitung - demo.unibz.it\" \/>\n<meta property=\"og:description\" content=\"Datenaufbereitung Das kostenlose Transkriptionsprogramm ELAN (https:\/\/archive.mpi.nl\/tla\/elan, Max Planck Institute) erm\u00f6glicht die Transkription von Audio- und Videodateien, die anschlie\u00dfend bearbeitet, annotiert und durchsucht werden k\u00f6nnen. F\u00fcr das POS-Tagging und die Lemmatisierung wurden der Tree-Tagger und das Stuttgart-T\u00fcbingen-TagSet (STTS) verwendet. Nachdem die schriftlichen Daten transliteriert wurden, wurden sie in ELAN importiert, manuell normalisiert, automatisch tokenisiert, lemmatisiert und POS-getaggt (Klassifizierung nach Wortarten). Nach der Transkription der m\u00fcndlichen Daten erfolgte auf der Ebene der manuellen Normalisierung die automatische Tokenisierung, wobei die einzelnen Tokens wiederum automatisch in Lemmata und Wortarten klassifiziert wurden.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/komma.projects.unibz.it\/?page_id=29\" \/>\n<meta property=\"og:site_name\" content=\"demo.unibz.it\" \/>\n<meta property=\"article:modified_time\" content=\"2021-03-05T08:17:39+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/komma.projects.unibz.it\\\/?page_id=29\",\"url\":\"https:\\\/\\\/komma.projects.unibz.it\\\/?page_id=29\",\"name\":\"Datenaufbereitung - demo.unibz.it\",\"isPartOf\":{\"@id\":\"http:\\\/\\\/komma.projects.unibz.it\\\/#website\"},\"datePublished\":\"2019-10-22T09:13:00+00:00\",\"dateModified\":\"2021-03-05T08:17:39+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/komma.projects.unibz.it\\\/?page_id=29#breadcrumb\"},\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/komma.projects.unibz.it\\\/?page_id=29\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/komma.projects.unibz.it\\\/?page_id=29#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"http:\\\/\\\/komma.projects.unibz.it\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Datenmaterial und Methodisches\",\"item\":\"https:\\\/\\\/komma.projects.unibz.it\\\/?page_id=6\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Datenaufbereitung\"}]},{\"@type\":\"WebSite\",\"@id\":\"http:\\\/\\\/komma.projects.unibz.it\\\/#website\",\"url\":\"http:\\\/\\\/komma.projects.unibz.it\\\/\",\"name\":\"demo.unibz.it\",\"description\":\"Just another WordPress site\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"http:\\\/\\\/komma.projects.unibz.it\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-US\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Datenaufbereitung - demo.unibz.it","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/komma.projects.unibz.it\/?page_id=29","og_locale":"en_US","og_type":"article","og_title":"Datenaufbereitung - demo.unibz.it","og_description":"Datenaufbereitung Das kostenlose Transkriptionsprogramm ELAN (https:\/\/archive.mpi.nl\/tla\/elan, Max Planck Institute) erm\u00f6glicht die Transkription von Audio- und Videodateien, die anschlie\u00dfend bearbeitet, annotiert und durchsucht werden k\u00f6nnen. F\u00fcr das POS-Tagging und die Lemmatisierung wurden der Tree-Tagger und das Stuttgart-T\u00fcbingen-TagSet (STTS) verwendet. Nachdem die schriftlichen Daten transliteriert wurden, wurden sie in ELAN importiert, manuell normalisiert, automatisch tokenisiert, lemmatisiert und POS-getaggt (Klassifizierung nach Wortarten). Nach der Transkription der m\u00fcndlichen Daten erfolgte auf der Ebene der manuellen Normalisierung die automatische Tokenisierung, wobei die einzelnen Tokens wiederum automatisch in Lemmata und Wortarten klassifiziert wurden.","og_url":"https:\/\/komma.projects.unibz.it\/?page_id=29","og_site_name":"demo.unibz.it","article_modified_time":"2021-03-05T08:17:39+00:00","twitter_card":"summary_large_image","schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/komma.projects.unibz.it\/?page_id=29","url":"https:\/\/komma.projects.unibz.it\/?page_id=29","name":"Datenaufbereitung - demo.unibz.it","isPartOf":{"@id":"http:\/\/komma.projects.unibz.it\/#website"},"datePublished":"2019-10-22T09:13:00+00:00","dateModified":"2021-03-05T08:17:39+00:00","breadcrumb":{"@id":"https:\/\/komma.projects.unibz.it\/?page_id=29#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/komma.projects.unibz.it\/?page_id=29"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/komma.projects.unibz.it\/?page_id=29#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"http:\/\/komma.projects.unibz.it\/"},{"@type":"ListItem","position":2,"name":"Datenmaterial und Methodisches","item":"https:\/\/komma.projects.unibz.it\/?page_id=6"},{"@type":"ListItem","position":3,"name":"Datenaufbereitung"}]},{"@type":"WebSite","@id":"http:\/\/komma.projects.unibz.it\/#website","url":"http:\/\/komma.projects.unibz.it\/","name":"demo.unibz.it","description":"Just another WordPress site","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"http:\/\/komma.projects.unibz.it\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"}]}},"_links":{"self":[{"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=\/wp\/v2\/pages\/29","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=29"}],"version-history":[{"count":13,"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=\/wp\/v2\/pages\/29\/revisions"}],"predecessor-version":[{"id":427,"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=\/wp\/v2\/pages\/29\/revisions\/427"}],"up":[{"embeddable":true,"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=\/wp\/v2\/pages\/6"}],"wp:attachment":[{"href":"https:\/\/komma.projects.unibz.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=29"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}