Arbeitspaket 1a: Entwicklung eines Facebook-Crawlers

Europäische Union: Investitionen in unsere Zukunft - Europäischer Fonds für regionale Entwicklung EFRE.NRW 2014-2020: Invesitionen in Wachstum und Beschäftigung

In diesem Arbeitspaket soll ein Programm entwickelt werden, dass automatisiert Veranstaltungs- und Locationdaten aus einer HTML-Website auslesen kann, die diese Inhalte nach dem Rich-Snippets-Standard auszeichnet. Das Programm soll sich die Daten ausgehend von einer vorgegebenen Domain automatisch erschließen. Z.B. über das Auslesen einer XML-Sitemap. Die erfassten Datensätze sollen automatisch in regelmäßigen Abständen auf Änderungen kontrolliert werden. Das automatisierte Erschließung weiterer Datenquellen (crawling von verlinkten Websites) ist zunächst nicht vorgesehen.

 

Read more about the project, that leads to the findings, we share on this page.