Existing applicants/evaluators log in here
Username
Password
Cooperability
Project leader: Bojana Dalbelo Bašić
Project co-leader: Nataša Milić-Frayling
Administering organization: University of Zagreb Faculty of Electrical Engineering and Computing
Partner Institution/Company: Queen Mary’s University in London
Grant type: 1B
Project title: Event Retrieval Based on Semantically Enriched Structures for Interactive User Tasks (EVERBEST)
Project summary: News stories revolve around events, their protagonists, circumstances, backgrounds, and implications. Online news consumption has become the predominant way of news consumption. With the availability of tremendous amount of news content online, the technical challenge now lies in providing event-oriented search and recommendation capabilities that meet the diverse information needs. From an information retrieval (IR) perspective, the key issue is to devise an effective event representation model. Existing research opted for a priori event representations, seemingly intuitive for the application at hand, but not grounded in users’ understanding of an event nor aligned with their event consumption habits. In EVERBEST, we aim to to develop novel techniques and models for event-oriented search and recommendation grounded in event consumption habits. Consumption of online news is essential for shaping one’s perspective and public opinion, thus having impact on the society as a whole, and critical for a range of businesses. We will therefore focus on three different aspects: support for authoring news (by journalists), news analysis in a specific sector, and news consumption by public. We anticipate that they differ in the level of analysis that need to be supported and interaction models, but share the common framework for representing and analysing events. We will adopt an empirical approach and conduct a systematic user study to discover how users approach two broad types of event-oriented tasks: search by example and searching via exploratory queries. As the users may be engage in search at any point in the life-cycle of an evolving event, and may be interested in different aspects of it, our primary goal is to devise a method that interactively refines user’s initial query and incrementally synthesizes the search task. To this end, we will model information-seeking tasks via a set of generalization/specialization operators defined over semantic event representations derived from documents, inspired by recent advances in program synthesis research. We will consider event representations of varying complexity, including structured representations obtained using natural processing (NLP) and machine learning techniques, as well as corresponding sets of transformation operators, to determine the optimal configuration with respect to the use cases. Finally, we will devise a prototype event search and recommendation engine as an extension of the EventRegistry, a platform for large-scale collection and indexing of news. By integrating findings from three research areas (NLP, IR, and program synthesis), our research may open the way for uncovering new paradigms in digital content analysis.
Hrvatski sažetak: Vijesti se tiču događaja, njihovih protagonista, okolnosti, pozadinskih informacija i implikacija koje događaji imaju. Prevladavajući način konzumacije vijesti jest onaj putem interneta. S obzirom na ogromnu količinu vijesti dostupnih na internetu, kao tehnički se izazov nameće omogućavanja pretraživanja i preporučivanja događaja koje bi zadovoljilo informacijske potrebe različitih vrsta korisnika. S gledišta pretraživanja informacija (IR), ključno je osmisliti učinkovite reprezentacije događaja. Ranija su se istraživanja oslanjala na apriorne reprezentacije događaja, koje su se u kontekstu dotičnog zadatka možda činile intuitivnima, međutim nisu se temeljile na poimanju događaja kakvo imaju korisnici, niti su bile usklađene s njihovim konzumacijskim navikama. Cilj projekta EVERBEST jest razvoj novih tehnika i modela za pretraživanje i preporučivanje događaja, temeljenih na analizi načina na koji korisnici konzumiraju vijesti o događajima. Konzumacija vijesti bitna je za oblikovanje naših stajališta i javnoga mnijenja, stoga utječe na društvo u cjelini, kao i na niz specifičnih poslovnih segmenata. Zbog toga ćemo se u projektu usredotočiti na tri različita aspekta: podrška za stvaratelje vijesti (novinari), analiza vijesti u specifičnome sektoru te konzumacija vijesti od strane javnosti. Očekujemo da se ovi aspekti razlikuju u dubini analize i interakcijskim modelima koje iziskuju, ali i da dijele radni okvir za prikaz i analizu događaja. Usvojit ćemo empirijski pristup te provesti korisničku studiju kako bismo utvrdili na koji način korisnici pristupaju rješavanju dvaju vrlo općenitih zadataka usmjerenih događajima: pretraživanje temeljeno na primjerima te eksplorativno pretraživanje. Budući da korisnici svoje pretraživanje mogu započeti u bilo kojem trenutku razvoja događaja, te da mogu biti zainteresirani za različite aspekte događaja, naš je osnovni cilj razviti postupak za interaktivno obogaćivanje početnoga korisničkog upita te postupnu sintezu pretraživačkog zadatka. Inspirirani dostignućima u području sinteze programa, pretraživački ćemo zadatak modelirati skupom operatora poopćenja/specijalizacije, definiranima nad semantičkim prikazima događaja izvedenim iz dokumenata. Razmotrit ćemo reprezentacije događaja različite složenosti, uključujući strukturirane reprezentacije dobivene primjenom tehnika obrade prirodnoga jezika (NLP) i strojnog učenja, kao i odgovarajuće operatore, kako bismo utvrdili optimalnu kombinaciju s obzirom na razmatrane slučajeve. Konačno, razvit ćemo prototip sustava za pretraživanje i preporučivanje događaja te njime proširiti funkcionalnost sustava EventRegistry, platforme za prikupljanje i indeksiranje velikih količina vijesti. Budući da objedinjava rezultata istraživanja iz triju područja (NLP, IR i sinteza programa), ovo istraživanje ima potencijala razotkriti posve nove paradigme u analizi digitalnog sadržaja.
Amount requested from UKF: 861.000,00
Amount of matching funding: 451.450,00
Powered by Globaladmin