System do kategoryzacji, oceny i moderacji treści internetowych dla nowych usług i doboru reklam (KOMTUR)
KOMTUR to nowa technologia wykorzystująca uczenie maszynowe do lepszego klasyfikowania treści i prowadzenia jej moderacji w serwisach internetowych.
Wyzwanie
Projekt ma na celu opracowanie nowej technologii wykorzystującej uczenie maszynowe, która pozwoli na lepszą klasyfikację i moderację treści w serwisach internetowych. Dzięki temu jakość zawartości na stronach internetowych zostanie poprawiona, a usługi reklamowe staną się bardziej atrakcyjne, co z kolei przyczyni się do wzrostu przychodów z reklam.
Serwis Wykop.pl będzie używał systemu KOMTUR do oceny wiarygodności, rodzaju i wydźwięku polskojęzycznych treści, co zwiększy efektywność ich modułu reklamowego. Dodatkowo, operatorzy polskich, współtworzonych przez użytkowników serwisów internetowych będą mogli poprzez API przypisać opublikowaną treść do kategorii oraz ją ocenić.
Co zrobiliśmy?
Rezultaty projektu mają potrójne zastosowanie. Po pierwsze – zgodnie z założeniami Szybkiej Ścieżki – beneficjentem jest lider projektu, serwis wykop.pl, który poprzez zastosowanie opracowanych w projekcie rozwiązań zwiększy swoje przychody z reklam, a także poprawi wrażenia użytkowników przez usprawnienie moderacji. Po drugie, dzięki oferowanemu komercyjnie API VaaS (Verification as a Service), inne redakcje (zwłaszcza portali opierających się na treściach dostarczanych przez użytkowników) uzyskają nowe narzędzie pozwalające szybko ocenić różnego rodzaju treści internetowe, uzyskując ostrzeżenia o kontrowersyjnej lub drastycznej zawartości, niskiej wiarygodności, negatywnym wydźwięku itp. Po trzecie, z wdrożenia opracowanych rozwiązań skorzystają zwykli użytkownicy polskiego internetu i to dwojako: pośrednio, dzięki poprawionej moderacji i selekcji treści w serwisie Wykop.pl i innych mediach korzystających z VaaS oraz bezpośrednio, dzięki udostępnieniu publicznie dostępnego narzędzia o funkcjonalności podobnej do VaaS, umożliwiającego manualne sprawdzanie pojedynczych stron przez formularz WWW.
Istotną zaletą projektu jest jego głębokie osadzenie w polskim internecie. Tworzone klasyfikatory uczone są na danych z polskiego portalu, przez co uwzględniają kulturową specyfikę tej społeczności, a przede wszystkim analizują język polski w warstwie tekstowej. W ten sposób KOMTUR wypełnia istotną lukę na polskim rynku, który oferuje wiele elementów deklarowanej funkcjonalności rozwiązania wyłącznie dla języka angielskiego.
Podsumowując zbliżającą się do końca fazę badawczą projektu, trzeba przyznać, że udało się osiągnąć bardzo interesujące wyniki, zarówno w klasyfikacji obrazu, wideo, jak i tekstu. W szczególności badania nad klasyfikacją komentarzy z serwisu wykop.pl przyniosły wiele interesujących wniosków, które wkrótce ukażą się w publikacjach. Modele wykorzystywane do klasyfikacji po ponad roku prac rozwojowych osiągnęły wysoką skuteczność. Z niecierpliwością oczekujemy więc wdrożenia opracowanych rozwiązań, gdyż przewidujemy ich wysoką użyteczność. Wdrożenie testowe zintegrowanego systemu nastąpi jeszcze w 2023 roku, a na początku następnego roku system zostanie wdrożony w warunkach docelowych, zacznie przynosić korzyści serwisowi wykop.pl, a usługa VaaS stanie się dostępna dla użytkowników jako komercyjne API i publiczny serwis WWW.