site.btaИзкуствен интелект помага за анализ на данни от медийно съдържание в реално време
Доц. д-р Пламен Милев
Катедра „Информационни технологии и комуникации“, УНСС – София
Представени са някои възможности за извършване на анализ на данни от медийно съдържание. Тези възможности са налични посредством приложението на иновативно софтуерно решение за пресклипинг. Използването на специализирани софтуерни инструменти в предметната област, които автоматизират някои от процесите, е от съществено значение, защото всяка стратегия започва с проучване, което включва мониторинг на публикациите в медиите, а и с оглед на съвременните разбирания за кризисен PR, където ситуацията може да се промени за минути, е от изключително значение да разполагаме със съответните възможности за проследяване на информационния поток от медиите.
Ако трябва да дефинираме някои от отличителните характеристики на съвременния прочит на пресклипинга, то несъмнено трябва да обърнем внимание на следните аспекти:
- пресклипингът трябва да покрива публикациите и коментарите в социалните медии, които в днешно време са много популярни и обикновено именно в социалните медии се появяват за първи път някои новини, които биха могли да се определят за сензационни;
- данните, които се предоставят за целите на пресклипинга, следва да са доколкото е възможно в реално време;
- при наличие на различна информация в различни медии за едно и също събитие, трябва да може да се установи кои от публикациите спадат към т.нар. фалшиви новини, както и да е възможно да се идентифицира първоизточника на съответната публикация с невярно съдържание;
- от съществена значимост са възможностите за автоматизирано оценяване на публикация или група от публикации, което е свързано със съответното класифициране като позитивна, негативна или неутрална публикация в контекста на съответната тематика.
Ако обърнем внимание на представения количествен анализ на данни от медийно съдържание за темите коронавирус и ваксина, за периода от месец януари 2020 г. до месец февруари 2021 г. вкл., при анализирани средномесечно 350 хил. публикации, можем да откроим следните закономерности в данните [1]:
- през месеците март и април 2020 г. почти половината от всички публикации са по темата за коронавирус;
- през месец ноември 2020 г. се наблюдава повторен пик на публикации по темата за коронавирус, като този път техният общ брой е около една трета от всички публикации;
- темата за ваксините набира популярност от месец декември 2020 г. насам, като през тримесечието декември 2020 г. – февруари 2021 г. броят на;
- публикациите по тази тема е около 10% от всички публикации.
В заключение следва да се отбележи, че предвид все по-големия брой на медии и съдържание в тях, е необходимо да се използват съвременни инструменти за работа с големите масиви от данни, като освен количествени анализи, които отличават някои тенденции в разпределението на данните, много актуални са и регионалните, сентимент и контент анализите.
[1] Източник на данни е дигиталната платформа за мониторинг и анализ на медийно съдържание MediaBoard.
УНСС
news.modal.header
news.modal.text