Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
https://krs.chmnu.edu.ua/jspui/handle/123456789/3756
Назва: | Система виявлення фейкових новин |
Інші назви: | кваліфікаційна робота на здобуття освітнього ступеня «магістр» : спец. 121 «Інженерія програмного забезпечення» |
Автори: | Гончар, А. А. |
Ключові слова: | кафедра інженерії програмного забезпечення Антіпова К. О. інженерія програмного забезпечення машинне навчання фейкові новини нейронні мережі deberta-v3 обробка природної мови класифікація тексту мікросервісна архітектура machine learning fake news neural networks natural language processing text classification microservice architecture |
Дата публікації: | гру-2024 |
Видавництво: | ЧНУ ім. Петра Могили |
Короткий огляд (реферат): | В умовах глобальної цифровізації та стрімкого розвитку соціальних мереж проблема поширення фейкових новин набуває особливої актуальності. Дезінформація становить серйозну загрозу для суспільства, впливаючи на прийняття рішень та формування громадської думки, особливо під час кризових ситуацій та виборчих кампаній. Об'єктом дослідження є процес автоматизованої верифікації інформаційного контенту. Предметом дослідження виступають методологічні підходи та алгоритмічні рішення у сфері машинного навчання для багаторівневої класифікації текстового контенту. Метою роботи є покращення точності розпізнавання фейків шляхом розробки системи виявлення фейкових новин на основі інтеграції передових алгоритмів глибокого машинного навчання та комп'ютерної лінгвістики. Для досягнення поставленої цілі було визначено наступні завдання: – дослідження різних підходів і моделей машинного навчання для задачі визначення фейкових новин, аналіз їх ефективності, переваг та недоліків; – вивчення основних ознак, які можуть свідчити про неправдивість новинного контенту; – моделювання архітектури та функціональних елементів системи; – проєктування програмного забезпечення з урахуванням вимог; – навчання моделі машинного навчання, оптимізованої для задачі класифікації новинного контенту; перевірка функціональності та оцінка точності системи на основі реальних новинних даних, аналіз результатів та визначення напрямків для вдосконалення. У першому розділі проведено ґрунтовний аналіз сучасних методів виявлення фейкових новин, досліджено актуальні рішення та системи-аналоги, сформульовано функціональні та нефункціональні вимоги до розроблюваної системи. Окрема увага приділена специфікації програмного забезпечення та визначенню ключових технічних характеристик. Другий розділ присвячено детальному моделюванню системи з використанням UML-діаграм. Розроблено діаграми варіантів використання, що відображають взаємодію користувачів з системою, діаграми діяльності для візуалізації бізнес-процесів та діаграми послідовностей для демонстрації обміну повідомленнями між компонентами системи. У третьому розділі представлено архітектурне рішення системи, обґрунтовано вибір технологій та інструментів розробки. Детально описано особливості обраної моделі DeBERTa-v3, її переваги для задачі класифікації текстів та процес оптимізації гіперпараметрів. Окремо розглянуто технологічний стек для серверної та клієнтської частин системи. Четвертий розділ містить комплексний опис процесу реалізації системи, включаючи підготовку даних, навчання моделей машинного навчання, розробку серверної та клієнтської частин. Представлено результати порівняльного аналізу ефективності різних моделей та детальні результати модульного тестування, що підтверджують надійність та стабільність розробленого рішення.Робота містить 108 сторінок, 31 рисунків, 45 таблиці та 2 додатки. При написанні роботи використано 17 джерел. In the context of global digitalization and rapid social media development, the problem of fake news proliferation becomes increasingly critical. Disinformation poses a serious threat to society, influencing decision-making and public opinion formation, especially during crises and election campaigns. The object of research is the process of automated verification of information content. The subject of research encompasses methodological approaches and algorithmic solutions in machine learning for multilevel text content classification. The aim of the thesis is to improve fake news detection accuracy by developing a system based on the integration of advanced deep learning algorithms and computational linguistics. To achieve this goal, the following tasks were defined: – researching various approaches and machine learning models for the task of identifying fake news, analyzing their effectiveness, advantages, and disadvantages; – studying the main features that may indicate the falsity of news content; – modeling the architecture and functional elements of the system; – designing software with consideration of requirements; – training a machine learning model optimized for the task of classifying news content; – testing the functionality and evaluating the accuracy of the system based on real news data, analyzing the results, and identifying directions for improvement. The first chapter provides a thorough analysis of modern fake news detection methods, examines current solutions and analogous systems, and formulates functional and non-functional requirements for the system under development. Special attention is paid to software specifications and defining key technical characteristics. The second chapter is devoted to detailed system modeling using UML diagrams. Use case diagrams illustrating user interaction with the system, activity diagrams for business process visualization, and sequence diagrams demonstrating message exchange between system components have been developed. The third chapter presents the system's architectural solution and justifies the choice of technologies and development tools. The features of the chosen DeBERTa-v3 model, its advantages for text classification tasks, and the hyperparameter optimization process are described in detail. The technology stack for both server and client parts of the system is separately considered. The fourth chapter contains a comprehensive description of the system implementation process, including data preparation, machine learning model training, and server and client-side development. The results of comparative analysis of different models' effectiveness and detailed unit testing results are presented, confirming the reliability and stability of the developed solution. The work contains 108 pages, 31 figures, 45 tables, and 2 appendices. 17 sources were used in writing the thesis. |
Опис: | Гончар А. А. Система виявлення фейкових новин : кваліфікаційна робота на здобуття освітнього ступеня «магістр» : спец. 121 «Інженерія програмного забезпечення» / А. А. Гончар ; ЧНУ ім. Петра Могили. - Миколаїв, 2024. - 102 с. |
URI (Уніфікований ідентифікатор ресурсу): | https://krs.chmnu.edu.ua/jspui/handle/123456789/3756 |
Розташовується у зібраннях: | Факультет комп'ютерних наук |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
Кваліфікаційна робота Гончар.pdf | 2.82 MB | Adobe PDF | Переглянути/Відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.