В Московском Политехе представили эффективный метод защиты электронной почты от нежелательных сообщений
На II Международном научно-практическом семинаре «Цифровизация общества: современные состояния и перспективы», который проходил в Московском Политехе, докторант 3-го курса обучения кафедры «Криптология» Ташкентского университета информационных технологий имени Мухаммада ал-Хоразмий Шерзод Хамидов представил инновационный ансамблевый метод повышения эффективности защиты почтовых сервисов от нежелательных сообщений.
Электронная почта является одним из наиболее широко используемых средств коммуникации в современном мире. Помимо обмена сообщениями, она используется для хранения данных, синхронизации устройств и создания учетных записей на различных онлайн-сервисах, включая платежные системы и онлайн-банкинг. Однако эта популярность также привлекает внимание киберпреступников, которые рассылают нежелательные и вредоносные письма с целью кражи конфиденциальной информации и получения доступа к учетным записям пользователей.
Ансамблевый подход в машинном обучении заключается в комбинировании нескольких моделей классификации для повышения точности и надежности результатов. В случае защиты электронной почты от спама и вредоносных писем, ансамблевый метод позволяет использовать преимущества различных алгоритмов классификации, компенсируя их недостатки и повышая общую эффективность системы.
В отличие от традиционных методов защиты, таких как фильтрация по ключевым словам или черные списки отправителей, ансамблевый подход, предложенный Шерзодом Хамидовым, учитывает множество характеристик электронных писем, включая структуру и содержание текста, метаданные и поведенческие паттерны отправителей. Это позволяет более точно идентифицировать нежелательные сообщения и минимизировать количество ложных срабатываний.
Особое внимание в разработанном методе уделяется предварительной обработке текстовых данных, которая включает в себя токенизацию (разбиение текста на отдельные слова или токены), удаление стоп-слов (наиболее часто встречающихся и не несущих смысловой нагрузки слов), стемминг (приведение слов к их основе) и векторизацию (представление текста в виде числовых векторов для машинного обучения).
«Наш ансамблевый метод показал высокую эффективность в задаче классификации электронных писем, превосходя существующие решения по точности и скорости обработки данных. Он может быть легко интегрирован в почтовые сервисы и системы защиты от спама, обеспечивая надежную защиту пользователей от фишинговых атак, кражи личных данных и финансовых потерь», — отметил Шерзод Хамидов.
Справка: семинар, на котором представили разработку, был организован Московским Политехом в сотрудничестве с Грозненским государственным нефтяным техническим университетом имени академика М. Д. Миллионщикова, Ташкентским университетом информационных технологий имени Мухаммада ал-Хоразмий и «Центром развития цифрового образования» при Министерстве цифровых технологий Республики Узбекистан. Руководитель семинара профессор Ю.Н.Филиппович подчеркнул важность подобных мероприятий для укрепления научного сотрудничества между странами.