Российские ученые представили алгоритм, умеющий анализировать сообщения в соцсетях и определять, кто их написал – отличник или двоечник. Специалисты утверждают, что точность составляет 94%, пишет EPJ Data Science.
Исследователи предоставили для изучения нейросети посты в Twitter и ВКонтакте.
"Наша модель с точностью до 94% выявляла учащихся с высокой и низкой успеваемостью... Такой подход может быть полезен и для выявления депрессии, влияющей на учебные достижения", - заявил автор работы, заведующий лабораторией вычислительных социальных наук Института образования НИУ ВШЭ Иван Смирнов.
Ученый и его коллеги собрали и изучили сообщения, которые на своих страницах в ВКонтакте написали примерно 2,4 тысячи подростков, проходивших в 2012 году специальный тест на оценку грамотности и способности применять знания на практике.
Материал был предоставлен для тренировки нейросетям, которые проанализировали смысловое содержание и стилистику сообщений и сопоставили их с типичным уровнем образования и успеваемости людей, для которых характерны подобные интересы, знания и стиль написания.
В итоге нейросеть научилась довольно точно определять двоечников и отличников.
Отмечается, что отличникам характерны длинные тексты, связанные с литературой, физикой и описанием мыслительных процессов. Их сообщения богаты лексиконом и в них присутствуют иностранные слова.
А вот двоечники "удобряли" свои тексты в основном смайлами и словами, написанными заглавными буквами. Также эта категория пользователей сети чаще всего обсуждала гороскопы, ДТП и службу в армии.
"Наши результаты показали, насколько уязвима конфиденциальность пользователя в социальной сети. Люди переживают из-за вездесущих камер и систем распознавания лиц, однако, даже /…/ короткий текст, может стать источником информации, которую человек не собирался раскрывать", - резюмировали специалисты.
Почему вы можете доверять vesti-ua.net →
Читайте vesti-ua.net в Google News