Facebook знает все: что расскажут о заемщике его профили в социальных сетях?
Возрастающая конкуренция на рынке кредитных организаций побуждает банки и МФО использовать любые методы оптимизации работы с клиентами. В первую очередь, речь идет о стремлении кредиторов сузить «серую зону» клиентов, то есть минимизировать число заемщиков с неоднозначной кредитной историей. Для получения дополнительных данных банки рады использовать любой релевантный источник информации. Последним трендом оценки кредитоспособности заемщика является скоринг по популярным социальным сетям: широкое поле для анализа дают анкеты пользователей на Facebook, ВКонтакте, Одноклассниках, Моем мире, а также аккаунты в Twitter. Одним из первых сервисов, предоставляющих финансовым организациям услуги по скорингу в соцсетях, стал проект Sociohub. ФИНКАРТА и FinDigest поговорили с его основателями и выяснили, как работает подобный вид скоринга и что может рассказать о заемщике его профиль в сети.
Основной принцип скоринга по социальным сетям кроется в объединении данных о пользователе из его различных аккаунтов на основе алгоритма матчинга профилей. То есть, скоринговая программа ищет страницы, принадлежащие одному и тому же человеку, сопоставляет, индексирует и обобщает всю информацию о нем. На основе полученных данных строится аналитическое поле: заказчик узнает, в каком городе родился и проживает клиент, есть ли у него высшее образование, каков спектр его социальных связей, и даже как часто он ездит путешествовать. Итог анализа предоставляется финансовым организациям либо в виде обобщенного профиля (для использования в маркетинговых целях), либо в виде скорингового балла (для принятия решения по выдаче кредита). Предоставляемая информация может быть полезна и для эффективного взыскания задолженности.
В той или иной степени, влияние на портрет заемщика оказывают практически все данные, которые он оставляет на своей странице. Программа анализирует круг ближайших друзей пользователя, образование и место работы, вектор его интересов, количество постов, время и продолжительность посещения сети и даже использование жаргонной и ненормативной лексики. «Банки стремятся узнать, чем интересуется человек, чтобы выстраивать в его отношении особую маркетинговую политику, - рассказывает один из основателей сервиса Sociohub Александр Федосеев, -Например, данные геолокации, фотографии и тематические сообщества помогут банку выяснить, в какое время года и куда клиент предпочитает путешествовать, и предложить ему для этих целей кредит».
Между тем, параметра, который бы оказывал на портрет пользователя доминирующее влияние, в системе нет. «Объективную картину можно получить, только если соединить все данные, полученные о пользователе, и объединить их с другими массивами поведенческих данных, например, накапливаемых в «Финкарте». Цель же нашей работы – выявить поведенческий профиль заемщика и определить вероятность дефолта по его кредиту. При переводе в аналитическую модель на вероятность дефолта будут указывать совершенно конкретные переменные» - утверждает Александр Федосеев.
Скажи мне, кто твой друг
Но как же система распознает мошенников или потенциально неплатежеспособных клиентов, используя данные из социальных сетей? Один из способов поиска как преступников, так и возможных дефолтников – анализ социальных связей. Если среди друзей пользователя велик процент уже установленных банком неплательщиков, его оценка меняется не в лучшую сторону.
Кроме того, мошенника можно распознать по степени заполненности его профиля: чем меньше контактной информации, друзей и публикаций у клиента на странице, тем выше риск, что человек окажется обманщиком, использующим «фейковый» аккаунт. «Конечно, мы не можем отнести всех пользователей с пустыми страничками к числу потенциальных нарушителей, - комментирует еще один создатель проекта Sociohub Роман Лавлинский, -Любая модель – по сути, игра с числами, в любой модели есть вероятность ошибки. Однако ее использование значительно снижает риски организации по сравнению со «слепым» методом. Прибавка 5% к качеству модели, как правило, ведет к улучшению финансового результата кредитной организации на десятки миллионов рублей.
Общественное достояние
Пока что банки неохотно рассказывают о том, что используют в процессе оценки заемщика данные из его социальных сетей. И тому есть причина. Финансовые организации опасаются негативной реакции со стороны клиента. Регистрируя очередной акаунт, любители соцсетей обычно не читают пользовательское соглашение и тем более не стремятся ознакомиться с законом РФ об авторском праве. Оттого и появляется расхожее заблуждение о том, что материалы, загружаемые в сеть, будь то фотографии или контактные данные, не могут быть использованы без согласия пользователя. На самом деле, принцип работы социальных сетей таков, что любые данные со страницы пользователя становятся общедоступными с момента их попадания в сеть, если они не скрыты настройками приватности. «Чаще всего заемщик при заключении договора дает банку или МФО согласие запрашивать необходимую информацию из любых источников. При этом весьма вероятно, что заемщик и не догадывается о том, что банк будет изучать его профиль на Facebook
Как оказалось, скоринговая система может выяснить информацию, и вовсе не указанную в профиле заемщика. Если пользователь не отметил в анкете возраст, место проживания и обучения, система может проанализировать страницы его друзей и предоставить достаточно точные данные. «Такие вещи, как место жительства, могут многое рассказать кредитору о клиенте. В разных регионах нашей страны наблюдается разный уровень дефолтности – это связано и с состоянием экономики региона и с уровнем преступности. Из-за этого банки даже часто выстраивают отдельные скоринговые модели для каждого региона. Город также играет далеко не последнюю роль в процессе идентификации заемщика. Банку важно знать, соответствуют ли данные о месте проживания, указанные в заявке, информации в соцсетях. Если эти данные разнятся, значит, человек пытается исказить информацию о себе. Это – первый и самый явный сигнал того, что мы имеем дело с мошенником» - утверждает Александр Федосеев.
Математический показатель качества
И все-таки поверить на слово в эффективность моделей, предлагаемых Sociohub и подобными ему сервисами, для банков было бы слишком рискованным предприятием. Поэтому создатели Sociohub привели качество выстраиваемых моделей к численному показателю. Эффективность сервиса оценивается показателями AUC и GINI. «Как устроена наша модель? Мы задаем некоторые входные параметры, и программа выдает нам скор от нуля до ста, - рассказывает Александр Федосеев, - Полученная величина определяет вероятность дефолта для рассматриваемого клиента. Чем выше качество модели, тем реже мы ошибаемся: если мы говорим, что заемщик не ответственный и он действительно оказывается таким, то AUC увеличивается. Чем выше AUC, тем чаще мы угадываем».
Советы заемщикам: как понравиться банку
Даже если клиент финансовой организации знает, что его социальные сети будут проанализированы, показаться лучше, чем есть на самом деле, ему вряд ли удастся. Некогда в газете Financial Times было приведено исследование ученых Кембриджского университета, которые создали программу, позволяющую по «лайкам» на Facebook определять IQ пользователей, а также их возраст и сексуальную ориентацию. Основатели Sociohub утверждают: распознать демонстративное поведение в соцсетях гораздо проще. «В целом, исследования показывают, что пользователи привыкли достаточно открыто вести себя в социальных сетях. Иногда люди могут пытаться выглядеть более умными или обеспеченными. Но им это обычно плохо удается. Есть только один действенный способ «понравиться» банку – вести себя естественно, не пытаться ничего скрыть или приукрасить. Тогда сомнений не будет» - утверждает Роман Лавлинский.
Материал предоставлен FinDigest компании "Финкарта".