Big Data для бизнеса как крупные компании работают с клиентами в социальных сетях


Оглавление (нажмите, чтобы открыть):

Анализ данных социальных сетей

Понятие социальной сети использовалось социологами еще в 20-х годах прошлого века для изучения взаимосвязей между участниками различных сообществ. Психолог и психотерапевт Якоб Морено предложил социограммы, на которых отдельные индивиды представлялись в виде точек, а взаимосвязи между ними — в виде линий. Идею использования аппарата теории графов для изучения взаимоотношений и взаимосвязей между людьми подхватили специалисты в области социологии, психологии, антропологии, политологии, экономики — так сформировалось направление Social Network Analysis, изучающее структурные свойства социальных взаимосвязей, моделируемых в виде графов и сетей. Важным, но весьма трудоемким этапом такого исследования было построение модели на основе различных данных из печатных источников, дополнительных опросов и анкетирования.

Современные социальные сети существенно изменили постановку вопроса — сегодня у исследователей имеется «бесплатный» ресурс для изысканий [1], а стремительное распространение социальных онлайн-сервисов и развитие технологий Больших Данных инициировали интерес к использованию сведений из социальных сетей в различных отраслях. Совместное использование структурных и контентных данных потенциально позволяет применять социальные сети для решения широкого круга бизнес-задач: борьбы с мошенничеством, управления брендом, рекламы товаров и услуг, формирования новых каналов сбыта и др.

В социальных сетях, на форумах, новостных и развлекательных порталах и в блогах содержится много ценного материала, из которого можно добыть информацию о предпочтениях и особенностях людей и компаний. Для этого прежде всего необходимо идентифицировать клиента в каж дом источнике, что позволяют сделать далеко не все ресурсы — на многих из них люди не регистрируются либо указывают недостаточно идентифицирующих данных. Даже там, где данных для идентификации клиента достаточно, может не оказаться полезных дополнительных сведений о нем. Социальные сети в этом отношении являются наиболее подходящим источником, содержащим и информацию для идентификации клиента, и дополнительные данные о предпочтениях, семейном положении, образовании, круге общения и др.

Обогащение профилей клиентов

В общем случае задача обогащения профилей клиентов состоит в следующем. Компания предоставляет базовые данные (имя, фамилия, дата рождения, город) о своих клиентах, и на их основе необходимо найти дополнительные сведения: круг интересов, социальный статус, область профессиональной деятельности, музыкальные предпочтения и т. д. Для решения этой задачи необходимо собрать данные о клиенте из социальных сетей, идентифицировать его, обогатить данные и сформировать единый профиль для каждого клиента (см. рисунок).

Самый простой способ сбора данных — воспользоваться услугами специализированных компаний, собирающих и постоянно обновляющих данные из множества источников. Главное преимущество здесь — быстрота получения информации, что существенно при больших объемах клиентской базы и использовании различных социальных сетей. Недостаток — платная подписка на обновления данных.

Следующий способ — использовать программные интерфейсы, предоставляемые почти всеми популярными социальными сетями. Для различных сетей API отличаются набором доступных данных, ограничениями на количество запросов и стоимостью доступа к интерфейсам. Например, если c помощью программного интерфейса сети «В контакте» можно получить полную информацию о пользователе, то Facebook предоставляет API, возвращающий практически «нулевые» сведения о пользователе. К недостаткам этого метода относится ограничение на количество одновременных запросов и на количество обращений, которые приложение может делать в единицу времени. Кроме того, необходимо постоянно отслеживать изменения в API и обновлять приложение по сбору данных, причем некоторые социальные сети предоставляют важные данные только на платной основе. Преимуществами метода являются возможность получения данных об одном клиенте в структурированной форме (JSON или XML), а также простота интеграции вызовов API в собственное приложение.

Еще один способ — ручной разбор веб-страниц социальных сетей, а также использование готовых краулеров для сбора данных с последующим разбором. В этом случае имеется доступ ко всем открытым данным и отсутствуют ограничения на скорость их сбора. К недостаткам следует отнести сложность реализации — веб-страница каждой социальной сети уникальна, поэтому каждый раз придется разрабатывать свои правила разбора. Недостатками являются также сложность поддержки и необходимость больших вычислительных ресурсов, правда, этот процесс хорошо распараллеливается.

Идентификация клиента — обнаружение всех профилей, представляющих конкретного клиента в социальных сетях. Исходными данными для поиска могут служить пас портные данные, однако будет полезна и дополнительная информация. Сузить круг и помочь при поиске человека могут такие сведения, как название компании, в которой он работает, номер телефона, адрес почты, место учебы и список друзей.

Самым простым способом идентификации является поиск по точному совпадению всех известных характеристик клиента, однако необходимо учитывать, что соответствующие характеристики в социальных сетях достоверны лишь до определенной степени — они могут отсутствовать, быть заведомо ложными либо допускать различные варианты написания. Поэтому перед проведением идентификации необходимо произвести очистку и нормализацию данных, а также проверить правильность указанных в профиле параметров — например, город пользователя можно уточнить на основе анализа его подписок, постов и статусов.

Некоторые параметры можно восстановить, анализируя профиль пользователя или его друзей. Например, женщины очень часто не указывают год рождения, тогда как имеется год окончания университета или школы.

Каждая характеристика, используемая при идентификации, имеет некий вес — сумма всех весов при совпадении всех параметров должна быть равна единице. Так, фамилия, имя и пол — одни из самых важных параметров во время идентификации, и если эти данные указаны неверно, то с высокой степенью вероятности идентифицировать этого пользователя не удастся. На втором месте стоят день и месяц рождения. Эти данные поддаются восстановлению, но без них шанс на удачную идентификацию также весьма низкий. Город и год рождения имеют самый низкий вес. Однако именно эти параметры лучше всего поддаются восстановлению на основе других данных.

Кроме данных, которые пользователи сети явно указывают в своих профилях, многое можно узнать, анализируя посты, группы подписки и фотографии. При этом интерес представляют дополнительные факты, которые можно извлечь из этой не структурированной информации. Напри мер, если в большинстве записей на стене речь идет о впечатлениях о фильмах, то ясно, что пользователь интересуется кино.

Автоматический анализ текстов невозможен без лингвистических технологий. Кроме того, для решения многих задач полезны также статистические методы, технологии машинного обучения и углубленный анализ данных (data mining). Статистические исследования и работа с естественным языком обычно связаны с некоторой неточностью — в статистике речь всегда идет об определенных допущениях, эвристических предположениях, которые не всегда полностью выполняются, а в естественном языке всегда есть вероятность неоднозначного толкования утверждений и выводов. Правильное сочетание лингвистических и статистических подходов повышает качество результата и уровень его достоверности. Для иллюстрации возможного соотношения различных методов при текстовом обогащении данных рассмотрим несколько примеров.

Допустим, нам необходимо узнать, интересуется ли пользователь футболом. Определим, насколько часто в текстах на его стене встречаются соответствующие термины, и при достижении некоторого уровня их появления можно сделать определенные выводы. Для такого метода обогащения необходимо знать терминологию, получить которую можно из словарей или тезаурусов по конкретной предметной области. Кроме того, нужно еще и уметь правильно подсчитать количество употреблений — понимать различные формы одного и того же слова. Таким образом, для данного примера достаточно только лингвистических средств.

Второй пример относится к случаю, когда кроме лингвистической обработки необходимы методы машинного обучения. Предположим, что у пользователя не указана полная дата рождения и требуется определять возрастную группу на основе текстов, которые он пишет. Прежде всего формируется набор текстов пользователей, возраст которых известен. Затем для этого набора с помощью алгоритмов машинного обучения выявляются особенности текстов для каждой возрастной группы и формируется некоторая формальная модель, позволяющая для произвольного текста оценить возраст его автора. Алгоритмы машинного обучения обычно рассчитаны на структурированные данные, поэтому перед их применением тексты заменяются на наборы встречающихся в них слов или на набор тематик, характеризующих эти тексты. Для этого используются лингвистические алгоритмы выделения значимых слов, их нормализации, составления лексического профиля текста, определения тематик и др.

У одного клиента, заданного идентификационными данными, в социальных сетях может существовать много различных пользователей, имеющих достаточно высокий уровень достоверности идентификации.

В этом случае возникает задача «объединения» данных нескольких пользователей в единый профиль клиента. Как именно соединять данные, зависит от конкретной задачи — например, для формирования общего списка интересов можно отбирать только интересы, присутствующие у каждого пользователя. Либо можно объединять интересы всех пользователей заданного клиента и использовать расширенный набор интересов.

Платформа ForSMedia, разработанная компанией «Форс» на базе Hadoop [2], средств лингвистической обработки компании RCO и языка R, реализует все перечисленные методы и подходы. Важной особенностью решения является возможность массового обогащения данных для большого числа профилей клиентов в автоматическом режиме. Платформа может быть развернута на серверах пользователя или поставляться в виде облачного сервиса.

Социальные сети служат новым полезным источником дополнительных данных о клиентах любой компании. Использовать этот источник не так просто, и возникающие на этом пути проблемы требуют специализированных технологий и инструментов. Система ForSMedia, основанная на Hadoop и других технологиях Больших Данных позволяет автоматически в режиме массовой обработки обогащать профили клиентов не только данными, в явном виде указанными в социальных сетях, но и сведениями, неявно присутствующими в многочисленных текстах сообщений, постах, группах подписки.

Как большие данные (Big Data) убивают типичного клиента или почему вам срочно нужен персональный маркетинг

Как меняется маркетинг в эпоху социальных сетей и больших данных (Big Data) и чем это поможет вашему бизнесу: рассматриваем практические примеры персонализации рекламных предложений.

Новый маркетинг: почему вашего типичного клиента больше нет

Описывая портрет своего потенциального клиента, традиционный маркетинг попадает в ловушку обобщения. Например, целевая аудитория продукта: домохозяйки с маленькими детьми, владельцы японских авто с пробегом более 100 тысяч километров или обеспеченные миллинеалы с высшим образованием.

При этом возникает «проблема мертвых душ» — группа есть, а человека нет. В реальном мире отсутствует абстрактный «пользователь продукта», такой как молодой человек 25-35 лет, пользующийся мобильным интернетом по 3 часа каждый день. В жизни есть вполне конкретный Петр Евгеньевич Сидоров, 27 лет, холост, который работает врачом-анестезиологом сутки через двое, 3 раза в неделю ходит в тренажерный зал, предпочитает не тратить время на приготовление пищи, но придерживается здорового питания, в интернете общается с друзьями через соцсети, а также любит читать фантастические рассказы и медицинские статьи.

Задача маркетолога – подобрать специальный продукт, который подходит именно этому клиенту. Например, лимитированный трафик для смартфона и домашнего компьютера, доставку ЗОЖ-блюд домой и на работу или клиентская карта фитнес-клуба с гибким расписанием тренировок и возможностью переноса занятий на случай внеплановых дежурств.

Персональный маркетинг — индивидуальная работа с каждым клиентом из целевой аудитории

Среди множества рекламных предложений по аналогичным продуктам и услугам потребитель выбирает то, что удобно именно ему. Поэтому нужно знать о своих клиентах, текущих и потенциальных, максимум информации, а не только ключевую характеристику относительно вашего бизнеса.

ФИО, возраст, семейное положение, дружеское окружение, уровень доходов, место проживания, образование, карьера, хобби и предпочтения – эти сведения позволят предугадать потребности клиента, предложить ему подходящий товар или услугу и стимулировать к повторной покупке [1]. Опыт американских компаний подтверждает, что персонализированный подход к клиентам, увеличивает продажи в среднем на 19% [2]. А успешные кейсы сокращения рекламного бюджета при увеличении выручки в отечественном маркетинге мы описывали здесь [1].

Где взять данные о клиенте и как их анализировать

Сегодня, в эпоху соцсетей, даже личная информация перестает быть секретом – люди охотно делятся важными событиями и повседневными мыслями со всем миром, публикуя посты и фотографии на своих страницах. Поэтому, чтобы лучше узнать своего клиента, вам нужна только ссылка на его профиль в социальной сети. Страница соцсети не заменит карточку клиента в корпоративной CRM-системе, но существенно дополнит ее [3].

Постоянно увеличивающиеся объемы и разные форматы сообщений в социальных сетях делают задачу сбора и анализа этой информации прикладной сферой Big Data-технологий.

Социальные сети — уникальный источник данных о клиентах

После автоматизированного сбора сведений о клиентах, эту информацию следует очистить от ошибок, опечаток и нерелевантных значений, чтобы определить факторы, влияющие на целевую (таргетную) переменную.

Затем модель машинного обучения (Machine Learning) проверяет гипотезы об зависимости различных характеристики друг от друга и формирует рекомендации. Например, предложить потребителю семейную карту лояльности с новым тарифом, если страница соцсети вашего клиента стала наполняться постами об отношениях и романтическими фото.

Персональный маркетинг – это не просто обращение к потребителю по имени в рекламном предложении. Поздравьте клиента с днем рождения, защитой диплома или другим важным событием, о котором он недавно сообщил в своих соцсетях, заодно рассказав о своей продукции, подходящей к этому случаю.

Не бойтесь встревожить потребителя излишней осведомленностью: 73% клиентов предпочитают бренды, использующие их личные данные для более формирования наиболее подходящих и выгодных маркетинговых предложений [2].

Кроме того, сбор и анализ подробной информации о потребителях помогут вам более точно сегментировать целевую аудиторию, чтобы предложить каждому пользователю именно то, в чем он нуждается. С помощью технологий Big Data и Machine Learning можно даже выявить, как погодные условия влияют на уровень продаж и повысить эффективность своих маркетинговых кампаний, о чем мы подробно рассказываем в новой статье.


Также инструменты больших данных и машинного обучения позволят найти новые продуктовые направления, определить неосвоенные области рынка, эффективнее спланировать и запустить рекламные кампании, выявить отраслевые тренды и изменения в поведении клиентов [4].

Технологии Big Data для сбора и анализа данных о клиентах из социальных сетей — главный инструмент современного маркетолога

А как именно использовать эти информационные технологии на практике, мы расскажем на наших обучающих курсах для инженеров, администраторов и аналитиков больших данных (Data scientists) и машинного обучения.

На занятиях вы освоите все тонкости работы с программно-аппаратным обеспечением, а также узнаете прикладные методы, средства и аналитические инструменты для решения реальных бизнес-задач. Например, вопросы сегментации целевой аудитории, прогнозирования и снижения оттока клиентов (Churn Rate) мы рассматриваем на курсе машинного обучения на Python.

Роль Big Data в развитии крупного бизнеса

Как показывают аналитические исследования, к 2020 году общий объем индустрии больших данных составит примерно $61 млрд. Рынок услуг и продуктов для работы с bigdata растет ежегодно на 17-20%.

Большие данные использовались задолго до появления этого термина. Многие крупные поисковые системы и социальные сети основывали свою работу на механизмах обработки BigData. Большие данные играют важную роль и для традиционного бизнеса. В частности, майнинг данных интересует в первую очередь представителей крупных рынков – таким игрокам необходимы мощные инструменты, позволяющие увеличить эффективность.
Технологии больших данных нашли свое применение в онлайн-рекламе, маркетинге, ритейле и других областях.

Использование BigData для анализа клиентских предпочтений

Анализ больших данных – хорошая возможность узнать больше информации о пользователях и их предпочтениях. Чем точнее будут сведения, тем выше будет прибыль корпорации. К большим данным относятся неструктурированные массивы информации самого разного рода: текстовые и мультимедийные файлы, метаданные и т.д. Традиционными методами проанализировать такую информацию практически невозможно. Потому для ее анализа используют современные технологии, построенные на AI, нейронных сетях и глубоком обучении.
Яркий пример корпорации, собирающей и анализирующей большие данные – Facebook. Каждый день эта социальная сеть обрабатывает свыше 2 млрд запросов, полученных от пользователей. Для наиболее полного соответствия клиентским предпочтениям и интересам, Facebook выводит персонализированную ленту, куда попадают только те посты и реклама, которые будут максимально точно соответствовать потребностям пользователя, исходя из развернутого профиля его активности в социальной сети и в интернете в целом. Учитываются даже такие мельчайшие показатели, как поставленный лайк под записью, печальный или недовольный смайлик, просмотр видео до конца и т.д.
Итоговый результат: лента, которая отражает интересы конкретного человека. Такая же алгоритмически формируемая лента перекочевала затем в Instagram, VK и в другие социальные сети. Популярный видеохостинг YouTube тоже не остался в стороне – в топ выдачи поиска для каждого конкретного человека выдаются видеоролики, которые с большей вероятностью будут досмотрены до конца или сгенерируют подписку на канал и т.д.

Технологии больших данных в онлайн СМИ

Цифровые СМИ вынуждены кооперироваться между собой, чтобы максимально отражать пользовательские потребности. Компании обмениваются данными о пользователях, их активности, сегментации, подписках, чтобы сформировать общую картину интересов. В качестве примера можно привести холдинг Pangaea Alliance, в который входят такие крупные новостные ресурсы и издания, как CNN, Reuters, The Guardian и др.
Объединение конкурентов и обмен данными между собой помогает снизить зависимость компаний от рыночных монополистов, таких как Google и Facebook. Также компании нередко внедряют инструменты для анализа больших данных. К примеру, The Guardian используют Ophan – этот инструмент позволяет сводить и анализировать данные по прочтениям статей, просмотрам страниц, переходам из социальных сетей, геолокационным данным и т.д. Пользовательские реакции на тот или иной материал собираются, анализируются, и на основе их уже принимаются дальнейшие решения.

Изучение отзывов – способ удержать клиентов и повысить их лояльность

Удержание клиентов – главная задача любой компании. Как показывают аналитические отчеты, примерно 30% клиентов публикуют отзывы о продукции в социальных сетях или на тематических сайтах. Психология потребителей такова, что преобладает обычно именно негативный опыт.
Анализ данных позволяет улучшить сервис компании, обновить ценовую политику, оптимизировать доставку. Социальные сети дают возможность напрямую связываться с потребителями, отслеживать их данные, формировать портрет каждого человека или определенной социальной группы.
Торговая сеть Walmart – яркий пример того, как нужно использовать технологии BigData для отслеживания клиентских предпочтений и увеличения продаж. С помощью технологий машинного обучения был проведен анализ всех текстов на сайте, что позволило создать более релевантные описания за счет добавления различных синонимов. Коэффициент конверсии вырос примерно на 10%, что для такой крупной корпорации означало несколько миллионов долларов прибыли.
На рынке РФ первыми провели внедрение больших данных банки, ритейлеры, операторы связи и нефтяные холдинги. С помощью современных платформ и технологий компании анализируют средние чеки покупателей, чтобы спланировать продажи и провести максимально эффективные промо-акции.
Популярным решением на российском рынке для отслеживания пользовательских отзывов в социальных сетях является платформа обращений, разработанная компанией “Иннодата”. Эта платформа позволяет принимать верные управленческие решения и оперативно реагировать на негатив при помощи анализа клиентских отзывов в социальных сетях и на тематических площадках. Предиктивный модуль дает возможность спрогнозировать пользовательское поведение, получить различные рекомендации и улучшить маркетинговые показатели.

Ключевой фактор роста бизнеса в современных рыночных условиях – точное отражение клиентских потребностей. Этому способствуют технологии обработки BigData, к которым уже прибегают многие ведущие корпорации – как мировые, так и российские.

Большие данные для бизнеса: реальная польза или пустой хайп?

О пользе big data для бизнеса говорят часто и много. Но так ли это на самом деле? Руководители и менеджеры российских компаний поделились своим опытом использования больших данных на конференции Big Data, Meet Big Brother! (ее организовал венчурный фонд Sistema_VC). Inc. записал для вас самое важное.

Почему data science и big data стали популярны именно сейчас? Где большие данные реально принесли пользу, а где оказались просто хайпом? Есть ли этическая грань в использовании big data и нужна ли она вообще? И что будет с данными в ближайшем будущем? Вот круг вопросов, о которых мы сегодня с вами поговорим.

СЕО компании DataSine (модератор)

СЕО компании DataSine (модератор)

основатель и CEO, GOSU Data Lab

директор по монетизации данных, Тинькофф Банк

основатель и СЕО, Segmento

директор департамента big data, МТС

Чудес не бывает

Мне кажется, реальное применение больших данных в бизнесе случилось благодаря скучным вещам: оптоволоконным кабелям и быстрому интернету. Это позволило системам очень быстро обмениваться информацией, обрабатывать ее и применять. Вторая причина — накопилось огромное количество данных в самых разных вариантах (взять хотя бы записи пациентов в медицинских клиниках).

Мы 3 года занимаемся big data. За это время были протестированы более 100 разных идей, и только малая часть из них оказалась успешной. Если кто-то в компании уже пробовал решить задачу методами не big data, а обычным BI, SQL-запросами или в Excel, — с большой вероятностью и мы не окажемся лучше. Например, МТС всегда пыталась построить модель оттока клиентов, и была в этом очень успешна. Мы попробовали сделать лучше — и ничего особенного не вышло. Другой пример: до нас сотрудники МТС тщетно пытались сделать модель, которая предскажет переход клиента на более дешевый тарифный план (и позволит компании удержать его от этого шага). Мы тоже попробовали решить эту задачу, но не получилось. Поэтому искать чудо в технологиях big data не надо. Да, это дает больше сил, но сделать что-то революционно новое пока сложно.

Когда мы говорим о big data, нужно различать 2 разных направления. Первое – когда мы добавляем какие-то новые данные, которых раньше не имели. Второе – это математика. Все приросты сейчас мы получаем за счет новых данных либо фич-инжиниринга, но не математики как таковой, — она уже собирает конечную модель.

Бизнес проверяет кейсы (но везет не всем)

Вся индустрия big data, искусственного интеллекта и machine learning сейчас находится на той стадии, когда бизнесы проверяют кейсы. Если кейс работает — интегрируем внутрь, ждем и смотрим, увеличится ли у нас life-time value. Затем считаем косты на внедрение и автоматизацию всей этой истории, после чего понимаем — стоило оно того или нет. Весь мир сейчас делает именно это. Мы увидим, наверное, в ближайшие 1—1,5 года в разных индустриях и секторах рынка очень много реально работающих кейсов, которые себя окупают и заслуживают, чтобы их интегрировать. Пока же мы только пробуем.

В гейминге уже есть несколько кейсов, которые работают и будут развиваться. Во-первых, это умные боты: они учатся на наших действиях и на всем, что происходит в игре. Вторая история — персонификация: мы можем идентифицировать игрока (это очень важно для проверки аккаунтов).

А мне кажется, мы гораздо больше увидим неработающих кейсов. По прогнозу Gartner, 68% компаний, начавших что-то делать с большими данными, ждет неудача (позже прогноз даже ухудшили до 80%). А все потому, что big data — это хайп и инициативы очень часто появляются там, где им совсем не место.

На самом деле, большие данные чаще всего позволяют лишь что-то немного улучшить. В то время как многие позиционируют их как нечто могущее полностью изменить бизнес компании. При этом есть отрасли, в которых big data реально работают в полную силу. Например, рекламная индустрия сейчас переходит на принцип работы в реальном времени — система сама решает, когда и какую рекламу показать и сколько нужно заплатить за ее показ. Человек уже это сделать не сможет. Пройдет немного времени, и большинство рекламных агентств, а также людей, которые планируют рекламу, скорее всего, заменят машинами, — так быстрее, а значит, и эффективнее.

Мастер Йода рекомендует:  Зачем веб разработчику нужно изучать PHP

Один из наших клиентов — «Лаборатория Касперского» — в какой-то момент внедрил у себя систему под названием Visual IQ. Она прогнозирует на основе больших данных, сколько денег и на какие рекламные каналы нужно потратить в ближайший период. По сути, она определяет бюджет, — чем так любят заниматься менеджеры в рекламе, — без участия человека. По другую сторону находится Segmento, как одна из площадок, которая автоматически достигает поставленных целей. Получается такой замкнутый процесс — думаю, к такой работе в рекламной индустрии в конечном итоге все и придет.

У МТС — триада стратегий, связанных с big data. Первая — накопление всех знаний об абонентах и клиентах. Неважно, понимаем мы, как это можно использовать или нет, — технологии хранения данных достаточно дешевы, чтобы хранить их все валом. Вторая — дать доступ к этим данным статистам и специалистам компании, чтобы они попытались что-то из них слепить. Третья стратегия — построение новых бизнесов, основанных на больших данных. Причем речь идет о максимальной персонализации — мы должны знать все о вас: во сколько встали и пошли в душ, есть ли у вас собака, ходите ли вы на работу пешком, женаты вы или нет… Мы как будто наблюдаем и прослушиваем, но на самом деле нет — это запрещено.Обладая полнотой таких знаний, можно монетизировать их лидами для продажи наших услуг.

Нейросети для транзакций: как на деле работают «большие данные» в российских банках?

На сегодняшний день банки все больше подвержены давлению со стороны высокотехнологичных, компаний и стартапов, которые пытаются охватить все сферы жизнедеятельности потребителей, в частности, финансовую. К примеру, компания Google, наряду с созданием мобильного кошелька, предлагает своим клиентам оформить дебетовую карту. В стороне не остаются и компании-ритейлеры: в США около трети всех транзакций в Starbucks оплачиваются с помощью карты лояльности. Текущая ситуация вынуждает банки искать новые пути использования своих ресурсов и альтернативные денежные потоки.

Именно поэтому все больше банков внедряют в свою деятельность кластеры Big Data для анализа данных о потребителях и выявления скрытых закономерностей в их поведении. При этом, банки обладают существенным преимуществом по части Big Data, так как у них уже имеется огромное количество достоверной информации о своих клиентах: от кредитной истории до ежедневных транзакций. Вдобавок, компании банковской отрасли, являясь посредником между торговыми точками и покупателями, обладают ценной информацией о характере их взаимоотношений.

Более того, по результатам опроса консалтинговой компании Accenture в Северной Америке из всего спектра компаний люди в большей мере готовы доверить личную информацию своему банку:


Таким образом, для того, чтобы принять вызов, бросаемый рынком, банкам необходимо извлекать максимальную пользу из имеющихся данных, активно внедряя системы анализа Big Data и предиктивную аналитику. Существует два основных источника данных, которые могут быть использованы банками: база данных самой компании, где хранятся структурированные данные, а также неструктурированные данные из социальных сетей.

Представители «Double Data» указывают на то, что данные, которые они используют, размещены в открытом доступе. Кроме того, Mail.ru Group, которой принадлежит социальная сеть, является прямым конкурентом «Double Data». В 2020 г. Mail.ru Group начала продажу банкам системы оценки кредитных рисков, основанной на методах машинного обучения. Система позволяет, в частности, выявлять «качественных» заемщиков среди тех, кто ранее получал отказы в кредитах. Таким образом, данный иск может быть не столько проявлением заботы об интересах пользователей, сколько формой конкурентной борьбы.

Однако размещать личные данные, в том числе фотографии и видео, в социальной сети для своих друзей и знакомых и быть готовым к тому, что любой желающий сможет их найти и использовать в своих целях без вашего согласия — вовсе не одно и то же. Это подтверждается, например, реакцией на проект петербургского фотографа Егора Цветкова «Your Face is Big Data». Автор проекта сначала фотографировал случайных попутчиков в метро, затем нашел с помощью приложения FindFace по фотографиям их профили в сети «ВКонтакте». Приложение использует нейросетевые алгоритмы и позволяет идентифицировать людей с высокой точностью даже по мало похожим друг на друга фотографиям. Выставка, созданная фотографом, содержала размещенные вместе пары фотографий: одна сделана в метро, другая, часто достаточно личная и неожиданная для этого человека, взята из сети «ВКонтакте» и помещена рядом. Многие «жертвы» фотографа были шокированы возможностью так легко получить доступ к их контактным данным, фотографиям и личной информации.

Теперь рассмотрим некоторые задачи, которые могут быть решены с помощью технологий Big Data в банковской сфере:

Сегментация клиентов и релевантные предложения. Банки активно применяют персонализированный подход к клиентам, ведь теперь они могут составить «портрет» каждого из них на основе страниц в социальных сетях и транзакций.

Например, если ранее у клиента не было расходов, связанных с автомобилем (топливо, мойка и т.п.), а теперь они появились, и незадолго до этого была потрачена крупная сумма денег, можно считать, что клиент приобрел автомобиль и выслать ему интересные для него предложения. Такие системы детектирования платежных паттернов уже сейчас используются в ряде российских и зарубежных банков. С помощью вычисления важных событий в жизни клиентов индийскому банку HDFC удалось значительно повысить долю активируемых кредитных карт, и теперь более 70% активируемых кредитных карт банка обеспечивается сформированными на основе анализа платежных паттернов рекомендациями.

Что касается российского рынка, то, к примеру, тем, кто часто делает переводы в благотворительные фонды, в Сбербанке предлагают карту «Подари жизнь», а тем, кто часто бывает за границей — страховку для выезжающих за рубеж. В свою очередь, «Альфа-банк», сотрудничая с производителями фитнес-трекеров, предлагает своим клиентам, ведущим активный образ жизни программу «Activity» — накопительный счет с повышенной ставкой, на которые будет начисляться сумма денег, пропорциональная количеству пройденных шагов. Анализ платежных паттернов позволил Ситибанку в Сингапуре предлагать клиентам скидки и cashback в интересующих их магазинах и ресторанах, что привело к повышению лояльности и общей удовлетворенности клиентов.

Кредитный скоринг. Традиционные методы скоринга, в особенности для компаний, требуют длительного сбора комплектов документов, часть которых, например, финансовая отчетность, могут оказаться недостоверными, и значительных трудовых и временных затрат. Ситуацию в корне меняет использование транзакционных данных компаний-клиентов банка: данных о выручке, ее величине, стабильности и равномерности, данных о выплаченных налогах и штрафах, долге и платежах в счет его погашения и других данных. Банковская отрасль уже вступила на путь внедрения транзакционного скоринга, такой подход уже применяется в Банк Хоум Кредит: в сотрудничестве с GlowByte Consulting и SAS была разработана система принятия решений в реальном времени SAS Real Time Decision Manager и средство глубинного анализа текстовой информации SAS Text Miner. Высокопроизводительная платформа позволяет обрабатывать до 80 000 запросов сутки и, в результате, значительно снижает риски при выдаче потребительских кредитов.

Помимо транзакционных данных в кредитном скоринге используются и другие данные. Их спектр постоянно расширяется вместе с ростом качества применяемых алгоритмов, что позволяет постоянно улучшать предсказательную способность скоринговых моделей. В Сбербанке для решения задач кредитного скоринга используются не только традиционные данные, но и ряд дополнительных, например, графы связей клиентов, построенные на основе данных о денежных переводах и данных социальных сетей. Для кредитного скоринга компаний используются тексты новостей с их упоминанием, положительная или отрицательная тональность которых определяется автоматически. Ценные данные для кредитного скоринга предоставляют банкам операторы мобильной связи. Снижают вероятность одобрения кредитной заявки, в частности, большое число активных сим-карт заявителя и небольшое время их работы, мелкие и многочисленные пополнения счетов и подозрительная география звонков. Использование этих данных позволило Сбербанку улучшить качество своих скоринговых моделей на 7 процентных пунктов по метрике Джини.

Оптимизация работы сети отделений и банкоматов. Технологии больших данных позволяют оптимизировать работу сети отделений и банкоматов: геолокационная аналитика позволяет определить наиболее удачные места их расположения, анализ исторических данных по спросу на наличные деньги с учетом определенных событий, погодных условий, выходных и праздничных дней дает возможность предсказать потребность банкоматов в наличности, чтобы не хранить там избыточные средства, которые можно было бы распределить на более доходные направления использования, а математические методы оптимизации помогают перераспределить между банкоматами имеющиеся остатки наличных средств. С помощью технологий больших данных удалось оптимизировать работу банкоматов, в частности, Райффайзенбанку: Yandex Data Factory разработала для банка модель прогнозирования спроса на наличные в банкоматах. В основе анализа лежат данные 2000 банкоматов, в частности, их местонахождение, режим работы, фактический спрос на наличные. Внедрение данной системы позволит в перспективе уменьшить отклонение прогноза от реального спроса на 30% и, соответственно, снизить издержки, связанные с пополнением банкоматов и изъятием лишних средств, примерно на 15%. За рубежом одним из первых подобную платформу разработал индийский банк HDFC: на основе данных о работе пользователя с приложениями и сайтом банка банкомат автоматически определяет предпочитаемый клиентом язык и предлагает ему наиболее часто используемые им и рекомендуемые ему услуги (здесь используются рекомендательные системы).

Внутренний анализ работы сервисов банка. Для оптимизации работы не только физических, но и онлайн сервисов банка очень полезным оказывается автоматический анализ тональности текстов. Например, южноафриканский Nedbank с помощью алгоритмического выявления положительных и отрицательных отзывов в Интернете смог определить наиболее проблемные с точки зрения клиентов области в банковском секторе страны и провел в них улучшения, чтобы получить конкурентные преимущества. Наиболее проблемными областями оказались обслуживание в отделениях (а именно длинные очереди после работы и в обеденное время, когда многие сотрудники банков отправлялись на обед, и неудобные часы работы), а также телефонная поддержка и веб-сайты банков. В результате банк смог получить в этих областях большую долю положительных отзывов, чем отрицательных, и сформировать конкурентное преимущество. С помощью анализа тональности и ключевых слов отзывов и записей в социальных сетях банку Barclays удалось оптимизировать свое мобильное приложение. Выяснилось, что приложение не позволяло клиентам банка, не достигшим 18 лет, получать или отправлять деньги. Это создало массу негативных комментариев как от подростков, так и от родителей. После того как по собранным данным удалось идентифицировать проблему, банк смог оперативно доработать свое приложение, добавив доступ также для 16 и 17-летних.

Предотвращение оттока клиентов. В большинстве случаев стоимость приобретения нового клиента во много раз превосходит стоимость удержания имеющегося, поэтому очень важно выявлять склонных прекратить пользоваться услугами банка клиентов и принимать превентивные меры. Индикаторами здесь могут служить, например, прекращение регулярных платежей, жалобы по телефону или негативные отзывы в Интернете. С помощью сложных предсказательных моделей, использующих исторические данные по транзакциям и еще 115 переменных, компания American Express в Австралии смогла точно идентифицировать более 24% счетов, которые без вмешательства будут закрыты в течение следующих 4 месяцев, и принять по отношению к ним превентивные меры. С помощью предиктивных моделей, сегментации клиентской базы и отдельных программ удержания для каждого из сегментов словацкий Tatra Banka смог снизить отток пользователей кредитных карт на 30%.

Выявление мошеннических операций. В банковской отрасли особенно остро стоит проблема обеспечения безопасности данных и информационных систем. Как известно, злоумышленники нередко пытаются получить доступ к денежным средствам и конфиденциальным данным клиентов. К счастью, алгоритмы машинного обучения и анализа данных могут одинаково эффективно работать как с исходными, так и с зашифрованными, анонимизированные и измененными данными. Технологии больших данных и в особенности глубокого обучения — распознавание лиц, голоса, биометрических характеристик — являются новым этапом в развитии кибербезопасности и позволяют эффективно бороться с мошенничеством. Среди российских банков, активно применяющих глубокое обучения для обеспечения безопасности стоит выделить Тинькофф банк и Сбербанк. В декабре прошлого года в Тинькофф банке была внедрена платформа VisionLabs LUNA, с помощью которой проводятся оффлайн-расследования: анализ клиентской базы с целью выявления признаков мошенничества и верификация клиентов, подавших заявку на получение кредита, с помощью фотографии. До этого, к началу 2014 году в Сбербанке была разработана и внедрена система идентификации клиентов, которая сравнивает фотографий из базы с изображениями, получаемыми веб-камерами на стойках — АС САФИ. В результате потери от получения средств по поддельным документам физических лиц сократились в 10 раз. Бороться с мошенничеством банкам помогают и системы детектирования аномалий. Например, компания Brighterion предлагает 4 системы для борьбы с мошенничеством в банковской среде: iPrevent, iDetect, iPredict и iComply. Так, технология iPrevent изучает и запоминает типичные поведенческие и покупательские паттерны клиентов и реагирует, когда возникает аномальное использование счетов и банковских карт, а система iComply предназначена для борьбы с международными схемами «отмывания» денег. Для борьбы с «отмыванием» денег в соответствии с регуляторными требованиями индийский банк HDFC использует решения SAS Institute. Внедренная банком система позволяет выявлять потенциально подозрительные транзакции, такие как постоянные перемещения денег и отмены операций, перераспределение средств на большое число счетов, позволяет находить крупные счета-«однодневки», выявлять случаи открытия большого количества счетов в короткий период времени и неожиданные всплески активности на давно «спящих» счетах. На российском рынке алгоритмы машинного обучения для предотвращения «отмывания» денег и финансирования терроризма используются Тинькофф банком: в сотрудничестве с SAS была разработана гибкая система мониторинга транзакций, SAS ANti-Money Laundering, позволяющая выявлять подозрительное поведение клиентов на основе их транзакций, а также проводить максимально быстрые, регламентированные проверки на консолидированных данных.

Персонализированный финансовый менеджмент. Как известно, людям свойственно вести себя нерационально по отношению к своим доходам и сбережениям: мы часто совершаем импульсивные покупки, а недавнее исследование «Тинькофф. Журнал» показало, что типичный россиянин сберегает лишь 8,7% своего дохода. Люди доверяют банками собственные средства, и поэтому банки, используя имеющиеся данные, должны всячески помогать своим клиентам управлять доходами и достигать долгосрочных целей. Например, используя такой интуитивно понятный алгоритм как деревья решений можно автоматически определить, нужна ли покупка автомобиля и, если да, то какой сможет себе позволить клиент, исходя из его дохода и интересов, а также подобрать подходящие условия кредитования:

В октябре 2015 года Альфа-банк выпустил Alfa-Sense — приложение, личный финансовый помощник клиента, которое должно напоминать о необходимости внести платеж по кредиту, заплатить за коммунальные услуги, подсказывать, как сократить расходы, и давать советы, облегчающие жизнь. Турецкий банк Garanti также выпустил приложение-помощник — IGaranti, которое анализирует транзакции пользователя, предлагая способы экономии средств, расчет остатка денежных средств на конец месяца, а также предлагает персонализированные скидки от брендов-партнеров. Более того, в приложении имеются механизмы предотвращения импульсивных покупок. В первые шесть месяцев после выхода приложение было скачано более 150 000 раз, что вылилось в дополнительные 30 млн долларов на расчетных счетах.

Создание новых потоков прибыли. Обладая огромным количеством ценной для бизнеса информации, банки могут найти альтернативные способы дохода. Одним из таких способов является тесное сотрудничество с брендами и продажа данных о поведении клиентов. Стоит отметить, что в таком случае данные передаются в анонимной, зашифрованной форме, с целью безопасности личных данных потребителей. Тинькофф банк активно использует эту возможность и предлагает брендам, интернет-магазинам и малому бизнесу программу Тинькофф Таргет, с помощью которой они получат возможность создавать таргетированные предложения клиентам, на основе данных, предоставляемых банком. Вдобавок, платформа помогает компаниям привлекать новых клиентов, благодаря точному таргетингу, выявляющему потенциальных покупателей.

Обработка исковых заявлений. В Сбербанке нейронные сети и анализ естественных языков используются для автоматической генерации ответов на исковые заявления. Сначала в исходном исковом заявлении выявляются ключевые «сущности«-блоки на основе правил, затем методами анализа текстов на естественных языках определяются юридические условия конкретного кейса, и далее нейронная сеть глубокого обучения генерирует на базе выявленных элементов ответный текст. Там же ведется разработка интеллектуального помощника для общения с клиентами в мессенджерах.

Сравнительно неиспользованной пока остается область reinforcement learning — обучения с подкреплением. По оценкам специалистов Сбербанка, именно к ней будет приковано основное внимание индустрии в этом году. Обучение с подкреплением позволяет моделям обучаться во взаимодействии со средой, подобно тому как, например, обучаются дети. За определенные действия среда поощряет, за другие — дает отрицательный выигрыш. Например, ребенок запоминает, что не нужно трогать горячие предметы, потому что это больно. Именно результаты reinforcement learning позволили, например, программе AlphaGo выигрывать у выдающихся игроков в одну из самых сложных стратегических игр мире — го. В качестве реакции среды в банковской отрасли может выступать оценка клиентом полезности рекомендаций и предложений, формируемых на основе алгоритмов. Эти алгоритмы затем будут корректироваться в ответ на отклик пользователей в режиме реального времени.

Таким образом, банковскую индустрию можно назвать одним из флагманов использования больших данных в мире, во многом из-за высокого качества и полноты доступных данных. Почти все операции, проводимые банками, проходят в электронной форме, четко записаны и авторизованы в соответствии с требованиями регуляторных органов. В России банковская отрасль также является лидером в области применения больших данных. В ней нашли применение почти все передовые направления анализа данных и машинного обучения — это и глубокое обучение, и обработка естественных языков, и искусственный интеллект, и анализ графов и сетей.

Анализ больших данных в облаке: как бизнесу стать дата-ориентированным

Способы получить пользу от больших данных не перечислить. Например, они помогают ритейлерам увеличивать выручку и понимать покупателей, медицинским клиникам быстрее и лучше обслуживать пациентов, банкам предсказывать спрос на услуги и определять надежность заемщиков.

Качественная работа с Big Data помогает искать неочевидные закономерности, строить прогнозы и делать выводы, стратегически важные для развития компании. Так бизнес может перейти к дата-ориентированному подходу: когда решения принимаются не на основе интуиции, а на основе точной и правильно проанализированной информации. Это открывает большие возможности: компания системно видит пути развития, предполагаемые угрозы, точки роста.

Сегодня попробовать «бигдату» проще, чем раньше: все инструменты можно получить в облаке на небольшое время, чтобы познакомиться и понять, нужно вам это или нет. Расскажем, какие преимущества у хранения и аналитики больших данных в облаках и как облачные платформы делают бизнес дата-ориентированным.

Мотивирующие примеры применения Big Data в бизнесе:

  • В PepsiCo использовали анализ данных, чтобы привлечь наиболее ценных покупателей. Работа с приоритетными клиентами обеспечила рост продаж на 80% в первые 12 недель после запуска решения.
  • Фармацевтическая компания Merck изучала данные, собранные в ERP-системах и системах производственных процессов и управления запасами, чтобы лучше понять свой бизнес. В результате среднее время выполнения заказов уменьшилось на 30%, а издержки на хранение запасов продукции на складах сократились вдвое.
  • Крупнейшая нефтегазовая компания Shell обрабатывает большие потоковые данные, чтобы предвидеть сбои в работе оборудования и своевременно устранять неполадки. Также облачные инструменты работы с Big Data сократили время на складскую аналитику с 48 часов до 45 минут — теперь компания экономит миллионы долларов в год за счет затрат на перемещение и перераспределение ресурсов.
  • Компания AlayaCare, разработчик облачных программ для домашнего здравоохранения, анализировала большие данные, чтобы предсказать ухудшения здоровья, которые могут быть у пожилых людей при уходе на дому. Аналитика позволила сократить количество госпитализаций и посещений клиник на 73% в среднем и на 64% среди хронически больных пациентов.

Почему не обрабатывать большие данные на собственных мощностях

Решение для обработки больших данных можно создать в собственном дата-центре, на физических серверах, но у такого подхода есть несколько минусов.

Начнем с того, что большие данные — и правда большие, для их хранения, обработки и анализа нужны определенные возможности IT-инфраструктуры. Ее мощности можно нарастить: докупить оборудование или заменить его более мощным.

Однако почти любой ИТ-бизнес в силу постоянных технологических изменений на рынке не может точно предсказать нагрузку на инфраструктуру. Особенно — «катастрофические» пики нагрузки из-за удачных маркетинговых и PR-акций, хотя даже объем сезонных пиков может значительно колебаться от года к году.

Если покупать собственные мощности, перестраховщики содержат простаивающее оборудование, а самые экономные теряют инфраструктуру на пике нагрузки. Также все рабочие процессы генерируют данные, их объем увеличивается и увеличивается — с каждым часом, днем и месяцем информации становится больше. То есть емкость хранения данных также должна постоянно расти.

Не каждой компании для качественной обработки больших данных целесообразно приобретать столько собственных серверов и хранилищ данных, настраивать распределение нагрузки между ними и создавать сеть. А содержать собственный дата-центр с десятками (а иногда и сотнями) серверов — это дорого, подразумевает большие расходы на поддержание физической инфраструктуры (в особенности — расходы на электроэнергию), обеспечение информационной и физической безопасности, бесперебойности и многое другое. Облачная виртуализация часто позволяет обойтись без собственной инфраструктуры.

Облака могут быть использованы на начальном этапе работы с Big Data, при проведении экспериментов с данными и проверке гипотез — там проще тестировать новые предположения и технологии, не нужна собственная инфраструктура. В облаках также может быть быстрее и дешевле запустить решение в промышленную эксплуатацию, где есть определенные требования, например, высокое SLA по доступности, надежность хранения данных, производительность инфраструктуры.

Поэтому компании для анализа больших данных переходят к облакам, которые легче масштабируются, обладают практически неограниченными возможностями для хранения информации и гибкими настройками.

Большие данные подразумевают манипулирование петабайтами (а в будущем — эксабайтами и зетабайтами информации). В облаке можно развернуть приложения, которые интенсивно используют такие объемы данных.

Кроме того, облако может вмещать больше данных, чем физический сервер, компании придется меньше беспокоиться о нехватке места для хранения информации.

Частные, публичные и гибридные облака для аналитики больших данных

Облака бывают разные: компания может организовать собственное облако на базе физической инфраструктуры, арендовать облачные мощности у провайдера или совмещать эти модели.

Частное облако


Частное облако может быть расположено в локальном дата-центре компании или у стороннего поставщика, но инфраструктура всегда размещена в частной сети, аппаратное и программное обеспечение предназначено для одной компании. Как правило, такие облака разворачивают крупные организации, которые закон обязывает хранить данные у себя: госорганы, финансовые и медицинские учреждения.

У частного облака есть плюсы: IT-ресурсы проще настроить под потребности компании, их использует только одна компания, она полностью контролирует всю инфраструктуру. Есть и минусы — стоимость развертывания частного облака высока: нужно организовать собственный ЦОД, на котором будет развернута облачная платформа, обслуживать оборудование, оплачивать услуги персонала, администрирующего систему. Кроме того, собственное оборудование компании постоянно устаревает, а приложения требуют обновления, и приходится об этом помнить. При аренде облака все это на себя берет провайдер.

Если данные компании будут храниться в одном месте (одном ЦОДе), то есть риск их потери, например, из-за стихийного бедствия или пожара. Избежать этого можно с помощью распределенного ЦОДа: когда инфраструктура дублируется в других дата-центрах. Однако такой вариант IT-инфраструктуры еще дороже. Кроме того, хранение данных в частном облаке и полный контроль компании над инфраструктурой не исключают злоупотреблений со стороны сотрудников: данные могут быть похищены или утрачены из-за непредумышленных и умышленных действий персонала.

Наконец, масштабируемость в частном облаке — это, скорее, вопрос быстрого перераспределения его вычислительных ресурсов между проектами. И если с точки зрения отдельного проекта можно говорить, что частное облако дает быструю масштабируемость, то увеличение общей мощности также ограничено скоростью закупок и введения в эксплуатацию, как и в традиционных ИТ-системах.

Публичное облако

Публичное облако управляется провайдером услуг, у которого компания арендует готовую платформу для анализа Big Data, такую форму аренды называют облачная платформа как услуга (PaaS). При этом облаком пользуются совместно несколько или много компаний, однако, каждая получает доступ только к своим данным.

Провайдеры облачных услуг обязуются обеспечить выполнение критичных для клиента требований по четко оговоренным критериям. Уровень сервиса, гарантии защиты и конфиденциальности прописывают в SLA ( соглашении о качестве услуг), NDA (соглашении о неразглашении) и других соглашениях. Поставщик несет юридическую и финансовую ответственность за работу приложений, размещенных в облаке, и сохранность информации бизнеса.

В общедоступных облаках ниже риск потери данных и доступа к сервисам, так как хранение данных и выполнение приложений на многих серверах параллельно обеспечивает защиту от сбоев. Кроме того, публичные облака обладают почти неограниченной емкостью и “резиновым” масштабированием — провайдер может выдать компании столько мощностей, сколько нужно для обработки данных, почти мгновенно, даже если их количество неожиданно вырастет в десятки раз.

Есть два основных варианта предоставления услуг анализа больших данных в облаке:

  1. Подход IaaS — провайдер предоставляет виртуальные машины, хранилище и необходимые подключения. Однако клиент отвечает за донастройку операционной системы, установку приложений, их интеграцию и администрирование. Этот подход дает компании максимальную гибкость в выборе платформы анализа больших данных и контроль над ее тонкими конфигурациями, но требует усилий по ее администрированию.
  2. Подход PaaS — провайдер развертывает и настраивает для пользователя все сервисы у себя в облаке, пользователю нужно только указать количество необходимых ресурсов, не придется заниматься установкой и настройкой программного обеспечения, поддерживать его. Сервис для анализа больших данных PaaS обычно состоит из предварительно настроенного кластера на основе платформ анализа данных с открытым кодом, например: Hadoop, Spark, Kafka, с некоторыми предварительно загруженными и настроенными инструментами. Из нескольких таких инструментов в облаке можно составлять «конвейеры» обработки больших данных. Провайдеры таких PaaS обеспечивают легкую интеграцию с другими облачными сервисами, важными при работе с данными — хранения данных и машинной обработки
Мастер Йода рекомендует:  История успеха программиста превращение мечты детства в реальность

Гибридное облако

Гибридное облако — комбинация частного и публичного облака. Такой вариант подходит для компаний, у которых уже есть своя инфраструктура, но нужно снизить нагрузку на нее или протестировать новые сервисы без первоначальных капитальных затрат. Так, общедоступное облако можно использовать для систем с большим объемом данных и отсутствием требований к хранению данных «у себя», а частное облако — для ситуаций, когда такие требования есть: например, для определенных типов персональных и финансовых данных.

Например, персональные данные можно хранить на стороне компании в соответствии с законодательством, а в обезличенном виде обрабатывать в облаке: это не противоречит закону.

Где лучше работать с большими данными: частное или публичное облако

Экономичность. Для развертывания частного облака нужно приобрести оборудование, нанять персонал, развернуть и обслуживать инфраструктуру — все, как с традиционной IT-инфраструктурой. Это большие расходы, которые могут быть оправданы и выгодны, если у компании предсказуемый объем обработки данных, она может себе позволить платить администраторам серверов и аналитических платформ, спланировать закупку оборудования, нагрузку и штат так, чтобы инфраструктура не простаивала.

При аренде публичного облака у провайдера используют оплату по модели pay-as-you-go — компания платит только за используемые мощности, никаких первоначальных вложений и затрат на обслуживание нет, что подходит для компаний малого и среднего бизнеса, а также для новых проектов в крупных компаниях, если нагрузка непредсказуема, или компания не хочет заниматься организацией собственного ЦОДа. Аренда облачных сервисов позволяет не думать о планировании и расходах, сфокусироваться на бизнес-задачах в условиях, когда нагрузку на IT-инфраструктуру невозможно предугадать: бывают всплески активности или бизнес-модель может неожиданно пойти в рост.

Масштабируемость. Возможности масштабирования частного облака ограничены мощностью физического оборудования, на котором оно развернуто, и скоростью закупки и ввода в эксплуатацию новых мощностей (в лучшем случае — речь минимум о неделях).

Если объем ваших данных растет, публичное облако подстроится под изменения и выделит больше мощностей для хранения и обработки. Грубо говоря, у вас может появиться сотня серверов вместо двух буквально за несколько минут. А если ресурсы для анализа Big Data стали не нужны, мощности облачной IT-инфраструктуры не тратятся, вы за них не платите.

  • объем обрабатываемых данных постоянно растет;
  • вы не можете точно предсказать, какой объем хранения и обработки нужен для работы и какими будут темпы прироста данных;
  • если компания проводит раз в месяц исследования или измеряет эффективность каких-то процессов, а постоянно работающая собственная инфраструктура для анализа Big Data не нужна;
  • если вам нужно тестировать бизнес-гипотезы, например, в облаке можно создать MVP (минимально жизнеспособный продукт) и оценить его перспективы.

Эффективность. Частное облако, расположенное на оборудовании компании, компаниям нужно обслуживать и администрировать самостоятельно.

При предоставлении публичного облака как услуги команда компании может меньше заниматься обслуживанием системы обработки данных, сосредоточиться на создании и тестировании идей, что повышает эффективность аналитики.

Быстрый запуск проекта (time-to-market). Частное облако может замедлить выпуск IT-продуктов на рынок. Для проектов, использующих большие данные, требуются огромные инфраструктурные мощности, что при размещении in house предполагает высокие капитальные затраты на запуск.

Аренда публичного облака позволяет запустить IT-инфраструктуру без больших первоначальных инвестиций. В общедоступном облаке инфраструктуру для анализа данных можно создать и настроить за часы, а не недели и месяцы, конкретный PaaS-сервис подключается за минуты.

Отказоустойчивость. В частном облаке бесперебойную работу можно обеспечить средствами Disaster Recovery, но это потребует серьезных капитальных вложений, расходов на введение в эксплуатацию и поддержку этих средств.

В публичном облаке провайдер задействует средства, обеспечивающие бесперебойную работу, что значительно снижает время недоступности системы. При выборе поставщика услуг с высоким уровнем SLA простои инфраструктуры будут сведены к минимуму, они предсказуемы: вы сами выбираете соглашение о сервисе нужного уровня. Например, при SLA 99,95% IT-инфраструктура простаивает всего около 5 часов в год.

Обеспечение требований законодательства. В частном облаке компания следит за выполнением требований законодательства и регуляторов. Например, существуют законодательные нормы, которые устанавливают правила того, как компании могут хранить данные. Их нужно учитывать при разворачивании собственной инфраструктуры.

В публичном облаке ответственность за соблюдение законодательства, требований и стандартов, сертификацию ЦОД лежит на провайдере.

Какие данные анализируют в облаке и что такое дата-ориентированное управление

По итогам отчета «Обзор тенденций и проблем больших данных 2020 года», 73% компаний используют для обработки Big Data облачные сервисы. Для сравнения — в 2020 году их было 58%.

Большие данные используют в различных областях: телеком, здравоохранение, торговля, логистика, финансовый сектор, госкомпании.

Также с большими данными тесно связан интернет вещей. Датчики, измерительные приборы, оборудование на роботизированных заводах, умный транспорт — от них компании получают огромное количество данных, которые надо исследовать и анализировать.

Основные сферы, где компании используют анализ больших данных для принятия решений. Источник

Компании недостаточно просто собирать данные и делать какие-то отчеты. Результатом аналитики должны быть выводы, представляющие ценность для бизнеса, которые можно учитывать в процессе дальнейшей работы, — в этом суть data-driven (дата-ориентированного) подхода к принятию управленческих решений.

В облаках можно хранить и обрабатывать самые разнообразные данные. Источник

Чтобы эффективно работать с данными, компании надо учитывать не только структурированные данные из CRM или других систем учета, но и неоднородные и неструктурированные, собранные из множества различных источников.

Структурированные данные — те, что собираются в базах данных в определенном формате. Например, это может быть таблица со строго определенными полями, где в одном столбце данные, идентифицирующие клиента, в другом сумма его покупок, в третьем дата и так далее. Неструктурированные данные — разнородные массивы информации без четкой структуры, например: текстовые файлы, изображения, комментарии из соцсетей. Эти данные помогают найти скрытые взаимосвязи и проанализировать предпочтения клиентов, стратегии конкурентов, тенденции ценообразования и другие важные для компании параметры.


Облачные платформы для анализа больших данных позволяют анализировать структурированные и неструктурированные данные, интегрировать данные из разных источников, работая с ними на единой платформе. Это дает бизнесу новые возможности, позволяет компании стать дата-ориентированной: принимать взвешенные и верные решения на основе информации, а не предположений.

Кроме того, облачные сервисы позволяют анализировать не только исторические большие данные, которые нужны для различных исследований, прогнозирования, выявления трендов и лучшего понимания процессов работы компании, но и данные в реальном времени.

Исторические данные — данные, собранные за определенный период. Их анализируют и выявляют различные закономерности, которые важны для решения конкретных задач бизнеса. Например, можно узнать, что какие-то товары обычно покупают в первой половине дня, а какие-то во второй. Или увидеть, какие товары часто покупают вместе. Данные в режиме реального времени — информация, что поступает в хранилище прямо сейчас.

Мониторинг данных в реальном времени важен, чтобы отслеживать некоторые бизнес-процессы. Например, банки могут анализировать денежные переводы и выявлять попытки мошенничества при операциях с картами, а транспортные компании быстро менять маршруты водителей с учетом поступающей информации о новых заказах. На таком же принципе строится автоматический аукцион при отображении онлайн-рекламы (bidding) — когда система выбирает, какое объявление показать новому пользователю на основании информации о нем и ставках рекламодателей.

Где попробовать облачный анализ больших данных

Big Data на практике: 5 денежных идей для бизнеса

автор книги «Диджитал Эра», Основатель и СЕО Fintech Solutions

«Big Data как тинейджерский секс: все об этом говорят, никто на самом деле не знает, что это и как, но все думают, что уже все этим занимаются и потому тоже говорят, что делают это…»
Ден Ариэли

Big Data: интересные факты Фото: something-wrong6.icu

Все наши смартфоны и лаптопы, приборы, домашняя техника, а также другие электронные устройства только и делают, что накапливают данные о наших привычках и предпочтениях. Каждый клик, лайк, пост, смс и даже просто просмотр – все это добавляет ценнейшие данные в мировую копилку информации.

Хотите знать, что такое данные и каков масштаб «трагедии»? Тогда проанализируйте лишь несколько фактов и цифр:

  • Более половины поисковых запросов мы делаем со своего смартфона
  • Более 3,7 млрд людей используют Интернет
  • Каждую секунду Google обрабатывает 40 тыс поисковых запросов (это более чем 3,5 млрд запросов в день)
  • На Google приходится около 80% всех запросов в мире
  • Все поисковики отвечают на 5 млрд запросов в день

Посмотрим на данные соцсетей. Благодаря интереснейшему ежегодному отчету Data never sleeps 6.0 мы можем взглянуть на интересные факты о данных. Например, ученые считают, что к 2020 году на 1 человека на земле будет приходиться 1,7 Мб данных, создающихся ежесекундно. А если посмотреть на то, что называют большими данными с перспективы 1 минуты, то картина будет выглядеть так – за одну минуту в 2020 году:

  • Linkedin пополняется 120 новыми пользователями
  • На YouTube просматривают более 4,3 миллионов видео
  • Отправляются 13 миллионов СМС-ок (кстати, это почти на 2 миллиона в минуту меньше, чем год назад)
  • Пользователи публикуют 49 480 фотографий в Instagram (к слову, у этой сети 600 миллионов почитателей, из них 400 миллионов активны каждый день)
  • Американцы используют 3 138 420 Гб интернет-данных
  • Amazon упаковывает 1 111 посылок (во время пиковой нагрузки компания пакует 306 единиц товара ежесекундно – а это 26 миллионов посылок в день)
  • Отправляется 156 миллионов e-mails.

Раз уж заговорили о соцсетях, предлагаю внимательнее рассмотреть данные крупнейшей в мире сети – Facebook:

  • Ежедневно в сети Facebook «активничают» 1,5 миллиарда людей. 307 миллионов из них – европейцы
  • Ежесекундно в сети создается 5 новых профилей
  • Приложение соцсети ежедневно пополняется 300 миллионами фотографий
  • Каждую минуту люди постят здесь 510 000 комментариев и 293 000 обновлений статусов.

Давайте разберемся, что же такое большие данные?

Цифровая сыворотка правды

Множество невероятных фактов о работе с большими данными приводится в книге «Все лгут. Поисковики, Big Data и Интернет знают о вас все» бывшего аналитика Google – Сета Стивенса-Давидовица. Приведу выбранные мной ТОП-7 наиболее ярких тезисов из этого бестселлера:

  1. Совершая поисковые запросы, мы сами являемся источником наиболее достоверной информации. То, когда и где мы ищем факты, цитаты, шутки, места, людей, вещи или помощь, может рассказать гораздо больше о наших реальных мыслях, желаниях, опасениях и делах, чем можно себе представить.
  2. Вам не всегда нужны тонны информации для того, чтобы прийти к нужным выводам. Важно помнить, что мы лжем друзьям, любовникам и любовницам, врачам, опросам и самим себе.
  3. Самое главное при работе с большими данными — умение задавать правильные вопросы.
  4. Многие выводы можно сделать интуитивно. Но больше данных дадут большую четкость изображения. К тому же мы часто делаем выводы, базируясь на своем опыте, а нам свойственно преувеличивать его значение.
  5. Революционная суть больших данных не в том, чтобы собирать все больше сведений, а в том, чтобы собирать только нужные.
  6. Все врут всем и себе в том числе. Примерно в трети случаев. Из-за сильного желания произвести хорошее впечатление. Возможно, именно ложь провалила соцопрос, не сумевший предсказать победу Трампа в 2020 году. Но Google знает правду — порно ищут чаще, чем погоду.
  7. Интернет — цифровая сыворотка правды. Фейсбук – анти-сыворотка.

Big Data на практике – 5 «денежных» идей для бизнеса

Большие данные стали преимуществом финтех-стартапов. Это удивительно потому, что именно крупные корпорации располагают обширной базой клиентов, а значит, и доступом к информации. Но в итоге используют данные именно стартапы.

Уверена, что в ближайшем будущем открытость данных станет базовой необходимостью – публичность цифр компании поможет получить лучшие финансовые условия.
О том, что Большие данные = Большие деньги сами за себя говорят цифры. Благодаря искусственному интеллекту и обработке больших данных, банки смогут выполнять проверку документов, информации и улучшать процессы. Один из примеров – программа COIN (от Contract Intelligence) банка JP Morgan. Программа провела проверку 12 тыс кредитных договоров за считанные секунды. Ранее банковским сотрудникам для проверки такого же количества договоров понадобилось бы 360 тыс часов.

Идея 1. Анализ мнений и настроений

Анализ мнений и настроений можно выполнять благодаря нашей с вами активной коммуникации в соцсетях – когда пользователи обсуждают, лайкают, критикуют продукты, бренды, услуги. Проводя быстрый анализ мнений, можно понять, какие продукты или компании нравятся, или не нравятся пользователям. Важно также проанализировать причины пользовательских настроений.
Для мониторинга важно обращать внимание на мнения, чувства и отношение к продукту или бренду. Если вы пользуетесь правильным инструментом для анализа, вы сможете также идентифицировать наиболее влиятельных пользователей, мнение которых важно для сообщества в соцсетях. Ну а анализ отзывов поможет усовершенствовать продукт или улучшить сервис.

Например, BBVA, работающий с базой из 47 млн пользователей в более чем 30 странах, постоянно анализирует данные в соцсетях для настройки своих маркетинговых компаний.

Когда компании Ford понадобилось отвоевывать потерянный рынок автомобилей, маркетологи определили 100 наиболее влиятельных блогеров и запустили кампанию в партнерстве с ними. В рамках кампании, каждому блогеру вручили по машине и определили миссию. В итоге вокруг Ford Fiesta было много пиара за гораздо меньшие деньги, чем, если бы маркетологи использовали телевидение.

Starbucks вообще пионер по работе с лидерами мнений – реклама сети строится по принципу «сарафанного радио» и клиенты щедро делятся идеями на портале mystarbucksideas.com.

В аналогичном примере компания Dell во время анализа отзывов в сети «услышала», что в их новом лаптопе случается перегрев. И компания сразу же направила усилия на исправление дефекта.

Идея 2. Знай своего клиента 360°

Клиентский опыт и то, какие решения и действия клиент совершал ранее, могут многое рассказать о будущих поступках. Привычки человека – совершать покупки, ездить отдыхать и так далее – формируют полную картину о стиле его жизни. Когда вы хорошо владеете профилями своих клиентов, вы можете формулировать им максимально индивидуализированные предложения. Большие данные помогут не только понять, как на самом деле клиент относится к вашему продукту, но и предсказать падение интереса клиента или даже его уход к конкуренту.


Банк HDFC хорошо знает жизненный цикл своего клиента и предлагает ему с помощью хорошо настроенного целевого сообщения активировать кредитную карту под подходящие события. В итоге во много раз выросла активация кредитных карт и снизилась стоимость привлечения новых клиентов.

Британская компания HMV давно узнала, что клиенты не открывают большинство писем одинакового содержания, которые уходят как массовая рассылка. Поэтому поработав с данными, они начали рассылать клиентам персонализированные рекомендации и их письма открыли более 70% пользователей на мобильных телефонах и порядка 50% писем — на компьютере.

Компания American Express построила свои предиктивные модели на базе исторических данных клиентов. В этих моделях использовано 115 переменных для прогнозирования оттока клиентов. В итоге компания может идентифицировать около 24% счетов, которые с высокой степенью вероятности будут закрыты в ближайшие 4 месяца. И, конечно же, эти знания будут использованы, чтобы не допустить уход клиентов.

Использование схожих предиктивных моделей помогло Tatra Bank в Словакии снизить отток клиентов, пользующихся кредитными картами, на 30%. Согласитесь, это серьезный результат.

Идея 3. Сегментирование

Мы всегда сегментируем своих клиентов, но, анализируя большие данные, можем увидеть совершенно новые сегменты. Сгруппировав клиентов иным способом, мы сможем более точно узнать, какие характеристики наших продуктов наиболее важны для разных потребители. Мы можем значительно увеличить активность использования карт, предлагая клиентам персонализированные программы лояльности или кешбек, если будем хорошо понимать, что именно они предпочитают. Представьте, что вы сможете узнать, сколько клиенты разных групп готовы платить за ваш продукт. А ведь это серьезное изменение вашей ценовой политики.

Используя аналитику больших массивов данных, Bank of America изменил обращение к клиенту с «Используйте стоимость вашего дома, чтобы отправить детей в школу» на «Используйте стоимость вашего дома, чтобы сделать то, о чем давно мечтали». Сложно сказать, чего именно всегда хотели клиенты банка, но конверсия увеличилась в 10 раз.
Ценовые стратегии таких компаний, как Ryanair и Etihad, строятся на алгоритмах, сегментирующих клиентов и анализирующих готовность клиента заплатить ту или иную цену.

Идея 4. Следующее лучшее предложение

Этот кейс строится на прогнозировании того, какую покупку ваш клиент сделает в ближайшее время. Вовремя предложить сопутствующий товар или услугу – и вы увеличиваете продажи. Это целое искусство разобраться, какой сервис или продукт наиболее подходит для дополнительной продажи.

Самый яркий и понятный пример – от Tesco. Итак, молодой папа покупает подгузники, и тут же вслед ему на имейл отправляется купон на детские игрушки, а главное – на пиво. Потому что сеть супермаркетов знает, что теперь юный папа проводит меньше времени с друзьями в пабе, и ему очень нужно расслабиться дома.

И, конечно же, вы знакомы с кросс-продажами от Amazon – обычно они сопровождаются текстом «Вам также будет интересно…» и «С этим продуктом клиенты также покупают…».

Идея 5. Мультиканальность

Наверное, это самая больная тема. Все мы знаем, что клиент может общаться с банком в отделении, по телефону, в сети, реагируя на ТВ-рекламу, реагируя на блоги и рекламу в соцсетях и так далее. Как сделать так, чтобы каждый раз банк не выглядел для своего клиента как «И снова здравствуйте»? Мультиканальность и анализ больших данных здесь означают, что мы с вами будем лучше понимать, какое общение и через какие каналы ожидает от нас клиент. Ведь так чудесно было бы коммуницировать с пользователями там, где им это удобно на им же понятном языке.

Правильная работа с данными поможет увидеть реальную воронку продаж через все каналы банка и также определить тенденции и паттерны, ведущие к покупке. Благодаря качественному анализу больших данных во всех каналах мы, наконец, сможем ответить на вопрос, какой канал ответственен за покупку. Ведь чаще всего клиенты исследуют сервис и продукт. И канал, через который покупка совершается, не обязательно является тем каналом, который помог принять решение о покупке.

Подведем итоги

Чтобы выдержать конкурентную борьбу, необходимо работать с данными, внедрять эту практику в механизм принятия решений и любые стратегии выстраивать только основываясь на клиентских данных. Начните внедрять аналитику больших данных в свои операционные модели, пусть даже и с маленьких шагов, и к вам потянутся клиенты и деньги.

Big Data в маленькой компании: какие инструменты нужны бизнесу

Еще несколько лет назад Big Data ассоциировалась с огромными корпорациями, в которых трудятся тысячи сотрудников, а счет бюджетов идет на миллиарды долларов. Сегодня даже маленькие компании могут позволить себе работу с большими данными. Произошло это по нескольким причинам.

Первая — повышение доступности серверов и увеличение их мощностей. Раньше для серьезных задач, связанных с обработкой больших массивов данных, требовались целые ангары, заставленные оборудованием. Сегодня компьютеры стали более компактными и быстрыми. К тому же активно развивается система аренды — необязательно покупать все и сразу.

Вторая — появление облачных сервисов, которые с точки зрения мобильности, общего доступа к информации и скорости стали идеальным ответом на вызовы, стоящие перед небольшой компанией с огромными амбициями и ограниченными бюджетами.

Третья — усиление специализации. Рынок так сильно сегментирован, что на одном узком поле могут существовать десятки специализаций, каждая из которых имеет свои особенности.

Во главе угла оказались не мощности и бюджеты, а креативный подход к бизнесу. Масштаб перестал играть решающую роль — даже маленький бренд, отличающийся оригинальными услугами, может стать лидером и задавать тренды на всем рынке. Разберемся на конкретных примерах, как можно повысить эффективность бизнеса с помощью Big Data.

Технологий существует много, как и способов взаимодействия с клиентами. Со своей аудиторией нужно общаться через все возможные платформы — мессенджеры, соцсети, электронную почту и т.д. Однако в большинстве случаев финальная договоренность о встрече происходит через звонок, поэтому остановимся именно на тех решениях, которые позволяют брендам заговорить с потенциальными клиентами по телефону.

Работают ли холодные звонки

Многих волнует вопрос тактичности холодных звонков. Согласно нашим исследованиям, пользователи с большим энтузиазмом реагируют на первый шаг со стороны компании и рады, что им предлагают те продукты, в которых они были заинтересованы. В среднем уровень негатива со стороны потенциальной аудитории брендов чрезвычайно мал — от 0,5 до 1%. Самое интересное заключается в том, что те, кто ищет элитные объекты недвижимости и премиальные автомобили, настроены более лояльно. Сказывается то, что такие люди уже привыкли к высокому уровню клиентского сервиса и общению с продавцами по телефону.

Как дозвониться до людей через контекст

Источников трафика может быть много. Смоделируем ситуацию на примере контекстной рекламы.

Контекстная реклама способна «заваливать» пользователя тоннами предложений, показывать ему разные вижуалы и удивлять самым искрометным креативом, но не может сделать одного — заговорить с ним на человеческом языке. И именно этот барьер удается устранить, если обратиться к большим данным. На практике это происходит так:

  1. Пользователь заходит в поисковик и интересуется покупкой автомобиля;
  2. На него таргетируется контекстная реклама с различными предложениями на заданную тему;
  3. После посещения нескольких сайтов пользователь уходит. Лидом он так и не стал;
  4. Вроде бы все, но не в случае с использованием больших данных. Чтобы продолжить работу с ушедшим пользователем, запускается технология определения номеров и cookie match — сопоставление сведений о человеке с информацией от партнеров, у которых он мог зарегистрироваться, оставить данные и разрешить рекламную коммуникацию со стороны третьих лиц.
  5. В один прекрасный день у пользователя звонит телефон;
  6. Менеджер или оператор специализированной платформы выясняет у него интерес к покупке конкретного автомобиля и задает еще ряд ключевых вопросов;
  7. При согласии пользователя начинается классическая продажа.

Плюсы:

  • Отлично работающий классический инструмент интернет-рекламы усиливается новыми технологиями;
  • Эффективность обработки трафика заметно увеличивается.

Минусы:

  • В контексте присутствует доля случайных посещений — кто-то смотрел ради интереса, случайно кликнул по баннеру, мониторил рынок.

Важно понимать, что это не замена контекстной рекламы, а возможность получить с нее больше лидов.

Расставляем сети для потенциальной аудитории с помощью претаргетинга


Возможно, вы видели, что у одного бренда (допустим, это жилой комплекс) существуют несколько посадочных страниц. И это не фейки, а официальные сайты объекта. Все это сделано для полноценного использования технологии претаргетинга.

Она помогает, когда важно максимизировать объем обращений. Стоит отметить, что для этого нужны достаточно большие вычислительные мощности, один сервер здесь явно не справится. На помощь приходят облачные решения, которые позволяют гибко масштабироваться, избегая нагрузочных падений.

Схема претаргетинга работает следующим образом: зеркальные страницы, дублирующие контент, становятся источниками трафика. Чем их больше, тем выше шанс того, что нужный пользователь получит необходимую информацию. С полученными данными о посетителях каждого сайта можно поступать разными способами.

К примеру, часть аудитории сама превратится в лиды, если на каждом из сайтов создать форму обратной связи. Кроме того, в рамках этой схемы также можно использовать технологии cookie match и холодные звонки, чтобы повысить эффективность.

Плюсы:

  • Получение новой аудитории;
  • Увеличение охвата;
  • Дополнительная активность бренда.

Минусы:

  • Для обработки большого количества информации требуются соответствующие вычислительные мощности и серверы.

Возвращаем заинтересованную аудиторию

Решения на основе технологии «ретаргетинг в звонок» предназначены для работы с аудиторией уже на сайте рекламодателя, для чего устанавливается специальный код. Пользователь может проявить интерес, но, например, не совершить целевых действий и не оставить никаких контактов. Чтобы его вернуть, происходит все то же самое, что и в случае с контекстом.

Плюсы:

  • Увеличение конверсии сайта до 30%;
  • 100% качественные звонки;
  • 6-10% — конверсия в продажу в зависимости от сектора;
  • Отсев нерелевантных посетителей сайта.

Данные цифры получены с помощью анализа соответствующих рекламных кампаний, в которых используется ретаргетинг в звонок.

Минусы:

  • Ретаргетинг в звонок очень зависим от качества трафика на сайте рекламодателя. Если трафик низкого качества, то количество лидов будет невысоким;
  • Эта технология не может быть единственным способом продвижения. Она позволяет улучшить результаты с уже имеющегося трафика;
  • Большое влияние на эффективность технологии оказывает имидж бренда. Если имеются какие-либо проблемы репутационного характера, это непременно отразится и на работе ретаргетинга в звонок.
Мастер Йода рекомендует:  Как отказаться от jQuery в современном фронтенде опыт команды GitHub

Важно понимать, что при использовании такой технологии через специализированные платформы до бренда доходит не просто лид, а уже профессионально обработанный пользователь, готовый к сделке и четко понимающий свои желания и потребности. Продавцам со стороны рекламодателя не приходится тратить время и остается главное — продавать.

Без человека ничего не заработает

Любая из технологий с использованием Big Data повышает прозрачность, что очень важно сегодня для рекламной индустрии. Технологии ретаргетинга в звонок и претаргетинга, а также им подобные позволяют отслеживать пользователя и коммуникацию во всех точках соприкосновения. Таким образом рекламодатель может анализировать воронку продаж на любом этапе и четко понимать эффективность и пользу от используемых технологий.

Однако нет никакой пользы от технологий, если результаты разбиваются о нежелание продавца работать.

Казалось бы — отделы маркетинга и продаж связаны одной целью. Тем не менее часто они не слышат друг друга. Согласно нашим внутренним исследованиям, порядка 30-35% контактов в недвижимости и авто после первичной консультации ждут повторную коммуникацию, но менеджеры из отдела продаж с ними не связываются. Около 10-15% контактов говорят, что готовы рассмотреть приобретение недвижимости или автомобиля, но их не устроило качество общения с отделом продаж. Если вы заинтересованы по максимуму использовать современные технологии, то следует убедиться, что ваш отдел продаж внимательно относится к каждому звонку.

Обобщая все вышесказанное, можно сделать следующие выводы:

  1. Сегодня Big Data — это история не про обладание сотнями серверов, а про возможности максимально использовать то, что уже есть;
  2. Технологии на основе данных сами по себе не панацея, нужно выбирать такие решения, которые дополняют другие инструменты;
  3. Большие данные дают возможности, но именно человек воплощает их в жизнь.

Подписывайтесь на канал «AdIndex» в Telegram, чтобы первыми узнавать о главных новостях в рекламе и маркетинге.

Продвижение B2B в соцсетях

Немало копий было сломано при обсуждении эффективности использования социальных сетей для продвижения бизнеса в сегменте B2B. Агентство Pro-Vision Communications привело свои аргументы «за» и «против» и проиллюстрировало для Pressfeed эффективность продвижения B2B на реальных примерах.

Нужно ли В2В-брендам продвижение в соцсетях? Сегодня этим вопросом с завидной частотой задаются как SMM-специалисты, так и представители бизнеса. Существует целый ряд исследований, а также удачных и неудачных кейсов, являющихся сильными аргументами «за» и «против». Наша команда провела анализ целей и задач В2В-брендов, для достижения которых они используют социальные сети и различные варианты их реализации.

Статистика по продвижению B2B в соцсетях

Для начала бросим взгляд на текущее положение дел и приведем несколько интересных цифр из исследования компании CMO Survey в сотрудничестве со школой Бизнеса Фукуа при Университете Дьюка, США:

  • От 10 до 12% бюджета крупных В2В-компаний идет на маркетинг, из них 8-10% — на работу с социальными сетями.
  • От 7,5 до 9% продаж приходят в В2В из интернета. А каждая вторая из компаний, занимающихся продвижением в соцсетях, оценивает результаты своего присутствия там как «крайне положительные».

Более того, по данным исследовательской компании Eloqua, для 82% В2В-брендов работа в социальных сетях является главным способом повысить узнаваемость компании.

Таким образом, годовой прогноз по увеличению бюджетов на работы по ведению корпоративных аккаунтов компаний в сети сразу на 20% не выглядит сюрпризом.

Однако однозначные выводы на основе этой информации сделать сложно. Во-первых, эти данные получены на основе анализа американских компаний. Во-вторых, всегда стоит помнить, что самое сильное оружие бесполезно в руках человека, который не знает, как им пользоваться.

Именно ошибочное определение целей, инструментов и площадок при работе с соцсетями ведет к тому, что страница компании становится похожа на:


1. Новостной бизнес-блок.

2. Личный блог, рассказывающий о компании для самой же компании.

3. Отчаянную попытку «быть в тренде».

Наиболее частый пример: неудачное использование популярных интернет-мемов.

Реальная аудитория и цели продвижения B2B в соцсетях

Итак, какую же аудиторию чаще бренд ищет в социальных сетях, и каких целей он при этом может добиться?

Аудитория B2B:

  • Лица, принимающие решения (топ-менеджеры компаний).
  • Сотрудники, занимающиеся поиском возможных партнеров и клиентов.
  • Потенциальные сотрудники.
  • Увеличить известность бренда.
  • Собрать сообщество лояльных к бренду пользователей для повторной продажи или допродажи.
  • Отслеживать и реагировать на упоминания бренда (услуги) в сети.
  • Увеличить количество положительных отзывов о бренде.
  • Увеличить трафик на сайт из социальных сетей.
  • Лидогенерация или прямые продажи.

Но почему для поиска этих людей и достижения этих целей выбирают именно социальные сети?

  • Высокий охват целевой аудитории. У многих социальных сетей охват аудитории в несколько раз выше, чем у других популярных каналов коммуникации.
  • Минимальная стоимость сообщений. Это позволяет задать любую частоту выхода публикаций, в том числе такую, которая позволит преодолеть зашумленность социальных сетей.
  • Возможность рассказать историю. Подробное описание решения, продукта или услуги, разбитое по отдельным частям или опубликованное одним сообщением, также способно повысить степень доверия или первично познакомить аудиторию с брендом.
  • Мультимедийность и широкий выбор инструментов. Иначе говоря, широкая возможность использования различных форматов в сообщении: видео, текст, баннерные сообщения, интерактив и другие, которые способны привлечь и удержать внимание целевой аудитории бренда.

Проанализировав свою аудиторию и обозначив цели, мы сталкиваемся с наиболее серьезной задачей, от решения которой зависит дальнейший успех всей кампании: выбор социальной сети. На данном этапе ошибка может привести к тому, что бренд не реализует ни одну из поставленных целей и не донесет своего сообщения до своей ЦА. Чтобы этого не произошло, мы предлагаем пошагово рассмотреть следующие факторы:

  • Разбивка аудитории площадки по демографическим, социальным и другим признакам.
  • Популярность социальной сети среди представителей целевой аудитории проекта.
  • Типы контента, предпочитаемые аудиторией площадки и вашего бизнеса.
  • Цели социальной сети.
  • Тон общения в социальной сети.
  • Уровень вовлеченности аудитории.
  • Наличие инструментов, которые вы планируете использовать в своей кампании.

Составив для себя ответ на каждый из этих вопросов, следует перейти к сопоставлению полученных данных с возможностью каждой социальной сети.

Основные социальные сети для продвижения В2В

1. Facebook

Самая крупная социальная сеть в мире бесспорно является одной из ведущих площадок для маркетинга в сегменте B2C. Однако ее можно использовать и в качестве площадки для B2B-кампаний.

Бизнес-страницы и тематические группы — главный инструмент B2B-маркетинга на Facebook. Кроме этого, владельцы таких сообществ имеют доступ к удобным инструментам email-маркетинга, позволяющим осуществлять рассылку подписчикам или членам групп. Продуманная стратегия присутствия бренда на Facebook — один из важнейших элементов современного PR.

Правда, не нужно забывать про то, что сейчас Facebook пессимизирует показы постов от бизнес-страниц. Поэтому маркетинговая стратегия в этой соцсети должна быть серьезно скорректирована. На первое место в новых условиях выходит рекламное продвижение постов и создание тематических групп, контент из которых Facebook приоритизировал в выдаче еще в 2020 году, поскольку в них состоят и общаются люди, разделяющие общие интересы.

Facebook сегодня — одна из наиболее стремительно развивающихся сетей. Ее ежемесячная аудитория составляет более 2 млрд человек. В сети есть возможности личного общения «компания-клиент» и возможность покупки и отправки сообщения напрямую с помощью рекламных объявлений. Также Facebook наряду с LinkedIn всегда будет площадкой №1, если вы ведете бизнес с иностранными компаниями.

Один из самых удачных и вдохновляющих примеров работы в Facebook демонстрирует датская транспортная компания Maersk, которая транслировала в социальные сети процесс транспортировки контейнеров по замерзшему Балтийскому морю. На странице компании также разместили форму, заполнив которую пользователи могли скачать брошюру о морозостойких услугах Maersk. Информация о заинтересовавшихся сразу же поступала в отдел продаж. Это принесло 150 уникальных лидов:

На данный момент у Maersk более 1,5 млн подписчиков в Facebook, из которых около 15% являются клиентами, и более 12 тыс. фолловеров в Twitter. Также у компании есть аккаунты в Instagram, Tumblr, YouTube, Google+ и LinkedIn.

Кстати, в плане вовлеченности аудитории в Facebook среди датских брендов компания уступает только Lego.

А вот General Electric благодаря хорошей работе в Facebook получила статус «самой захватывающей скучной компании».

Действительно, General Electric сложно назвать компанией, способной заинтересовать широкою аудиторию Facebook. Однако именно этот бренд создал одно из самых успешных в мире сообществ, сочетающих в себе обучающий, познавательный и продуктовый контент.


Запущенная под девизом «Воображение в работе», кампания GE в Facebook получила миссию создания позитивного сообщества, где думающие люди могут использовать свое воображение и присоединиться к глобальному диалогу, посвященному энергетике, здравоохранению, транспорту и, конечно же, решениям GE.

Страница бренда в Facebook, число фолловеров которой составляет 2,2 млн человек, сегодня наполнена самым разнообразным контентом: фото, видео, инфографика, информация об общественной деятельности GE и многое другое. Основная мысль заключается в привлечении аудитории к открытому диалогу. Бренд дает полноценные развернутые экспертные ответы на любые вопросы, которые поступают к нему на страницу.

2. Instagram

Как бы это ни было парадоксально, но для наиболее эффективного использования Instagram как маркетингового инструмента необходимо перестать думать о нем как о маркетинговом инструменте вообще.

Instagram необходимо воспринимать как возможность рассказать вашу историю в рамках большой маркетинговой онлайн-стратегии B2B. Вы должны развивать беседу между брендом/бизнесом и вашими подписчиками/клиентами. Чем ближе они к бизнесу, тем больше шансов, что они станут супер-поклонниками.

С помощью Instagram добиться этого проще всего: комментируйте записи других пользователей, делайте репосты, используйте Real Time Marketing. С помощью такого подхода вы обязательно получите необходимый отклик среди того миллиарда людей, которые посещают Instagram ежемесячно.

Ниже мы предлагаем познакомиться с пятью красочными аккаунтами «скучных» компаний:

3. «ВКонтакте»

Месячная аудитория «ВКонтакте», по последним данным, составляет около 100 млн человек. При этом, представление о том, что «ВКонтакте» пользуется лишь неплатежеспособная аудитория, безнадежно устарело.

Во «ВКонтакте» сегодня представлены максимально разные слои общества. Остается лишь найти свою аудиторию, и сейчас для этого имеются всевозможные инструменты. Продвигать В2В здесь можно и нужно.

Однако мы хотим отметить, что для В2В-сегмента использование «ВКонтакте» является наиболее оптимальным при выборе агрессивной и рискованной стратегии. Если вы готовы немного шокировать аудиторию, и ваша общая маркетинговая стратегия согласуется с такими принципами — смело идите в бой. В противном случае риск будет неоправданным, а создание во ВКонтакте «простой» страницы В2В-бренда — менее логично, чем в других сетях.

Читайте также:

Пиарщику, маркетологу, руководителю!
PDF-инструкция «Где и как публиковать статьи бесплатно. 18 медиа-площадок с большими аудиториями».

Конечно, не самый экстремальный, но зато увлекательный метод ведения группы «ВКонтакте» выбрала компания «Росатом».

Стратегия «Росатома» в соцсети схожа со стратегией General Electric: они создают интересные и красивые публикации, объясняя, например, простым языком работу атомного реактора, рассказывая о великих ученых отрасли, памятных датах и многом другом.

4. YouTube

Видео-контент — один из самых востребованных и популярных типов контента для любой аудитории и площадки. По данным Forbes, 52% руководителей крупных компаний хотя бы раз в неделю смотрят на YouTube обучающие видео.

Формат ваших публикаций на YouTube может быть крайне разнообразен: от экскурсий по вашим филиалам до экспертных советов и веселых интервью с сотрудниками. Если вы хотите подарить своему бренду человеческое лицо, то лучше показать это самое лицо с помощью видео, а не скучного текста, который рискует затеряться на фоне тысячи похожих сообщений.

Интересное применение YouTube нашла компания-филиал American Express — American Express OPEN. Они обнаружили, что 60% представителей малого бизнеса становятся банкротами в течение года. Специально для того, чтобы позволить таким фирмам «остаться в деле», AmEx начал воплощать в жизнь стратегию «Открытый форум», в рамках которой делился с предпринимателями советами по тому, как успешно вести дела.

Проведя первичное ознакомление аудитории с идеей Open Forum, AmEx организовал на своих площадках масштабный конкурс «Большая перемена для малого бизнеса», дав возможность предпринимателям рассказать инвесторам о своих идеях и философии. Победители конкурса получали эксклюзивное экспертное руководство от AmEx, а также денежную поддержку на развитие бизнеса. Плюс 30% продаж — такой результат продемонстрировала одна из компаний, победивших во второй год проведения конкурса.

А какую выгоду получил AmEx? Компания получила множество дополнительных контрактов на оформление кредитных карт для малого бизнеса и положительно зарекомендовала себя в предпринимательских кругах.

5. Twitter

Twitter — самый простой способ быстро сообщить важную новость всегда спешащим бизнесменам и журналистам.

Это удобный инструмент для B2B-маркетологов. Здесь можно обнаружить потенциальных потребителей и группировать их в приватные списки. Отслеживая сообщения пользователей, вы узнаете об их интересах и предпочтениях. Это первый шаг к эффективному взаимодействию с будущим партнером. А поисковый алгоритм Twitter и использование хэштегов позволяет организаторам мероприятий быстро распространять информацию о конференциях, воркшопах, семинарах и других событиях.

Например, британская финансовая компания Standard Life размещает на своем сайте большое количество полезной информации и советов касательно финансовой сферы. Было решено транслировать ее в Twitter — в форме своеобразных онлайн-консультаций.

Также компания выделила интересных для себя пользователей и активно прислушивалась к разговорам: с целью найти активных экспертов, которые пользовались наибольшим влиянием. Затем, вступая в разговоры с ними (где это было уместно), компания получала ценных подписчиков.

Выводы

Продвижение в соцсетях имеет ряд преимуществ перед классическим маркетингом и другими инструментами онлайн-продвижения. Реклама в социальных сетях интерактивна, быстро распространяется, имеет нерекламный формат, и ее легко можно сфокусировать на нужной аудитории. Вопреки мифам о высокой стоимости продвижения в соцсетях, SMM может быть недорогим и даже бесплатным: грамотная организация работы в сообществах наряду с четким определением целевой аудитории ведут к существенному повышению продаж.

Однако необходимо учитывать несколько факторов:

  • Традиционный SMM, то есть ведение страницы и информирование о новостях компании в B2B не работает. Кстати, практически любую B2B-компанию можно продвигать в соцсетях, выстраивая персональный бренд владельца или руководителя бизнеса.
  • Соцсети идеальны для привлечения и удержания кадров.
  • Найти свою аудиторию B2B-компания может, создав тематическое сообщество и подпитывая его полезной и актуальной информацией.
  • Создание мероприятия в соцсети — хороший инструмент для любой компании как B2B, так и B2C.

Меры предосторожности:

  • Не допускайте превращения социальных площадок в инструмент самолюбования. Пишите не о себе, а о пользователях. Превратите паблик компании в ресурс, на котором клиенты могут найти полезную информацию или обсудить интересующие их вопросы с другими участниками.
  • Определите актуальные цели SMM. Если вам нужен немедленный отклик, воспользуйтесь контекстной рекламой. А соцсети помогут создавать позитивный фоновый шум, повышать узнаваемость бренда, увеличивать охват аудитории и управлять ее вовлеченностью.
  • Защищайте пользователей от спама и избегайте слишком высокой частоты публикаций контента. Выберите оптимальное количество постов (обычно это не более 2-3 постов в день) и публикуйте их в течение рабочего дня. Следите за активностью участников сообщества, обязательно реагируйте на комментарии и сообщения.
  • Найдите оптимальную форму взаимодействия с аудиторией. Жалобы клиентов не должны попадать в новостные ленты подписчиков. Поэтому используйте премодерацию сообщений на главной странице группы. При этом обеспечьте недовольным пользователям возможность высказаться. Создайте для этого специальную тему или оставьте в группе ссылку на форму обратной связи корпоративного сайта.

Анализ данных социальных сетей

Понятие социальной сети использовалось социологами еще в 20-х годах прошлого века для изучения взаимосвязей между участниками различных сообществ. Психолог и психотерапевт Якоб Морено предложил социограммы, на которых отдельные индивиды представлялись в виде точек, а взаимосвязи между ними — в виде линий. Идею использования аппарата теории графов для изучения взаимоотношений и взаимосвязей между людьми подхватили специалисты в области социологии, психологии, антропологии, политологии, экономики — так сформировалось направление Social Network Analysis, изучающее структурные свойства социальных взаимосвязей, моделируемых в виде графов и сетей. Важным, но весьма трудоемким этапом такого исследования было построение модели на основе различных данных из печатных источников, дополнительных опросов и анкетирования.

Современные социальные сети существенно изменили постановку вопроса — сегодня у исследователей имеется «бесплатный» ресурс для изысканий [1], а стремительное распространение социальных онлайн-сервисов и развитие технологий Больших Данных инициировали интерес к использованию сведений из социальных сетей в различных отраслях. Совместное использование структурных и контентных данных потенциально позволяет применять социальные сети для решения широкого круга бизнес-задач: борьбы с мошенничеством, управления брендом, рекламы товаров и услуг, формирования новых каналов сбыта и др.

В социальных сетях, на форумах, новостных и развлекательных порталах и в блогах содержится много ценного материала, из которого можно добыть информацию о предпочтениях и особенностях людей и компаний. Для этого прежде всего необходимо идентифицировать клиента в каж дом источнике, что позволяют сделать далеко не все ресурсы — на многих из них люди не регистрируются либо указывают недостаточно идентифицирующих данных. Даже там, где данных для идентификации клиента достаточно, может не оказаться полезных дополнительных сведений о нем. Социальные сети в этом отношении являются наиболее подходящим источником, содержащим и информацию для идентификации клиента, и дополнительные данные о предпочтениях, семейном положении, образовании, круге общения и др.

Обогащение профилей клиентов

В общем случае задача обогащения профилей клиентов состоит в следующем. Компания предоставляет базовые данные (имя, фамилия, дата рождения, город) о своих клиентах, и на их основе необходимо найти дополнительные сведения: круг интересов, социальный статус, область профессиональной деятельности, музыкальные предпочтения и т. д. Для решения этой задачи необходимо собрать данные о клиенте из социальных сетей, идентифицировать его, обогатить данные и сформировать единый профиль для каждого клиента (см. рисунок).

Самый простой способ сбора данных — воспользоваться услугами специализированных компаний, собирающих и постоянно обновляющих данные из множества источников. Главное преимущество здесь — быстрота получения информации, что существенно при больших объемах клиентской базы и использовании различных социальных сетей. Недостаток — платная подписка на обновления данных.

Следующий способ — использовать программные интерфейсы, предоставляемые почти всеми популярными социальными сетями. Для различных сетей API отличаются набором доступных данных, ограничениями на количество запросов и стоимостью доступа к интерфейсам. Например, если c помощью программного интерфейса сети «В контакте» можно получить полную информацию о пользователе, то Facebook предоставляет API, возвращающий практически «нулевые» сведения о пользователе. К недостаткам этого метода относится ограничение на количество одновременных запросов и на количество обращений, которые приложение может делать в единицу времени. Кроме того, необходимо постоянно отслеживать изменения в API и обновлять приложение по сбору данных, причем некоторые социальные сети предоставляют важные данные только на платной основе. Преимуществами метода являются возможность получения данных об одном клиенте в структурированной форме (JSON или XML), а также простота интеграции вызовов API в собственное приложение.

Еще один способ — ручной разбор веб-страниц социальных сетей, а также использование готовых краулеров для сбора данных с последующим разбором. В этом случае имеется доступ ко всем открытым данным и отсутствуют ограничения на скорость их сбора. К недостаткам следует отнести сложность реализации — веб-страница каждой социальной сети уникальна, поэтому каждый раз придется разрабатывать свои правила разбора. Недостатками являются также сложность поддержки и необходимость больших вычислительных ресурсов, правда, этот процесс хорошо распараллеливается.

Идентификация клиента — обнаружение всех профилей, представляющих конкретного клиента в социальных сетях. Исходными данными для поиска могут служить пас портные данные, однако будет полезна и дополнительная информация. Сузить круг и помочь при поиске человека могут такие сведения, как название компании, в которой он работает, номер телефона, адрес почты, место учебы и список друзей.

Самым простым способом идентификации является поиск по точному совпадению всех известных характеристик клиента, однако необходимо учитывать, что соответствующие характеристики в социальных сетях достоверны лишь до определенной степени — они могут отсутствовать, быть заведомо ложными либо допускать различные варианты написания. Поэтому перед проведением идентификации необходимо произвести очистку и нормализацию данных, а также проверить правильность указанных в профиле параметров — например, город пользователя можно уточнить на основе анализа его подписок, постов и статусов.

Некоторые параметры можно восстановить, анализируя профиль пользователя или его друзей. Например, женщины очень часто не указывают год рождения, тогда как имеется год окончания университета или школы.

Каждая характеристика, используемая при идентификации, имеет некий вес — сумма всех весов при совпадении всех параметров должна быть равна единице. Так, фамилия, имя и пол — одни из самых важных параметров во время идентификации, и если эти данные указаны неверно, то с высокой степенью вероятности идентифицировать этого пользователя не удастся. На втором месте стоят день и месяц рождения. Эти данные поддаются восстановлению, но без них шанс на удачную идентификацию также весьма низкий. Город и год рождения имеют самый низкий вес. Однако именно эти параметры лучше всего поддаются восстановлению на основе других данных.

Кроме данных, которые пользователи сети явно указывают в своих профилях, многое можно узнать, анализируя посты, группы подписки и фотографии. При этом интерес представляют дополнительные факты, которые можно извлечь из этой не структурированной информации. Напри мер, если в большинстве записей на стене речь идет о впечатлениях о фильмах, то ясно, что пользователь интересуется кино.

Автоматический анализ текстов невозможен без лингвистических технологий. Кроме того, для решения многих задач полезны также статистические методы, технологии машинного обучения и углубленный анализ данных (data mining). Статистические исследования и работа с естественным языком обычно связаны с некоторой неточностью — в статистике речь всегда идет об определенных допущениях, эвристических предположениях, которые не всегда полностью выполняются, а в естественном языке всегда есть вероятность неоднозначного толкования утверждений и выводов. Правильное сочетание лингвистических и статистических подходов повышает качество результата и уровень его достоверности. Для иллюстрации возможного соотношения различных методов при текстовом обогащении данных рассмотрим несколько примеров.

Допустим, нам необходимо узнать, интересуется ли пользователь футболом. Определим, насколько часто в текстах на его стене встречаются соответствующие термины, и при достижении некоторого уровня их появления можно сделать определенные выводы. Для такого метода обогащения необходимо знать терминологию, получить которую можно из словарей или тезаурусов по конкретной предметной области. Кроме того, нужно еще и уметь правильно подсчитать количество употреблений — понимать различные формы одного и того же слова. Таким образом, для данного примера достаточно только лингвистических средств.

Второй пример относится к случаю, когда кроме лингвистической обработки необходимы методы машинного обучения. Предположим, что у пользователя не указана полная дата рождения и требуется определять возрастную группу на основе текстов, которые он пишет. Прежде всего формируется набор текстов пользователей, возраст которых известен. Затем для этого набора с помощью алгоритмов машинного обучения выявляются особенности текстов для каждой возрастной группы и формируется некоторая формальная модель, позволяющая для произвольного текста оценить возраст его автора. Алгоритмы машинного обучения обычно рассчитаны на структурированные данные, поэтому перед их применением тексты заменяются на наборы встречающихся в них слов или на набор тематик, характеризующих эти тексты. Для этого используются лингвистические алгоритмы выделения значимых слов, их нормализации, составления лексического профиля текста, определения тематик и др.

У одного клиента, заданного идентификационными данными, в социальных сетях может существовать много различных пользователей, имеющих достаточно высокий уровень достоверности идентификации.

В этом случае возникает задача «объединения» данных нескольких пользователей в единый профиль клиента. Как именно соединять данные, зависит от конкретной задачи — например, для формирования общего списка интересов можно отбирать только интересы, присутствующие у каждого пользователя. Либо можно объединять интересы всех пользователей заданного клиента и использовать расширенный набор интересов.

Платформа ForSMedia, разработанная компанией «Форс» на базе Hadoop [2], средств лингвистической обработки компании RCO и языка R, реализует все перечисленные методы и подходы. Важной особенностью решения является возможность массового обогащения данных для большого числа профилей клиентов в автоматическом режиме. Платформа может быть развернута на серверах пользователя или поставляться в виде облачного сервиса.

Социальные сети служат новым полезным источником дополнительных данных о клиентах любой компании. Использовать этот источник не так просто, и возникающие на этом пути проблемы требуют специализированных технологий и инструментов. Система ForSMedia, основанная на Hadoop и других технологиях Больших Данных позволяет автоматически в режиме массовой обработки обогащать профили клиентов не только данными, в явном виде указанными в социальных сетях, но и сведениями, неявно присутствующими в многочисленных текстах сообщений, постах, группах подписки.

Добавить комментарий