Интеллектуальный анализ данных

Примечание. Описываемая функциональность реализована в варианте прикладного решения "1С:Консолидация 8 ПРОФ".

В информационной системе активно работающего предприятия накапливаются большие объемы разнообразных сведений. Пользователи могут анализировать эти сведения с помощью классических аналитических инструментов, встроенных в прикладное решение: отчетов, сводных таблиц, диаграмм. Эти инструменты позволяют представить картину хозяйственной деятельности предприятия в удобном для анализа виде, определить отклонения от плана, подготовить принятие управленческих решений, спланировать новые показатели на основе тенденций прошлых периодов.

Современный бизнес столь многогранен, что количество факторов, потенциально оказывающих влияние на то или иное решение, может исчисляться десятками. Конкуренция усиливается день ото дня, жизненный цикл товаров укорачивается, предпочтения клиентов меняются все быстрее. Для развития бизнеса необходимо максимально динамично реагировать на стремительно меняющееся бизнес-окружение, учитывая тонкие, а подчас трудноуловимые закономерности развития событий.

Какие группы клиентов откликнутся на рекламную акцию, а какие безвозвратно уйдут к конкурентам? Открывать новую бизнес-линию или пока повременить? Не просрочит ли покупатель платеж, а поставщик - отгрузку? Каковы возможности для роста и где скрываются потенциальные угрозы?

Подобные вопросы ежедневно задают себе и коллегам тысячи менеджеров.

Но при использовании классических инструментов анализируемые показатели и взаимосвязи должны быть определены заранее. Обычные отчеты не рассчитаны на поиск неочевидных правил и на извлечение неизвестных закономерностей — то есть на генерацию новых знаний.

Для решения подобных задач предназначена подсистема интеллектуального анализа данных (Business Intelligence), которая включена в прикладное решение "1С:Консолидация 8".


Общая характеристика

Подсистема анализа данных призвана помочь пользователям корпоративной информационной системы быстрее находить ответы на нетривиальные вопросы, обеспечивая автоматизированное преобразование данных, накопленных в корпоративной информационной системе, в практически полезные и хорошо интерпретируемые закономерности. Она обеспечивает поддержку принятия разнообразных управленческих решений с помощью алгоритмов интеллектуального анализа данных (ИАД).

190_scheme

Алгоритмы ИАД формируют аналитические модели, которые описывают закономерности в исходных данных. Эти модели представляют самостоятельную аналитическую ценность, а также используются для автоматизированного формирования прогнозов с заранее неизвестными показателями.

Интеллектуальный анализ данных использует взаимодополняющие методы обнаружения знаний. В подсистеме реализованы методы, получившие наибольшее коммерческое распространение в мировой практике:

  • кластеризация — реализует группировку относительно сходных объектов;
  • поиск ассоциаций — реализует поиск устойчивых комбинаций событий и объектов;
  • дерево решений — обеспечивает построение причинно-следственной иерархии условий, приводящей к определенным решениям.

Выбор метода зависит от состава исходных данных и от того, какого рода закономерности требуется выявить.

Для визуального отображения результатов анализа и прогноза применяются эргономичные элементы управления.

Ожидается, что подсистема анализа данных будет востребована для управления коммерческими рисками и ассортиментной политикой, оптимизации процессов логистики и бюджетирования, планирования программ стимулирования персонала и маркетинговых мероприятий, а также для реинжиниринга бизнес-процессов и в области оптимизационного консалтинга.

Для проведения анализа и прогнозирования пользователи должны хорошо владеть предметной областью и понимать основные причинно-следственные связи. А для подготовки источников данных и прогнозных моделей требуются некоторые навыки в области конфигурирования платформы "1С:Предприятие 8": умение использовать построитель запросов, знание принципов размещения информации в объектах метаданных.

Кластеризация

Целью кластеризации является выделение из множества объектов одной природы некоторого количества относительно однородных групп — сегментов или кластеров. Объекты распределяются по группам таким образом, чтобы внутригрупповые отличия были минимальными, а межгрупповые — максимальными.

Кластеризация клиентов по различным категориальным признакам позволяет ответить на вероятно основной вопрос любого бизнеса: "Кто он, наш потребитель, каковы его потребности и сколько он готов заплатить за их удовлетворение?".

Сегментация товаров по уровню субъективной привлекательности позволяет более четко позиционировать их среди аналогичных товаров конкурентов и наметить эффективные мероприятия по их продвижению и ценообразованию.

Кластеризация районов города по уровню достатка жителей способствует более адекватному ценообразованию.

Сегментация ключевых менеджеров по восприятию их вашими клиентами позволяет улучшить индивидуальное обслуживание последних и пересмотреть приоритеты в стимулировании первых.

Методы кластеризации позволяют перейти от пообъектного к групповому представлению совокупности произвольных объектов, что существенно упрощает оперирование ими.

Поиск ассоциаций

Этот метод интеллектуального анализа данных предназначен для выявления устойчивых комбинаций элементов в определенных событиях или объектах.

Первоначально метод поиска ассоциаций использовался для нахождения типичных шаблонов покупок, совершаемых в супермаркетах, поэтому иногда его еще называют анализом рыночной корзины (market-basket analysis). Применительно к этому сценарию в качестве ассоциируемых элементов как правило выступают товарные группы. А группирующим объектом, объединяющим элементы выборок, может быть любой объект информационной системы, идентифицирующий сделку, например: заказ покупателя, акт об оказании услуг или чек контрольно-кассовой машины.

Информация о закономерностях в комбинационных предпочтениях покупателей позволяет повысить эффективность CRM (в части рекламных кампаний и маркетинговых акций), ценообразования (формирование комплексных предложений и системы скидок), логистики (оптимизация товарных запасов) и мерчендайзинга (распределение товаров в торговых залах). Известными иллюстрациями данного алгоритма являются выявленные устойчивые ассоциации вида "хлеб - молоко", "телевизор класса премиум - DVD проигрыватель", которые нашли широкое использование в розничной торговле.

Другим примером использования этого метода является определение предпочитаемых клиентами комбинаций рекламных каналов для исключения их дублирования при проведении целевых рекламных кампаний. Это позволяет существенно снизить издержки на подобные мероприятия.

Результаты анализа представляются подсистемой в виде групп ассоциированных элементов.

В результатах анализа помимо выявленных устойчивых комбинаций элементов приводится развернутая аналитика по ассоциированным элементам.

Дерево решений

В результате применения этого метода к исходным данным создается иерархическая (древовидная) структура правил вида "Если... то...", а алгоритм анализа обеспечивает процесс вычленения на каждом этапе наиболее значимых условий и переходов между ними.

Рассматриваемый алгоритм получил наибольшее распространение при выявлении причинно-следственных связей в данных и описании поведенческих моделей.

Алгоритм поиска последовательностей является дальнейшим усовершенствованием алгоритма поиска ассоциаций. Он реализуем, если существует возможность связать события в единую временную последовательность каким-либо атрибутом, в качестве которого может выступать, например, субъект события. Это существенно расширяет функциональность аналитической системы возможностью рассмотрения хронологически связанных цепочек событий.

Этот алгоритм дает ответы на вопросы типа: "Если сегодня покупатель приобрел фотоаппарат, то через какое время он вероятнее всего купит новые батарейки и пленку ? А видеокамеру? ". Алгоритм получил наибольшее распространение для увеличения эффективности перекрестных продаж, а также выстраивания рекламных альянсов.

Не правда ли логично, что вблизи крупного автосалона располагается АЗС, а человека, пришедшего в туристическое агентство, заинтересуют рекламные купоны магазина, торгующего товарами для отдыха?

Типичная зона применимости деревьев решений - оценка различных рисков, например, просрочки платежа или закрытия заказа клиентом, недопоставки или несвоевременной поставки товара поставщиком. Другой часто встречающийся вариант использования этого алгоритма - анализ и прогноз поведенческих стереотипов (переход клиента к конкуренту, отклик на рекламную кампанию). И в этой ипостаси метод чрезвычайно эффективен, так как его логика близка к человеческой. А возможность использования варьируемых обучающих и актуальных выборок позволяет формировать на их основе сценарные прогнозы. Анализы этого типа получили название "Что, если ...?", они незаменимы в бюджетном процессе.

Используя деревья решений можно существенно снизить влияние неопределенности поведения контрагентов на состояние компании, оптимизировав формы взаимоотношения с ними. Благодаря этому вполне реально, с одной стороны, минимизировать затраты на управление цепочками поставок, а с другой - добиться увеличения эффективности маркетинговых кампаний и оптимизации системы продаж.

Еще одним нетривиальным примером практического использования этого алгоритма является формирование дружественной клиенту среды коммуникации. Он позволяет выявить клиентов с подобными стереотипами общения и восприятия для разработки типовых сценариев обслуживания их в колл-центрах, сложных вариантов анкетирования или адаптивной топологии интернет-магазинов.

Результаты анализа и прогноза с помощью деревьев решений позволяют существенно снизить влияние неопределенности бизнес-окружения на состояние компании, а также решить широкий спектр задач, связанных с выявлением сложных и неочевидных причинно-следственных связей. Адекватная оценка рисков обеспечивает принятие квалифицированных решений по оптимизации отношения доходность/риск в деятельности компании, а также полезна для увеличения реалистичности различных бюджетов.