В рунете до сих пор нет внятного определения, что такое small data, хотя, казалось бы, о больших данных (big data) говорят уже давно. Эти две формы данных похожи и не похожи друг на друга одновременно. Разбираемся, что к чему.

Small Data. Определение

Малые данные (small data) - это когда анализируется информация об одном человеке и делаются выводы (соответственно, большие данные - это когда анализируется множество людей и находятся закономерности в их поведении).

Для сбора, обработки и интерпретации малых данных не нужно много ресурсов: это может сделать и один человек. Такие данные предназначены для решения повседневных задач, в случае с e-commerce: узнавая пол, возраст, физиологические параметры, социальный статус пользователя и другие данные, вы сегментируете пользователей по узнанным критериям и более эффективно проводите рекламные кампании, рекомендуете товары.

Малые данные - это о повседневных задачах: например, собирая электронные адреса покупателей в базу и делая рассылку, вы тоже работаете с малыми данными.

Нужны ли малые данные ритейлерам

У малых данных есть более известный собрат - Big Data, технологический тренд последних нескольких лет. Ритейлерам нужны большие данные: они помогают получить общую картину рынка, увидеть тренды, спрогнозировать спрос или конкуренцию, увеличить продажи за счет понимания поведения покупателей и т.д. Способов применения Big Data действительно много - актуальный пример с рекомендательными системами: они используют большие данные и сложные программные алгоритмы, чтобы спрогнозировать потребности и интересы пользователя по его действиям, сравнивая его модель поведения с тысячами других похожих пользователей. После анализа биг дата такие системы предлагают ему наиболее релевантные товары.

Но пример выше с рекомендательными системами - скорее, единичный случай в онлайн-ритейле, когда бы большие данные применялись так просто и с таким уровнем автоматизации. На деле получается, что если просто взять все эти данные о пользователях и отдать их ритейлу, то единицы будут заниматься анализом и учитывать их при разработке рекламных кампаний или планировании ассортиментна. Причины банальны: сложно, долго, а если писать программные алгоритмы для анализа - дорого.

С малыми данными попроще. На то есть как минимум три причины:

  • Они доступны. Для сбора small data не нужны научные методы, программный движок для аналитики, построение сложных гипотез и всё такое прочее. Малые данные - об известных вещах. Так же, как и big data, малым данным нужен анализ, но его можно провести, ограничиваясь стандартным бизнес-софтом.
  • Они точны. Вы всегда в силах самостоятельно обновить или уточнить данные ваших клиентов: будь то верификация e-mail и телефона на сайте или даже обзвон колл-центром.
  • Они функциональны. Большие наборы данных требуют соответствующей экспертизы аналитика, времени и специализированного программного обеспечения. Кроме того, всегда есть риск сделать неправильные выводы или переусердствовать с анализом. Малые данные легче обрабатывать вручную и потом на основании полученных выводов принимать стратегические решения.

В книге « Принципы Больших Данных » содержатся ключевые отличия малых и больших данных. Приведем их здесь, чтобы окончательно понять суть вопроса.

Small Data Big Data
Цели Ответ на конкретный вопрос или решение определенной задачи. Есть нечеткая цель и представление о том, что источник больших данных будет содержать и как будут структурированы данные внутри него, как они будут связаны с другими ресурсами и проанализированы.
Местонахождение Как правило, содержатся в одной компании, часто на одном компьютере и иногда в одном файле. Распространены по всей Сети, обычно хранятся на нескольких серверах, расположенных в самых разных местах Земли.
Структура и содержание Обычно хорошо структурированные данные. Область данных: одна дисциплина или субдисциплина. Часто хранятся в виде однородных данных в упорядоченных таблицах. Большой объем неструктурированных данных (например, текстовые документы, изображения, фильмы, звукозаписи, физические объекты). Предметом больших данных могут быть сразу несколько дисциплин, у каждого объекта могут быть связи с другими, казалось бы, никак не связанными, информационными ресурсами.
Подготовка данных Обычно люди, которые занимались подготовкой данных, их и используют. Данные поступают из многих источников, подготовкой занимается множество людей. При этом используют данные другие люди, не принимавшие участия в подготовке.
Долговечность Хранятся в течение ограниченного периода времени (обычно не более 7 лет), а затем архивируются. Данные хранятся неограниченное количество времени. В идеале, когда текущий источник данных прекращает существование, данные из него «всасываются» в другой источник.
Измерение Как правило, данные измерены одним экспериментальным протоколом. Так как данные поступают в разных электронных форматах, они могут быть измерены разными протоколами. Проверка качества больших данных - одна из самых сложных задач.
Воспроизводимость Проекты повторяются: если есть сомнения в качестве данных или обоснованности выводов, весь проект может быть повторен для получения нового набора данных. Тиражирование данных большого проекта неосуществимо. Если было замечено, что присутствуют некачественные данные, остается только надеяться, что кто-то найдет их и отметит.
Стоимость Стоимость проекта ограничена. Лаборатории и учреждения, как правило, могут оправиться от случайного провала. Проекты стоят неприлично дорого. Некачественные данные могут привести компанию к банкротству, массовым увольнениям и прекращению существования источника данных.
Самоанализ Каждая единица данных идентифицируется по строке и столбцу, зная их названия, вы можете найти и указать все ячейки данных в таблице. Если источник данных не исключительно хорошо структурирован, он может быть непонятен. Для анализа применяются машинные алгоритмы.
Анализ В большинстве случаев все данные проекта могут быть проанализированы сразу и в полном объеме. Обычно анализируются поэтапно (за исключением машинного анализа на суперкомпьютере или нескольких компьютерах сразу). Данные проходят этапы: извлечение, обзор, ограничение, нормализация, трансформация, визуализация, интерпретация и повторный анализ различными методами.

Надеемся, различия стали более очевидными. Так как наш продукт напрямую связан как с Big Data, так и со Small Data, поясним роль последних в работе REES46.

Когда в магазин приходит новый пользователь, для сервиса рекомендаций он - чистый лист. О нем ничего не известно, коллаборативная фильтрация и другие методы обработки больших данных не работают: ведь мы не знаем, что пользователь покупал, что смотрел и т.д.

Поэтому REES46 наравне с большими использует малые данные, делая на их основе выводы и превращая их в качественные товарные рекомендации.

Пример 1. Покупатель просмотрел несколько товаров в категории «детская одежда». Система делает вывод, что у пользователя есть дети, а глядя на параметры просмотренной одежды, делает запись о том, какого пола ребенок и сколько ему лет. Далее этому пользователю рекомендуются подходящие ему детские товары, при этом используется Small Data: таким образом компенсируются недостатки Big Data.

Пример 2. Покупатель положил в корзину корм Pro Plan для собак. По объему сервис рекомендация делает предположение о том, насколько это крупная порода собаки, а по марке предполагает, что покупателю подойдут товары из высокого ценового сегмента (корм качественный и дорогой). Поэтому в рекомендуемых товарах будут выводиться только качественные аксессуары или игрушки для крупных собак - и это повысит вероятность покупки.

В целом, малые данные - это то, чем нужно пользоваться, когда на обработку Big Data нет времени, вычислительных мощностей или когда о пользователе ничего не известно.

Самое то для принятия решений здесь и сейчас.

Клиентские потребности находятся в одной плоскости с Big data. Small data или малые данные дают детальную информацию. Сила малых данных — в грамотном сочетании двух подходов: small data и big data. Как игроки одной команды, лучший результат они приносят вместе. Давайте разберемся, как грамотно использовать преимущества больших и малых данных.

Страховая компания Blue Cross

Представьте, что все имеющиеся в распоряжении данные — это спортивные комментаторы. При этом большие данные являются комментаторами play-by-play, которые дают общую информацию, объективное описание ситуации — что, где, когда; малые данные — это color commentary — дополнительные, более емкие и точечные факты. Color commentary (дополнительный комментарий) способствует более глубокому раскрытию контекста.


Метафора с игровым процессом хорошо раскрывает суть больших и малых данных. Большие данные — это констатация фактов как они есть, малые данные показывают « фишечки » процесса. Big data определяют количественные исследования, а small data — качественные. Именно поэтому использование только одного инструмента не даст достойного выхлопа маркетинговым исследованиям.


Давайте посмотрим, как работают small data на примере страховой компании Blue Cross (страхование жизни и здоровья). Blue Cross, как и многие другие страховщики здоровья, столкнулась с проблемой реадмисии — незапланированных повторных госпитализаций в больницу после основного лечения в стационаре по страховке. Показатели реадмиссии используются для оценки качества стационарной помощи.

Проблема реадмиссий в том, что в большинстве случаев она бесполезна. Повторные возвращения пациентов в клиники обходятся дороже, чем восстановление в домашних условиях. Перед компанией стояла задача понять, какие реадмиссии необходимы, а какие можно предотвратить, чтобы сократить расходы. Сокращение реадмиссии — одна из главных статей политики страховой компании.

Чтобы понять, что заставляет пациентов прибегнуть к повторной госпитализации, сотрудники изучили большие объемы данных. Blue Cross запустила алгоритмы изучения выставленных за услуги счетов, лабораторных показаний, выписанных лекарств, роста, веса пациентов и историй болезней семьи (данные play-by-play). Компания также изучила уровень бедности в районе проживания каждого конкретного пациента. Все данные по объему составили около 5 объемов Wikipedia.

Big data позволила выявить высокорисковых пациентов. Чтобы решить задачу — сократить процент возвращения пациентов — данные по высокорисковым клиентам отправили на изучение тренерам по здоровью и правильному питанию. Специалисты ответили на конкретные вопросы типа: что осложняет восстановление пациента в домашних условиях? Как особенности поведения и привычки пациента помогут ему в восстановительный период? Как можно повлиять на поведение пациента? Так был использован подход small data. Получается, что small data восполняют брешь Big data.

Потребности клиентов не статичны, и маркетолог всегда должен отмечать даже незначительное их колебание. В этом как раз и помогает более детальное и дотошное изучение с помощью Small data.

Lego

Одна из самых больших проблем сегодня — как проанализировать весь массив больших данных. Мы знаем, как собрать данные, но мы не знаем, что с ними делать. Мартин Линдстром (Martin Lindstrom), автор книги « Small data: мелочи, которые скрывают большие тренды » и разработчик бренд-стратегии Lego в 2004, считает, если мы говорим об изучении желаний наших клиентов — мы говорим о малых данных.

Все мы любим Lego, но компания не всегда была такой мощной, как сегодня. В начале 80-х Lego начала сдавать позиции. Новые более современные игрушки, включая Nintendo и видеоигры по ним, отхватили серьезный кусок рынка. Время шло, и конкуренты предлагали более успешные и сложные игры, Lego продолжала отставать.

Какой была первая тактика бренда? Диверсификация. Lego запустила тематические парки, линию одежды, фильмы и даже собственные видеоигры. Особых результатов такая тактика не принесла, но Lego оставалась на плаву.

От традиционных конструкторов Lego перешел к фильмам, играм и другим продуктам .

С бурным развитием интернета диджитал-туземцы (родившиеся после 80-х) находились в постоянном поиске развлечений. В этот период бренды развернули кампании по захвату их внимания. Lego провела ряд исследований. Оказалось, что миллениалов ждет творческий кризис. Каждое исследование говорило, что новые поколения не готовы к вызовам. Они не готовы заморачиваться над тем, что не приносит мгновенного результата и мгновенного удовлетворения.

Что оставалось Lego? Меньше деталей в конструкторах, сами детали больших размеров. Они увеличили детали конструкторов, их продажи падали. Тогда в компанию пригласили Мартина Линдстрома с его философией малых данных.

Старые кроссовки и озарение


Во время одного из своих маркетинговых исследований Мартин Линдстром с командой посетили дом немецкого школьника. Оказалось, что помимо любви к Lego, он был почти профессиональным скейтбордистом. Его попросили назвать самую ценную вещь в комнате, парень указал на пару изношенных кроссовок. Оказалось, многочасовые тренировки на скейте сделали обувь идеально подходящей для катания. Они были старыми и потертыми, ничего особенного. Но благодаря кроссовкам, в которых он долгими часами отрабатывал упражнения, мальчик стал одним из лучших скейтеров.

Этот небольшой случай доказал, что миллениалы и поколения младше не были одержимы желанием мгновенного результата, как на это указывали big data. История с мальчиком показала, что его обувь — некий символ уважения к делу, которым он занимается.

Lego не просто вернулись к тому, что сделало их великими. Благодаря небольшому эксперименту, который провел Линдстром, стало ясно, как раскрутить некогда популярные конструкторы. Детали конструктора стали не просто меньше, конструкторы стали более запутанными и сложными. Это был некий вызов. Сегодня продажи Lego превышают продажи крупнейшего в мире производителя игрушек, выпускающего знаменитую куклу Барби — Mattel.

Робот-пылесос Roomba

Использование small data сработало не только с игрушками. Линдстром использовал эту идею при работе с другими продуктами: от робота-пылесоса Roomba до магнитов на холодильник. Small data помогают находить незначительные на вид особенности продукта и превращать их в основное преимущества бренда.

Линдстром любит цитату « Если хочешь посмотреть, как живут звери, не иди в зоопарк, спустись в джунгли » . Он называет этот процесс « видением подтекста » подробный процесс сбора информации онлайн и офлайн, наблюдение за потребительской реакцией вплоть до того, чтобы напроситься к клиенту в гости и посмотреть, как он использует продукт.

Очень часто потребитель совершенно под иным углом раскрывает суть продукта, распознает его сильные стороны. Видит качества продукта, которые представители бренда не заметили или посчитали неважными. Благодаря этому можно построить новый имидж бренда или создать совершенно новый бренд.

Линдстром считает, что люди не хотят быть ассоциированы только с тем, что они делают. Мы много времени проводим на работе, но работа — не вся наша жизнь. У каждого из нас есть хобби и увлечения. Линдстром называет это « смотреть сквозь рамки » . Каждый пытается выразить себя через хобби и увлечения. И брендам это на руку. Выбор клиента — это самовыражение. Этим знанием воспользовались создатели робота-пылесоса Roomba. Они придумали не просто моющую машину, а интерактивную веселую игрушку с функцией чистки поверхностей. Вспомните, сколько было роликов на youtube с этим пылесосом и домашними животными.

Последнее время я не так уж часто хожу в кино на мультфильмы, но у меня были вполне веские причины пойти на «Смолфут». И…я не капли не пожалела! Замечательный и совсем не глупый мультфильм, поднимающий не только традиционную тему добра и зла, кстати, достаточно необычно для мультфильма раскрытую, но и тему цены спокойствия и счастья, как, собственно, и того, что такое счастье.

Мультфильм выглядит необычным с самого начала, с самой-самой первой песни, которая представляет нам деревню йети как место абсолютного как бы счастья, в то же время, эта же песня буквально кричит о том, что здесь не счастье, но его суррогат. Интересно, что деревню возглавляет герой-жрец, он же вождь, таким образом, условный религиозный лидер сливается здесь с лидером, скажем так, политическим, что означает наличие абсолютной власти, ничем и никем не оспариваемой и не ограниченной. Одна личность, в сущности, может восприниматься как божество, тем более, что только ей дано право трактовать камни, единственно воспринимаемые как законы. Отсюда и основной мотив, что каждый должен быть на своем месте, выполнять свою собственную работу, и ни в коем случае не думать. Такая постановка вопроса наталкивает на мысль об антиутопии, только показанной в ярких красках детского мультфильма.

Если правитель-жрец — это воплощение высшей власти в этом месте анти-счастья, то отец главного героя — это воплощение последствий. Будучи идеальным подданным, он глуповат и тугодумен, до чего его в буквальном смысле слова довело точное следование начертанным на камнях указаниям. Не удивительно, что именно он окажется на грани личной трагедии, когда его сын совершит величайшее преступление — начнет думать своей головой и смотреть на мир своими глазами. Трагедии осознания места в мире, который был ложью от начала и до конца. Когда, таким образом, ложью была вся жизнь.

Действие развивается по законам антиутопии, но в смягченном варианте: здесь есть свои подпольщики-диссиденты, а главному герою открывается истина, категорически запрещенная для многих. Интересна постановка вопроса, когда пропагандируемые простые ценности, долгое время вполне безопасные для представленного режима, например, говорить только правду, оказываются режиму опасными. Хочется отметить ярчайший номер разговора жреца и главного героя, в котором вопрос лжи во спасение выносится на первый план, ставя нашего молодого йети перед моральным выбором, который тому трудно сделать, ведь он только научился мыслить. Вопрос совсем не детский, поскольку показывает существенность мотивов жреца, и сходу принять решение, прав ли он, невозможно.

Но гораздо более важный вопрос — это неумение находить общий язык. В мультфильме поначалу это показано буквально: йети Миго кажется человеку Перси рычащим и угрожающим, а йети не может понять ни слова, которые говорит Перси. Однако эти два героя медленно, но верно, начинают находить общий язык, будь то язык жестов или поступков. Пусть роль Перси, по большей части, формальна, но его появление заставляет Миго задуматься. Здесь интересно то, что Перси — вовсе не идеал, и тот еще «фрукт», а Миго — душа чистая, но Перси оказывается способен на поступки, и, благодаря этому, правда в его лице способна победить ложь в борьбе за душу и сердце Миго. То есть, за будущее, ведь Миго совсем молод.

Так что именно Перси, сам к тому не стремясь, заставляет Миго открыть глаза и понять, что именно происходит. А происходит тотальное непонимание и страх. Люди боятся йети, йети боятся людей. И, конечно, борются с источником страха. А эти двое, совсем поначалу не друзья, доказывают друг другу, что не все плохие и жестокие. Отсюда интересный взгляд на добро и зло: в чистом виде не существует ни того, ни другого, и то, что привычно считалось добром, может быть обманом, а то, что злом — просто непохожестью.

Цена счастья в виде жизни в обмане и лжи — слишком высокая, ведь индивидуальности перестают быть таковыми, они становятся винтиками огромного механизма, и они не могут быть по-настоящему счастливы, ведь не знают, что это такое. Раз выглянувшее солнце знания, истины разгоняет эту тьму, но, даже если это сложно, все равно все живые существа тянутся к свету. Ведь счастье только в свете. В сущности, Миго в финале идет на свет сам и ведет свой народ. К свету знания, подальше от губительного страха. Он — молодость, он будущее, и он туда идет, подальше от привычной первобытности и даже Средневековья. Он ведет людей к настоящему счастью.

Отдельно хочется отметить музыкальное оформление картины. Музыкальных номеров совсем немного, но они очень отличаются от тех, что часто звучат в мультфильмах. Они яркие. Привычных милых песенок минимум. Песни звучат в разных стилях, даже рэп есть, если не ошибаюсь, и тексты достаточно яркие и интересные. Номера хорошо вписаны в мультфильм, не выбиваются из сюжета, не кажутся вставленными просто ради себя самих.

Не могу не сказать об озвучании: наконец-то и речь, и вокал героев озвучивают одни и те же актеры! Это звучит гораздо натуральнее. И наконец-то все узнаваемы. Голос Виктора Добронравова очень подходит Миго, актеру точно удалось передать молодой авантюризм, убежденность героя. Он смог передать все оттенки и интонации, чтобы российский зритель герою поверил. Андрей Бирин невероятно удачно почувствовал некоторое лукавство, немного хулиганство своего Перси, он смог оживить, «раскрасить» характер чуть проходного персонажа, и все благодаря точно выбранным интонациям и правильной подаче. Гоша Куценко как нельзя лучше озвучил своего вождя-жреца: этот голос с мудрой усталостью всеобщего наставника, ну и прекрасный рэп-номер — его невозможно не отметить. Наталия Быстрова озвучила, в сущности, типичную героиню, пусть и боевую, и чистый голос актрисы прекрасно дополнял светлый образ Мичи.

«Смолфут» очень хорош к просмотру: он добрый и позитивный, и, что важно, он не глупый, пытается разговаривать с детьми как со взрослыми. Ставит сложные вопросы. Он яркий, с интересным сюжетом и прекрасной музыкальной частью. Чего еще хотеть? Прекрасный мультфильм.