На рынке существует множество Business Intelligence решений, которые, как правило, решают одну задачу - построить корпоративную отчетность, или, иными словами, reporting. Грубо говоря, они выступают заменителями Microsoft Excel. Кстати, Excel тоже можно отнести к инструментам BI, поэтому те, кто работал с данными в Excel, строил графики и т.п., отчасти - BI разработчики. А если вам еще необходимо было собирать требования на построение отчета, подключаться к базам данных и использовать Pivot в Excel, то вы точно можете считать себя BI разработчиком.

К сожалению, Excel имеет ограниченный функционал и не подходит крупным организациям (Enterprise), поэтому существует отдельный класс BI приложений от именитых вендоров, таких как Oracle, SAP, IBM и другие. Для того чтобы лучше разбираться в основных игроках BI-рынка, можно ознакомиться с ежегодными результатами крупнейших аналитических агентств, таких как Gartner или Forrester . Каждый год они публикуют список лидеров и указывают их сильные и слабые стороны. Если вам когда либо придется выбирать для своей компании BI инструмент, то необходимо начинать именно с этого.

Давайте определимся: что же такое BI инструмент? Это решение, которое создано специально для людей, не знающих и не понимающих, как работают базы данных (им в принципе это и не нужно). Эти люди сосредоточены на бизнес-процессах, и они привыкли работать с удобными для них наименованиями, такими как «Доход», «Номер договора», «Ставка» и т.п. Им совершенно всё равно, откуда берутся данные, как они хранятся или как рассчитывается тот или другой показатель. Им нужно решение, с помощью которого они смогут получить быстрый ответ на свой бизнес-вопрос, например «Сколько телефонов было продано в прошлом месяце?» или «Какой самый популярный продукт в линейке продуктов?». BI приложение имеет удобный интерфейс, в котором бизнес-пользователь может легко «накидать» (используя drag and drop) необходимые поля, и построить отчет. Затем он легко сохраняет свой отчет и отправляет коллегам.

Прежде чем изучать любой BI продукт, необходимо понять из чего он состоит:

  • Коннектор к данным - это может быть ODBC, JDBC или любой другой драйвер, который позволяет подключаться к базам данных или к обычным «плоским» файлам;
  • Семантический слой - сердце любого BI инструмента, здесь происходит вся магия. Если по-простому, то семантический слой - прослойка между технически сложными вещами, такими как «база данных», «таблица», «соединение» и бизнес-объектами, с которыми будет работать пользователь.
  • Бизнес-объекты - непосредственно сами показатели и атрибуты, для построения отчетности.

Таким образом, когда бизнес пользователь хочет получить ответ на свой бизнес-вопрос, он просто накидывает объекты, нажимает кнопочку «обновить отчет» и получает необходимые данные для работы. Когда человек накидывает объекты, создается SQL, MDX которые отправляется в базу данные, (конечно если у нас в качестве источника данных - база данных или куб), дальше база данных отправляет результат в кеш BI приложения, чтобы пользователь мог работать, выстраивая графики и отчеты.

Свойство

OLTP-система

СППР

Цели использования данных

Быстрый поиск, простейшие алгоритмы обработки

Аналитическая обработка с целью поиска скрытых закономерностей, построения прогнозов и моделей и т.д.

Уровень обобщения (детализации) данных

Детализированные

Как детализированные, так и обобщенные (агрегированные)

Требования к качеству данных

Возможны некорректные данные (ошибки регистрации, ввода и т.д.)

Ошибки в данных не допускаются, поскольку могут привести к некорректной работе аналитических алгоритмов

Формат хранения данных

Данные могут храниться в различных форматах в зависимости от приложения, в котором они были созданы

Данные хранятся и обрабатываются в едином формате

Время хранения данных

Как правило, не более года (в пределах отчетного периода)

Годы, десятилетия

Изменение данных

Данные могут добавляться, изменяться и удаляться

Допускается только пополнение; ранее добавленные данные изменяться не должны, что позволяет обеспечить их хронологию

Периодичность обновления

Часто, но в небольших объемах

Редко, но в больших объемах

Доступ к данным

Должен быть обеспечен доступ ко всем текущим (оперативным) данным

Должен быть обеспечен доступ к историческим (то есть накопленным за достаточно длительный период времени) данным с соблюдением их хронологии

Характер выполняемых запросов

Стандартные, настроенные заранее

Нерегламентированные, формируемые аналитиком «на лету» в зависимости от требуемого анализа

Время выполнения запроса

Несколько секунд

До нескольких минут

4. Семантический слой в хранилище данных.

“Семантический слой - механизм, позволяющий аналитикам оперировать данными бизнес-терминами.” - Тоноян С. А.

Важнейшим элементом ХД является семантический слой - механизм, позволяющий аналитику оперировать данными посредством бизнес-терминов предметной области. Семантический слой дает пользователю возможность сосредоточиться на анализе и не задумываться о механизмах получения данных.

5. Основные требования к хранилищу данных.

Требования:

    высокая скорость получения данных из хранилища;

    автоматическая поддержка внутренней непротиворечивости данных;

    возможность получения и сравнения срезов данных;

    наличие удобных средств для просмотра данных в хранилище;

    обеспечение целостности и достоверности хранящихся данных.

6. Свойства хранилища данных.

    Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют.

    Интегрированность . Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса.

    Некорректируемость . Данные в хранилище данных не создаются: то есть поступают из внешних источников, не корректируются и не удаляются.

    Зависимость от времени . Данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени.

Хранилище данных - предметно-ориентированный, интегрируемый, неизменяемый и поддерживающий хронологию набор данных, предназначенный для обеспечения регламентированных и управленческих решений. Основные свойства:

    ориентированность

Хранилище данных разрабатывается с учетом специфики области, а не аналитической платформы, где его будут использовать. Другими словами: данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют. Структура должна отражать представление информации, с которой работает аналитик. Предметная ориентация позволяет хранить в ХД только те данные, которые необходимы для средств анализа, что существенно сокращает затраты на носители информации и повышает безопасность доступа к данным.

2) интеграция

требуется обеспечить возможность загрузки информации из различных источников, поддерживающих различные форматы данных.

    единые правила именования объектов

    единые единицы измерения для однотипных объектов

    единое физическое представление

    единое представление атрибутов и т.д.

3) принцип неизменчивости - в хранилище возможно только добавление и чтение данных.

4) поддержка хронологии - точное и единое представление о временной привязке всех данных.

Из достаточно изолированных систем понятий (“процессы”, “личность”, “сознание” и др.), акцентирующих свое внимание на отдельных сторонах психической жизни человека и не позволяющих описывать психическую жизнь в целом, в частности, из-за трудностей перехода от одной системы к другой. Эти трудности становятся вполне очевидными, если согласиться с тем, что основной феномен психики и состоит в возможности индивидуальной структурации внешнего мира, в существовании индивидуальных миров. Введение в психологическую теорию понятий, связанных с такой структурацией, позволит замкнуть систему понятий, построить единую систему.

Движение к введению таких понятий было начато еще в русле когнитивной психологии, например, Брунером и Найсером, отмечавшими существование специальных механизмов “упаковки” опыта взаимодействия с объектами мира в структуры и актуализации этих структур навстречу новой стимуляции. В советской психологии это движение связано с обсуждением и экспериментальной проработкой введенного А. Н. Леонтьевым понятия образа мира и производных от него понятий (например, понятия структуры и субъективного опыта - Артемьева, 1978). Введение таких понятий по-новому ставит проблему описания опыта субъекта, его субъективного мира. Субъективный мир (мир субъекта) имеет свою подлежащую изучению структуру, складывающуюся, с одной стороны, в прошлом опыте, но, с другой стороны, в сиюминутной деятельности. Таким образом, основными задачами описания объективного опыта является поиск параметризации его структур и увязки самого понятия с понятиями текущей деятельности: целе-мотивационный комплекс, состав деятельности, эмоций, личностный статус и др. Задачи эти естественны и, как уже говорилось, давно интересуют психологов, но конструктивных разработок описания опыта до сих пор практически нет. Несколько дет назад авторами этого доклада на основании экспериментального исследования разных уровней структурации субъективного опыта была предложена трехслойная модель структуры опыта. По крайней мере, трехслойная, потому что существуют экспериментальные основания говорить, по крайней мере, о трех формах фиксации опыта. Один слой, где следы деятельностей существуют в виде перцептивных образов, отражая - но далеко не изоморфно! - свойства мира на перцептивном языке. Этот слой и был назван перцептивным миром. Другой слой, где следы деятельности зафиксированы в виде отношений к предметам этих деятельностей и экспериментально регистрируются в виде семантических структур. Третий, самый глубокий слой, несет в себе ядерные структуры представления типа: это не картина мира, как в предыдущем слое, не модель, а сам субъективный мир. В нашем докладе, повторив только самые необходимые сведения о подробностях модели (она опубликована в 1983 году), мы хотели, бы рассказать о наших продвижениях в ее развитии. Удобнее всего начать с отдельных слоев.

Перцептивный мир 24

Картина мира или семантический слой

Описание семантического слоя экспериментально наиболее проработано. Существуют уже монографические публикации по структурам субъективной семантики (Артемьева, 1980; Петренко, 1983; Шмелев, 1983). Отметим только, что принципиальным отличием нашего подхода, ориентированного на исследование субъективной семантики именно как структуры опыта, является изучение стимульных семантик. Поэтому одним из существенных направлений нашего движения к изучению семантического слоя является изучение взаимопроекций семантик разномодальных и разноприродных стимулов.

Экспериментальный материал содержал базисные наборы разномодальных объектов, используемых в разных вариантах психосемантических экспериментов: набор контурных изображений, поверхностей, запахов. В дополнительных экспериментах использовались наборы музыкальных отрывков и пищевых продуктов (с основными характеристиками вкуса). Эксперименты проводились со взрослыми испытуемыми разных профессиональных групп (студенты-психологи, дизайнеры, инженеры, экономисты, филологи. музыканты). Численность сквозной группы (участвовавшей во всех экспериментальных сериях) - 16 человек: в каждой серии принимали участие от 40 до 110 человек.

В первом эксперименте сопоставлялись все наборы объектов, например: “изображения - запахи”, “изображения - поверхности”, “поверхности - пищевые продукты” и т. д. Испытуемым по одному предъявляли объекты одного базисного набора (например, изображения) и предлагали прошкалировать их по стандартному 25-шкальному набору шкал СД 25 Ч. Осгуда, а потом сопоставить объекты первого набора (например, изображения) с объектами второго набора (например, поверхностями). Тот же эксперимент проводился для наборов объектов тех же модальностей, но более полных, чем базисные, - для расширенных наборов.

По расширенному набору шкальные профили “соединенных” объектов хорошо совпадали (75% квантиль), для сопоставления базисных, естественно, совпадение было хуже, так как объекты не были семантически уравнены. 0днако, в том и другом случае “соединялись” объекты с наиболее близкими шкальными профилями, а в случае одинаково близких приоритет отдавался объекту наиболее близкому по оценочным шкалам.

Во втором эксперименте по специальному плану предъявлялись объекты из разных наборов. После каждого предъявления предлагалось “нарисовать то, что предъявлялось”. Далее предлагалось “сыграть то, что предъявлялось”. Магнитофонные записи шкалировались так же, как и рисунки. И авторские, и групповые шкальные профили рисунков и музыкальных отрывков, сконструированных по ассоциации, оказались незначимо (критерии типа стьюдентовского, уровень надежности 95%) отличающимися от шкальных профилей соответствующих предъявленных объектов.

Еще более впечатляющими являются результаты Н. А. Русиной, которая сопоставляла оценки разномодальных объектов (изображений, запахов, поверхностей) и объектов, имеющих социальную природу (понятий типа “лучший друг”, “неприятный человек”, “национальный лидер”), и показала, что способы категоризации едины для объектов любой природы.

В 1984 году В. П. Серкиным была исследована семантика переживания временных интервалов и выяснено тождество механизмов ее организации и других семантик .

Таким образом, мы имеем существенное экспериментальное подтверждение гипотезы о единстве семантического представления следов деятельностей, имеющих своими предметами объекты разной природы, о полимодальности, а впоследствии - надмодальности образований этого слоя.

Образ мира

Подготавливая экспериментальное исследование следующего слоя - образа мира, включающего в себя элементы амодальные уже по определению (или, точнее, объекты, единственной “модальностью” которых является личностная принадлежность), следует ввести более расчлененные характеристики отношения к объектам, фиксированные в семантических параметрах, нежели смысл и значение. Если понимать смысл как след деятельности, зафиксированный в отношении к ее предмету, то полезно ввести понятие частичного (модального) смысла - семантической характеристики предмета деятельности, рассматриваемого в модальном проявлении; полного смысла - смысла, формируемого при взаимодействии разномодальных семантик, и личного смысла, возникающего при переходе следа из семантического слоя в слой образа мира.

О конструкциях этого слоя по-прежнему известно очень мало. К нашим экспериментальным соображениям, что первоочередной координатой различения объектов и ситуаций в этом слое являются координата по шкале “опасный - неопасный”, добавились только факты о том, что различителями следующей очереди являются классификаторы объектов на предметы, явления и ситуации.

Перейдем теперь к обсуждению некоторых представлений о логике движения следа деятельности по слоям структуры субъективного опыта. Поскольку окончательным продуктом преобразования следа в нашей модели является смысл, то и обсуждение мы будем вести на языке смыслов.

Проведем обсуждение на примере деятельности, существенно связанной с внешней стимуляцией - с ее оценкой и преобразованием. Прежде всего стимульный поток встречается с системами ожиданий, формируемыми образом мира: образ мира иногда прямо понимается как система ожиданий “поведения” внешнего мира. В результате этой встречи стимульный поток оценен механизмами “первовидения”, “первослышания” и т. д. как опасный или неопасный, после чего он становится объектом анализа в слое перцептивного мира, где анализируется в зависимости от целей деятельности, а следы этой деятельности формируют предсмыслы - отношения к “отработанным” стимулам на языке перцептивной или, во всяком случае, предметной категоризации. В семантическом слое происходит оценка отношения к этим стимулам, формируются их смыслы. Прежде чем стать элементом образа мира - личностным смыслом - “новый” смысл предмета, явления или ситуации сравнивается с уже хранимым смыслом. Иногда возникает конфликт новых и старых смыслов, и “победивший” смысл входит в структуру ядерного слоя .

Для построения модели фиксации следов деятельности любой природы необходимо обсудить, с какой же “реальностью” имеет дело субъект, превращая след в смыслы и значения - образования более устойчивые, чем смыслы, несущие следы совокупных деятельностей, зафиксированные в культуре.

Определим различие между предметом и объектом. То, что имеет культурное значение: фиксированное культурой отношение или способ употребления. Объект - нет. Тот образ объективной реальности, который руководит деятельностью человека, есть предметный образ субъективного мира. Объекты реального мира входят в этот предметный образ (в образ мира в смысле А. Н. Леонтьева, в широком смысле - как образ объективной реальности, а не только слой ядерных структур) лишь постольку, поскольку они были “вычерпаны” деятельностью человека (теоретической или практической) из этого реального мира.

Таким образом, значение предмета, как оно выступает для отдельного человека, есть результат деятельности этого человека с этим уже предметом, а не объектом. А весь образ мира есть отпечаток личной истории деятельностей, которые реализовал человек и в которые он был включен. Образ мира является одновременно и культурным образованием, так как вся история деятельностей (еще раз подчеркнем - и теоретических, и практических) детерминирована культурными рамками жизни человека. Значение предмета, в том числе и его мотивационные компоненты, есть отпечаток в субъективном опыте культурно-детерминированной деятельности с этим предметом.

Функциональный генез значения заключается в таком освоении предмета в процессе деятельности с ним, в результате которого предмет может употребляться человеком как орудие, выполняющее определенную функцию изменения и преобразования как субъективного мира, так и внешнего реального мира.

Откуда же у значения как составляющего субъективного опыта и субъективного мира берется эта преобразующая внешний реальный мир сила? Этой силой обладает не значение само по себе, а деятельность, построенная на основе этого значения предмета, то есть деятельность, употребляющая предмет согласно его назначению. Значение предмета можно уже определить не только как отпечаток деятельности с ним в субъективном опыте, можно говорить и о функции значения (о его предназначении), которая состоит в изменении и преобразовании внутреннего и внешнего миров посредством организации деятельности. Таково значение инструмента, используемого для преобразования физического мира; значение слова для преобразования мира общения, например: значение символа, используемого для преобразования инструментов, слов и т.п.

Образ мира - не только фиксация следов деятельности, это еще и порождающая категория. Образ мира порождает деятельность, которая строится на основе значений предметов. Деятельность же, будучи внутренней, может преобразовать и сам образ и, таким образом, породить новые значения. Точно так же новые понятия могут порождаться образом мира: новый термин, зафиксированный в субъективном опыте, может быть принят на основе этого опыта как термин, то есть как слово, имеющее определенное значение, но это значение еще не раскрыто сразу.

Дальнейшая разработка темы . Принцип: опыт формируется в результате многократного повторного исполнения и воспроизводится в знакомых пространственно-временных условиях. Почему этот принцип важен для анализа профессиональной деятельности? Устройство и функционирование структур опыта.

Характеристика опыта по Д.Норману: плавность, легкость, автоматизированность исполнения, переживание усилия, напряжение, способность интерпретации выполненного.

Опыт, сознание, бессознательное.

Усилия и активность субъекта. Влияние значимого другого.

Опыт как исполняемое действие. Переживание дления процесса.

Опыт - это умение быстро улавливать изменения в знакомых людях и предметах. Опыт предполагает быстрое мышление и требует быстрой памяти.

Опыт - это владение схемами пространства и времени процесса.

Память и опыт. Воспоминание и узнавание ситуации. Узнавание предметов, людей. Действие в знакомой и незнакомой ситуации. Первичная эмоциональная реакция на незнакомую ситуацию - страх, тревога, беспокойство. Память как сохранение и удержание контекста деятельности. Память как держание контекста деятельности и общения. Формирование структур опыта для действий в экстремальных ситуациях: тренажерная подготовка и разборы происшествий. Вербальные структуры профессионального опыта. Переход от пространственных и временных структур к вербальным - трудности вербализации.

Схема: "здесь-и-теперь-организация" действия и восприятия.

Жизненное пространство (топология и годология), его энергетическая характеристика (валентности объектов, мест и препятствий) и жизненная перспектива человека (Э. Гуссерль, К. Левин). Картина мира (Т. Шибутани): речь, символы, поведение, социальные нормы.

Образ мира (А.Н. Леонтьев): смыслы, значения, пространство, время.

Психосемантика: эмоции, смыслы, их влияние на формирование структур опыта. Потребности, мотивы, эмоции, смыслы не могут не влиять на структуры опыта. Почему этот подход важен для анализа профессиональной деятельности?

Собственное время и пространство процесса представлены в структурах опыта. Пять линий описания времени труда в дальних перелетах: ритмы тела, ритмы действия, хронометрическое время, местные социальные ритмы жизни, астрономическое время. Ожидание.

Психосемантика: Социально-психологические аспекты. Присутствие членов команды. Воздействие: упреки, насмешки, издевательства, контроль за исполнением, коррекция и реакция, разбор ошибок, оценки и мнения. Наказание за совершенную ошибку. Стремление сохранить авторитет. Влияние значимого другого.

Методика 5.2. Функциональные единицы памяти авиадиспетчера 26

4. Точность воспроизведения сведений рассматривалась отдельно для меток (табл. 3) и параметров формуляров сопровождения (табл. 4). Для оценки точности запоминания координат ВС была введена четырехбалльная шкала. Из табл. 3, а видно, что основная часть меток (до 70%) воспроизводилась с большой точностью. При несовпадении координат предъявленных и восстановленных точек отмечены отклонения двух типов - по курсу и против курса. Из табл. 3.б видно, что сдвигов против курса в ОС больше, чем в УС, а количество сдвигов по курсу для обоих секторов одинаково.

Т а б л и ц а 5.4. Число воспроизведенных меток при различных степенях приближения к истинным положениям (а) и ошибочно смещенных относительно истинных положений (б)


сектор

степень

приближ

ения

направл.

смещен.

0

1

2

3

по курсу

против курса

низкая

УС

24

18

25

7

14

33

ОС

40

33

42

19

29

66

высокая

УС

47

44

21

17

50

38

ОС

33

46

24

22

34

61

5. Результаты восстановления цифровых значений формуляров также обнаруживают различные отношения диспетчеров к У- и 0- секторам. В УС наиболее точно восстанавливались тип, № борта и текущая высота (86-90% безошибочного воспроизведения). С увеличением нагрузки точность воспроизведения этих параметров падает до 46-52%. В ОС наиболее частыми являются случаи восстановления заданной высоты. Наименьшая точность наблюдалась для параметра - “№ борт”: из 210 названных номеров борта 42% ошибочны.

Т а б л и ц а 5.5. Число ошибочных воспроизведений (в % от числа правильных ответов в каждом условии) отдельно по различным параметрам формуляра сопровождения


сектор

парамет

ры

формуля

ра

.

.

тип

№ борта

Нтекущ.

Н задан.

скорость

низкая

УС

2,9

24,6

17,5

13,7

15,9

ОС

14

58,9

25,6

14,1

11,7

высокая

УС

7,7

47,5

27,4

24,6

7,5

ОС

11,4

48

20,6

13,5

18,7

6. Карты восстановления были рассмотрены также с целью определить те метки, которые восстанавливались авиадиспетчерами не по одной, а группами. Из 36 выделившихся групп 30 оказались в зонах внимания, указанных диспетчерами при ответах на вопросы анкеты. Группы ВС выделялись на основе различных видов групповых трансформаций, которые производили диспетчеры при восстановлении меток, изменяя положение (относительно предъявленного) одновременно нескольких меток по одному и тому же для этих судов признаку (см.рис. 5.1).

рис. 5.1: а) группирование вокруг статического центра; б) групповое смещение (поворот); в) пространственное сжатие. Примеры групповых трансформаций показаны на рисунке

Обсуждение. Результаты воспроизведения показывают, что диспетчер, выполняя свои профессиональные действия, работает с несколькими информационными структурами, самая крупная из которых - определенная целевая зона, т. е. часть экрана, выделенная картографическими признаками в соответствии с определенным профессиональным назначением, а самая мелкая - отдельный знак (в том числе и радиолокационная метка).

Между этими двумя структурами по критерию “число входящих знаков” располагаются следующие знаковые комплексы: а) группа воздушных судов; б) отдельное воздушное судно (формуляр сопровождения вместе с меткой); в) параметр воздушного судна (часть формуляра сопровождения).

Целостность восприятия этих комплексов подтверждается следующим: 1) диспетчеры восстанавливали воздушную обстановку посредством определенных функциональных признаков, характерных для каждого уровня; 2) на каждом уровне диспетчеры отмечали видоизменения структур по неизменному для данного уровня критерию; 3) при анализе воздушной обстановки диспетчеры использовали характерные для каждого уровня признаки оперирования, знаковыми. комплексами. На схеме показано, какие формы принимают знаковые комплексы в результате функциональных мнемических построений.


practic psychology -> Учебное пособие Красноярск Москва 2001
practic psychology -> Евгений Александрович Тарасов Как преодолеть свои страхи и комплексы. 10 тестов + 14 правил
practic psychology -> Сергей Владимирович Петрушин Счастья в личной жизни… Советы психолога

Об анализе информации в приложении к бизнес-процессам в последнее время говорят много. Плохо лишь, что под этим термином каждый понимает свое. Фрагментарность в подходе, к сожалению, напоминает другое распространенное явление - «лоскутную автоматизацию», когда на рабочие места устанавливаются разрозненные, слабо взаимосвязанные программные средства.

С анализом информации ситуация аналогична: зачастую в качестве «полнофункционального решения» предлагаются разрозненные механизмы, охватывающие только незначительную часть задач.

Как человек принимает решения?

Объяснить, как рождается мысль, мы, конечно, не в состоянии. Поэтому сконцентрируемся на том, как использовать в этом процессе информационные технологии. Первый вариант: лицо, принимающее решение (далее буду называть его ЛПР), видит в компьютере только средство извлечения данных, а выводы делает самостоятельно. Для решения такого рода задач служат системы отчетности, многомерный анализ данных, диаграммы. Второй вариант: программа не только извлекает данные, но и проводит их предобработку, например очистку, сглаживание и пр., а к обработанным данным применяет математические методы анализа - кластеризацию, классификацию, регрессию и т. д. В этом случае человек работает уже с моделями, подготовленными компьютером.

В первом случае практически всё, что связано с принятием решений, возлагается на человека, а потому подбор адекватной модели и выбор методов обработки выносится за пределы механизмов анализа. Базой для принятия решения является либо инструкция (например, каким образом реализовать механизмы реагирования на отклонения), либо интуиция. Иногда этого достаточно, но если ЛПР интересуют более глубокие знания, простое извлечение данных тут не поможет. Это и есть тот самый второй случай, когда лишь надежные механизмы предобработки и анализа позволят ЛПР действовать на более высоком уровне. И если первый вариант хорошо подходит для решения тактических и оперативных задач, то второй - для тиражирования знаний и решения стратегических проблем.

В идеале человеку нужна возможность применять оба подхода к анализу, выбирая методики в зависимости от задач. Вместе они позволяют удовлетворить почти все потребности организации при работе с бизнес-информацией.

Элементы анализа

Часто при описании того или иного продукта, анализирующего бизнес-информацию, применяют такие термины, как «риск-менеджмент», «прогнозирование», «сегментация рынка»… Но в действительности решение каждой из этих практических задач сводится к применению одного из описанного ниже методов анализа. Например, прогнозирование - это задача регрессии, сегментация рынка - это кластеризация, управление рисками - это комбинация кластеризации, классификации и, возможно, других методов. Фактически, они являются атомарными (базовыми) элементами, из которых собирается решение той или иной задачи (см. схему).

Источники данных

В качестве первичного источника данных должны выступать все сведения, которые могут пригодиться для принятия решения: базы данных систем управления предприятием, офисные документы, Интернет. Причем речь идет не только о внутренних, но и о внешних данных (макроэкономические показатели, конкурентная среда, демографические показатели и т. п.).

Хранение данных

Хотя в хранилище данных не реализуются технологии анализа, оно является той базой, на которой нужно строить аналитическую систему. При отсутствии хранилища на сбор и систематизацию необходимой для анализа информации будет уходить большая часть времени. Что в значительной степени сведет на нет все достоинства анализа - ведь одним из ключевых показателей любой аналитической системы является возможность быстро получить результат.

Семантический слой

Следующий элемент схемы - семантический слой. Независимо от того, как будет анализироваться информация, необходимо, чтобы она была понятна ЛПР. В большинстве случаев анализируемые данные располагаются в различных базах данных, а ЛПР не должен вникать в нюансы работы с СУБД. Поэтому требуется создать некий механизм, трансформирующий термины предметной области в вызовы механизмов доступа к БД. Эту задачу и выполняет семантический слой. Желательно, чтобы он был один для всех приложений анализа - так легче применять к задаче разные подходы.

Системы отчетности

Предназначение систем отчетности - отвечать на вопрос «что происходит?». Первый вариант их использования - регулярные отчеты для контроля оперативной ситуации и анализа отклонений. Например, система ежедневно готовит отчеты об остатке продукции на складе, и когда его значение меньше значения средней недельной продажи, необходимо отреагировать подготовкой заказа на поставку. Обычно этот подход в том или ином виде реализован в компаниях (пусть даже просто на бумаге), но нельзя допускать, чтобы это был единственный из доступных подходов к анализу данных.

Второй вариант - обработка нерегламентированных запросов. Когда ЛПР хочет проверить какую-либо мысль (гипотезу), ему необходимо получить пищу для размышлений, подтверждающую либо опровергающую идею. Идеи, как известно, приходят спонтанно, а потому невозможно предсказать, какого рода информация потребуется. Это означает, что необходим инструмент, позволяющий быстро и в удобной форме нужную информацию получить.

Механизм OLAP

Для построения систем отчетности можно применять различные подходы, однако самый распространенный на сегодня - это OLAP. Его основная идея - представление информации в виде многомерных кубов, где оси являют собой измерения (время, продукты, клиенты и пр.), а в ячейках помещаются показатели (например, сумма продаж, средняя цена закупки). Пользователь манипулирует измерениями и получает информацию в нужном разрезе.

Благодаря простоте понимания и наглядности, OLAP получил широкое распространение в качестве механизма анализа данных, но его возможности в области более глубокого анализа - например, прогнозирования - крайне ограничены. Основная проблема при решении задач прогнозирования - не возможность сведения данных в таблицы и диаграммы, а построение адекватной модели. Если модель есть, дальше все просто: на ее вход подается новая информация, пропускается через нее, а результат - это и есть прогноз. Но собственно построение такой модели является совершенно нетривиальной задачей! Конечно, можно заложить в систему несколько готовых простых моделей, например линейную регрессию или что-то аналогичное. Но, увы, это проблему не решает, поскольку реальные задачи почти всегда выходят за рамки простых моделей. А значит, будут обнаружены только явные зависимости, ценность которых незначительна. Приведу пример: если при анализе курса акций на фондовом рынке вы исходите из предположения, что завтра акции будут стоить столько же, сколько и сегодня, то в 90% случаев вы угадаете. Но насколько ценны такие знания? Интерес для брокеров представляют только оставшиеся 10%. Примитивные модели дают результат примерно того же уровня.

Собственно, задача построения прогнозов и тому подобные вещи выходят за рамки механизмов систем отчетности, поэтому и не стоит здесь ждать от OLAP положительных результатов. Для этого применяется совершенно другой набор технологий - Knowledge Discovery in Databases.

Knowledge Discovery in Databases

KDD - это процесс поиска полезных знаний в «сырых данных». KDD включает в себя вопросы подготовки данных, выбора информативных признаков, очистки данных, применения методов Data Mining (DM), постобработки данных, интерпретации полученных результатов.

Привлекательность этого подхода в том, что, независимо от предметной области, мы применяем одни и те же операции:

    Извлечь данные. В нашем случае для этого нужен семантический слой.

    Очистить данные. «Грязные» данные могут свести на нет применяемые в дальнейшем механизмы анализа.

    Трансформировать данные. Различные методы анализа требуют данных, подготовленных в специальном виде. Например, где-то в качестве входов может использоваться только цифровая информация.

    Провести собственно анализ - Data Mining.

    Интерпретировать полученные результаты.

Процесс повторяется итеративно, и, по сути, это все, что необходимо для автоматизации извлечения знаний. Дальнейшие шаги уже делает эксперт, он же ЛПР.

И снова человек

Интерпретация результатов компьютерной обработки возлагается на человека, ведь никакой результат не имеет значения, пока не будет применен к конкретной предметной области. Но зато существует возможность тиражировать знания. Например, ЛПР при помощи того или иного метода определил, какие показатели влияют на кредитоспособность покупателей, и представил вывод в виде правила. Правило можно внести в систему выдачи кредитов и таким образом значительно снизить кредитные риски, поставив их оценки на поток. При этом от человека, занимающегося выпиской документов, не требуется глубокого понимания причин того или иного вывода. Основная идея - переход от разовых и неунифицированных методов к конвейерным.

Я нигде не упоминал о том, какие технологии будут использоваться для анализа, так как сами задачи и методы их решения не зависят от инструментария. Практически все реальные бизнес-задачи - прогнозирование, сегментация рынка, оценка эффективности рекламных кампаний и множество других - сводятся к вышеописанным и решаются одним из указанных методов (или их комбинацией).

На практике под системой анализа бизнес-информации часто понимается только OLAP. Получается, что под толстым слоем рекламных лозунгов находится всего лишь система построения отчетов. Но достаточно отталкиваться от предложенной схемы, и вы будете понимать действительное положение вещей. Лишь имея в распоряжении инструмент, позволяющий решить все названные задачи, можно говорить, что независимо от природы исследуемых объектов вы готовы выжать из данных максимум полезной информации и справиться с любой задачей бизнес-анализа.

СЕМАНТИЧЕСКОЕ ПРОСТРАНСТВО - предложенная американским физиком Д. Бомом модель целостности мира как всеобъемлющего движения (Holomovement). Он поставил задачу построения концепции, которая в рамках единого методологического подхода объединила бы материальную Вселенную и сознание. Фундаментальная отличительная черта космологии Бома состоит в признании неразрывного единства реальности, ее неделимой целостности. С этой точки зрения мы являемся частью целого, которое обладает способностью генерировать идеи о самом себе и регистрировать их внутри себя самого. Эта парадигма объединенного бытия напоминает индийскую концепцию акаша.

В России близкий подход развивал математик и философ В.В. Налимов. Однако в его концепции смыслы и материя - это не различные проявления единой реальности, как у Бома, а две автономные реальности - физический мир и мир семантический, которые непосредственно связаны между собой через геометрию мира. По мнению Налимова, такой подход обладает тем преимуществом, что создает предпосылки для построения сверхъединой теории поля, которая будет объединять оба слоя реальности. Придавая смыслам самостоятельное существование как особой реальности, Налимов формулирует основную аксиоматику своей концепции. Весь воспринимаемый нами мир интерпретируется как множество текстов. Что касается биосферы, то здесь текстами следует считать отдельные особи, виды, популяции; в ноосфере в качестве текстов следует принимать различные аспекты сознательной деятельности.

Ключевым понятием тезауруса концепции С.п. является понятие смысла. Согласно Дж. Колеру, смысл есть сеть значений в определенных состояниях и алгоритм для решения проблем. Природа смысла раскрывается через одновременный анализ семантической триады - смысл, текст, язык (код). «Смысл смысла, - пишет австро-американский психолог В. Франкл, - в том, что он направляет ход бытия». Эволюция текста связана со спонтанным появлением фильтра, взаимодействующего с исходной функцией. Для описания этого взаимодействия Налимов предлагает использовать формулу Байеса, которая применяется при решении статистических задач о минимуме риска. Формула Байеса позволяет рассчитать апостериорную вероятность каждого из возможных событий. По Налимову, изначально все возможные смыслы мира спрессованы вдоль семантической оси подобно тому, как на действительной оси спрессованы числа (линейный континуум Кантора). Поскольку спрессованность смыслов в одномерном С.п. следует понимать как их непроявленность, их исходное состояние надо интерпретировать как семантический вакуум. Распаковывание смыслов, или появление текстов, осуществляется путем формализма Байеса, который осуществляет вероятностное взвешивание вдоль семантической оси. Возникновение вдоль этой оси функции распределения статистических весов (плотности вероятности) и означает появление текста. В общем случае, полагает Налимов, можно говорить о текстах, задаваемых функцией распределения не только вдоль оси, но и в многомерном С.п. Если физический мир и мир семантики - два автономных слоя реальности, то их взаимосвязь должна обеспечиваться потоками информации. В рамках анализируемой концепции информацию следует рассматривать как сложный процесс, состоящий из элементарных актов, протекающих в многомерном мире самоорганизующихся систем. Такое понимание информации соответствует философии А. Бергсона и А. Уайтхеда, ориентированной на системный подход постнеклассической науки. Информация, обеспечивающая связь между материальным и семантическими слоями реальности, может быть только необратимым процессом, развивающимся в многомерном и нелинейном мире.

Недостаток концепции В.В. Налимова состоит в том, что, постулируя самостоятельное существование С.п., он не видит необходимости определить соответствующий ему физический референт. Уход от поисков такого референта равнозначен отказу от исследования проблемы методами теоретической и экспериментальной физики.

Независимую попытку обнаружить такой физический референт в 1960-х гг. предпринял российский физико-химик Н.А. Кобозев. По его мнению, для того, чтобы мозг человека был способен мыслить безэнтропийно, должен существовать внешний источник антиэнтропии, или энтропийный вакуум. Связь между этим источником и атомно-молеку- лярными структурами коры головного мозга, согласно гипотезе Кобозева, обеспечивается квантовым ансамблем сверхлегких частиц, обладающих спином S. Однако эти частицы не были обнаружены экспериментально.

Другое решение проблемы предложено Л.B. Лесковым, который сформулировал мэоническую парадигму. Используя в качестве исходного пункта концепцию С.п. Налимова, Лесков дополнил ее двумя постулатами: а) физическим референтом С.п. является мэон - разновидность физического, или квантового, вакуума; б) все объекты материального мира, начиная от элементарных частиц и кончая мозгом человека, обладают свойством консиенции - способностью информационного взаимодействия с семантическим потен-циалом мэона (conscientia на латыни означает осведомленность в чем-либо, совместное знание). Преимущество такого подхода очевидно: он открывает путь к использованию достижений современных теорий физического вакуума, а также к проведению на этой основе специальных экспериментальных исследований.

Свойства мэона парадоксальны. Не будучи объектом материального мира, включенным в метрику Эйнштейна-Минковского, мэон не подчиняется закономерностям термодинамики и теории относительности. Если передача информации осуществляется с участием мэона, то скорость этого процесса может значительно превышать скорость света. Не подчиняясь закону роста энтропии, мэон не характеризуется стрелой времени: прошлое, настоящее и будущее для него как бы синхронны. Эти свойства мэона не укладываются в картезианско-ньютонову парадигму, но здесь нет противоречия, т.к. речь идет о квантово-механическом феномене, соответствующем постнеклассической картине мира. Процессы информационного взаимодействия семантического потенциала мэона с материальными объектами можно описывать на языке современных теорий физического вакуума (торсионные волны в модели А.Е. Акимова - Г.И. Шилова, взаимодействие бюонов по Ю.А. Баурову).

Остается открытым вопрос о механизме кодирования семантического потенциала в квантовых структурах мэона. Существует, однако, один радикальный способ обойти эту трудность: достаточно предположить, что мэон выполняет функцию не банка, а транспортного агента смыслов, а их генерацию в этом случае можно связать с индивидуальным и «коллективным» сознанием. Этой гипотезе соответствует семантический принцип, которому можно придать либо слабую, либо сильную форму. В первом случае это будет означать, что существует планетарное семантическое поле, а во втором - этому соответствует космическое поле.

Литература:

Налимов В.В. Спонтанность сознания. М., 1989;Лесков Л.В. Семантическая Вселенная // Вестник Московского университета. Серия 7. Философия. 1994. № 2.

Словарь философских терминов. Научная редакция профессора В.Г. Кузнецова. М., ИНФРА-М, 2007, с. 487-489.