Глава 1 Основные понятия

В этой книге описываются методы обработки информации, представленной в различной форме - в виде «данных», «знаний», «структур» и т. д. В основе анализа всех этих видов информации лежат две процедуры: процедура обнаружения закономерностей, содержащихся в представленной информации, и процедура использования обнаруженных закономерностей для предсказания значения одной части информации по известным значениям другой ее части. Но прежде чем переходить к описанию этих процедур, нужно пояснить смысл употребляемых в книге терминов, в частности таких распространенных, как данные, знания, гипотеза, закономерность и т. п.

§ 1. Чем отличаются «данные» от «знаний»?

Исходная информация, которую нужно обрабатывать, чаще всего имеет вид числовых таблиц (матриц), состоящих из строк и столбцов. Строки отражают информацию об изучаемых объектах или явлениях, а столбцы отражают свойства (признаки, характеристики) этих объектов или явлений. Природа объектов может быть любой - это могут быть физические тела, живые организмы, сигналы, отдельные социальные процессы, заводы, виды спорта, месторождения и т. д. Понятно, что набор признаков, описывающих эти объекты, будет в каждом случае своим и должен отражать их наиболее важные свойства.

На пересечении -й строки и -го столбца указывается значение -го признака у -го объекта. Такой факт (например, что -й дом имеет высоту 12 м) считаем атомарной частью данных о конкретном -м объекте. Полные данные об -м объекте содержатся в совокупности всех элементов -й строки. Информация же о всех заданных свойствах всех изучаемых объектов, записанная в таблице «объект-свойство», и называется таблицей данных. Таким образом, данные представляют собой совокупность отдельных конкретных фактов.

Пусть в таблице данных представлены описания большого количества жилых домов, а нас интересуют только три свойства этих домов: из какого материала они построены, в какой цвет покрашены их стены и какой они высоты. После изучения таблицы данных мы можем обнаружить некоторые закономерности. Например, выясняется, что все панельные дома, окрашенные в серый цвет, имеют высоту от 15 до 25 м, панельные зеленые дома - от 8 до 16 м, а кирпичные, вне зависимости от цвета стен, имеют высоту меньше 10 м. Обозначим признак «вид строительного материала» через . Этот признак принимает два понятных значения: (панель) или (кирпич). Признак «цвет стен», обозначаемый через принимает значения: = серый, = зеленый или = любой. Признак «высота» может принимать любое числовое значение от нуля до 30 м. Тогда обнаруженные закономерности можно сжато записать в виде таких логических высказываний:

Эти высказывания не содержат информации в виде конкретных характеристик каждого отдельного дома, но зато отражают наши знания о некоторых обобщенных характеристиках всех домов, описанных в таблице данных.

Так выглядит переход от данных к знаниям. Знания представляют собой краткое обобщенное описание основного содержания информации, представленной в данных. Знания могут быть представлены в различной форме. В дальнейшем мы будем пользоваться приведенной выше формой в виде логических правил типа «если... то...».

Знания в современных компаниях

Компания "Ксерокс" в последние годы позиционирует себя не как производитель копировальных аппаратов, а как компания по обработке документов. Компания "ЗМ" называет себя компаний по инновационному решению задач. "ИБМ" идентифицирует себя как компания, создающая долгосрочные экономические преимущества для клиентов, объединяя свои знания в области бизнеса с широкими технологическими возможностями. Компания Steelcase, которая производит конторское оборудование, утверждает, что она продает собственные знания и услуги, которые позволяют создать лучшие условия пребывания людей на своих рабочих местах. Что добавляет стоимость в деятельность всех этих компаний? Это в основном решения, базирующиеся на знаниях: технические и технологические ноу-хау, дизайн продукта, маркетинговые исследования, выявление истинных нужд клиентов. Именно знания дают устойчивое конкурентное преимущество этим компаниям.

Рассмотрим, в чем отличие знаний от данных и информации. То, что это разные вещи, руководители начинают осознавать особенно ярко после того, как в организации потрачены значительные средства для создания той или иной базы данных, или информационной системы, или же просто эти средства потрачены на компьютеризацию, причем без соответствующего эффекта.

Данные - это совокупность различных объективных фактов. В корпорациях это, например, структурированные записи о трансакциях (в частности, данные обо всех продажах: сколько, когда и кто купил, сколько и когда заплатил и пр.). Эти данные не говорят о том, почему покупатель пришел именно сюда и придет ли он еще раз.

Информация - это иерархическая совокупность данных о тех или иных аспектах реального мира. Информация - это поток сообщений, а знание создается из этого потока, оно находится в зависимости от мнений и убеждений носителя знания.

Информация - это своего рода послание, обычно в форме документа или в видео- либо в аудиоформе. Она имеет получателя и отправителя. Она информирует, т.е. "придает форму", получателю путем изменения его оценок или поведения. Насколько послание является информацией, определяет получатель. Именно он оценивает, насколько полученное сообщение информирует его, а насколько оно представляет собой просто информационный шум.

Данные превращаются в информацию несколькими путями:

  • o контекстуализация : мы знаем, для чего эти данные нужны;
  • o категоризация : мы разбиваем данные на типы и компоненты;
  • o подсчет : мы обрабатываем данные математически;
  • o коррекция : мы исправляем ошибки и ликвидируем пропуски;
  • o сжатие : мы сжимаем, концентрируем, агрегируем данные.

Знания - понятие более глубокое и широкое, чем просто данные или информация. Каждое предприятие в ходе своей деятельности осуществляет сбор данных, их структуризацию и генерирование нового знания. Чаще всего это знание касается технологии, если речь идет о материальном производстве, а также технологии работы с клиентами и технологии взаимодействия друг с другом, если речь идет о предприятии, осуществляющем обслуживание клиентов. Также это может быть знание относительно окружающей среды предприятия - о демографических, макроэкономических, социальных, макроэкономических, технологических и конъюнктурных трендах.

Отличие знаний от информации и данных: пример

У компании Chrysler имеется собрание компьютерных файлов, которые носят название "Книга инженерных знаний" и представляют собой исчерпывающие данные и информацию о создании автомобилей этой компании, которыми может пользоваться каждый разработчик новых автомобилей. Когда управляющий получил данные о проведенных крэш-тестах, то он отказался их поместить в файлы без соответствующей обработки. Он предложил ответить на следующие вопросы:

  • o почему эти тесты проводились;
  • o каковы результаты по сравнению другими аналогичными тестами данной компании других лет и конкурентов;
  • o какие выводы дачи тесты для конструкции автомобиля и его основных узлов?

Аналогичные вопросы трансформируют информацию в знания; более того, ответы на эти вопросы добавляют информации ценность, или, говоря другими словами, добавляют стоимость. На практике встречаются противоположные примеры, когда путем добавления ненужной, пустой информации исходная информация теряет в своей цене. Происходит потеря стоимости за счет размывания нужной информации в потоке информационного шума.

Знание - это комбинация опыта, ценностей, контекстной информации, экспертных оценок, которая дает общие рамки для оценки и инкорпорирования нового опыта и информации. Знание существует в сознании тех, кто знает. В организациях оно фиксируется не только в документах, но и в процессах, процедурах, нормах, в целом в практике деятельности.

Точно так же как информация возникает из данных, так и знания возникают из информации путем:

  • o сравнения, определения области применения (как и когда мы можем применить информацию об этом явлении к другому, аналогичному);
  • o установления связей (как эта информация соотносится с другой информацией);
  • o оценки (как можно оценить данную информацию и как ее оценивают другие);
  • o определения области применения (какое применение имеет эта информация к тем или иным решениям или действиям).

Процесс трансформации данных в информацию, а информации в знания показан на рис. 14.1.

Рис. 14.1.

Различают индивидуальные и групповые знания. Традиционные представления исходят из того, что знания - это прерогатива отдельных людей, при этом группа - это лишь простая сумма членов этой группы, а групповое знание - сумма их знаний.

Существует другая, современная точка зрения, в соответствии с которой группа людей формирует новую сущность со своей уникальной спецификой. В рамках этого представления можно говорить о групповом поведении и о групповом знании соответственно. Это новое представление широко используется в рамках науки об управлении знаниями. Таким образом, знание может быть не только у отдельного человека, но и у группы людей. Тогда говорят о том, что что-то знает организация в целом, что-то знает группа, бригада и т.д.

Билл Гейтс в своей книге "Бизнес со скоростью мысли" пишет о необходимости повышения корпоративного IQ. При этом он имеет в виду не только количество умных сотрудников, но и накопление знаний в компании в целом и свободное распространение информации, которое позволяет сотрудникам пользоваться идеями друг друга.

Знание может быть явным и неявным. Явное знание может быть выражено в виде слов и цифр и может передаваться в формализованном виде на носителях. Это относится к тем видам знаний, которые передаются в форме предписаний, инструкций, книг, на различных носителях, в виде памятных записок и пр.

Неявное знание в принципе не формализуется и может существовать лишь вместе с его обладателем - человеком или группой лиц.

Существует два вида неявного знания. Первое - это технические навыки, которые проявляются у мастеров своего дела и выступают, как правило, результатом многолетней практики. Второе - это верования, идеалы, ценности и ментальные модели, которые мы используем, не задумываясь о них.

Неявные знания формируются и развиваются в процессе создания и укрепления позитивной корпоративной культуры и с помощью средств группового взаимодействия (ретриты, творческие группы и пр.).

Отношение к явному и неявному знанию со стороны коммерческих фирм весьма противоречиво. С одной стороны, многие фирмы стремятся перевести неявное знание в явное. Это делается для того, чтобы, с одной стороны, не зависеть от отдельных личностей, а с другой - продублировать значимые достижения. В то же время эти фирмы не заинтересованы в том, чтобы основные конкурентные преимущества перешли в форму, готовую для дублирования. Именно поэтому многие компании стараются сохранять некоторые из своих конкурентных преимуществ в тех формах, которые не поддаются дублированию (специфические тренинги, корпоративная культура, специальные системы обслуживания и пр.).

Носителем как явного, так и неявного знания может быть не только конкретная личность, но и организация . Следовательно, можно говорить и о неявном групповом знании, которое лежит в основе устойчивых моделей коллективных реакций и внутренних взаимодействий.

В западной литературе для обозначения неявного группового знания иногда используется термин "рутины" (routines), которые есть повторяющиеся по шаблону действия, регулярные поведенческие шаблоны организации или фирмы. Рутины - это то, что происходит автоматически, без инструкций и в отсутствие процедуры выбора; при этом рутины не могут быть кодифицированы.

В русском языке под рутиной понимаются заведенный порядок, установившаяся практика, определенный режим, шаблон, сложившиеся правила, касающиеся занятий людей. В то же время понятие "рутина" имеет еще один опенок: это косный порядок, т.е. такой порядок, который тяготеет к старому, привычному, в силу своей отсталости невосприимчивый к новому, прогрессивному. В тех случаях, когда термин "рутина" применяется для обозначения группового неявного знания, то оттенки, относящиеся к косности, отсутствуют.

Таким образом, персональное неявное знание - это, прежде всего, умения. В то же время групповое неявное знание - это, прежде всего, рутины. Рутины существуют не изолированно, а образуя взаимозависимость. Некоторые рутины могут быть неявными для одних членов группы (организации) и явными для других. Таким образом, границы между явными и неявными знаниями относительны, также можно говорить о степени неявности этих знаний. Соотношение явных и неявных, индивидуальных и групповых знаний представлено в табл. 14.1.

Таблица 14.1

Соотношение знаний

Наличие неявных знаний в организации заставляет подходить к управлению знаниями нетрадиционным способом. Традиционно под управлением знаниями понимают создание, развитие и использование различных баз данных и знаний. Наличие неявных знаний смещает внимание к средствам прямого общения между людьми. Важно не только и не столько создать корпоративную энциклопедию, в которой записано все, что кто-либо из работников знал и с чем сталкивался. В случае с неявными знаниями важнее иметь под рукой координаты людей, которые знают рецепт и имеют соответствующий опыт, создать культуру общения, используя "мозговые штурмы", совещания, "разборы полетов" и соответствующие средства общения, такие как электронная почта, персональные сайты, телеконференции и пр.

Все знают, что такое базы данных и как ими пользоваться. Созданы и постоянно расширяются самые разнообразные базы данных по любой тематике, от научной периодики до художественной литературы, от произведений искусства до справочников телефонных номеров.

Но это необходимое образование постепенно начинает терять свою былую значимость. Особенно это касается научной периодики. Главная проблема научных баз данных - это их избыточность. Любой запрос, выполненный по ключевым поисковым словам, выдаст столь огромное количество ссылок, что их просмотр становится отдельной работой. При этом многие материалы различаются столь незначительно, что трудно оценить полезность одного из них на фоне другого.

Вариантом выхода из этой ситуации является создание баз знаний или баз решений: систематезированной информации, которая обрабатывается по другим поисковым алгоритмам.

В чём главное отличие баз данных и баз знаний? В базе данных идёт поиск по ключевому слову, условно говоря - это ответ на вопрос “что?”. Например, задаём поисковый запрос “нанотрубки”. База данных выдаст всё, что касается этого запроса: и синтез, и окисление, и биоразложение, и спектральные характеристики. Число ссылок перевалит за тысячи. Можно задавать поиск по двум, трём и более ключевым словам. Это сократит вал ссылок, но может отсечь нужные. В базе знаний поиск проводится по нескольким вопросам, например: “Что?”, “Чем?”, “Как?”. При этом появляется следующий момент. В настоящее время написаны миллионы статей и патентов по всем областям знания. Но решений, отвечающих принципу базы знаний, только порядка 30 - 35 тысяч. Прирост числа решений, в отличие от прироста вала статей, протекает медленно. Подавляющее большинство статей - это лишь небольшие нюансы какого-либо решения. Например: закалка металла. Решение - что: металл, чем: охлаждающий материал, как: быстро. Это решение охватывает и все металлы и сплавы, и все типы закалочных жидкостей или газов, и все способы подачи хладагента. Далее из этого запроса может быть сформирована база данных, например, по типам хладагента (вода, масло, рассолы), вторая - по способам подачи материала (насосы, окунание детали, распыление раствора), третья - по маркам сталей. Может быть сформирована дополнительная база ссылок по второстепенным процессам: окислению поверхности металла, удалению нагара после закалки, специальным методам закалки. Поиск по базе знаний отличается от поиска по базе данных, для этого используются так называемые “ресурсы”. Ресурсы в понимании баз знаний - это материалы, катализаторы, поля и воздействия, приводящие к получению решения. Базы знаний могут обрабатывать также поисковые вопросы. Например, запрос “синтезировать сложный эфир” заданный в базу данных будет истолкован только по ключевому слову “сложный эфир”. В базе знаний можно также задать термины “синтез”, “распад”, “биоразложение” и семантические алгоритмы поиска по глаголам.

Теперь немного о минусах этой системы. Базы данных - это устоявшиеся правила формирования ключевых слов, единые (с небольшими вариациями) для всех научных изданий и унифицированные с алгоритмами поиска. Базы знаний необходимо будет создавать с нуля. Это немалая работа, ведь для того, чтобы вычленить ресурсы необходимо полное понимание процессов описанных в статье или патенте, что сильно усложняется при обработке мультидисциплинарных статей и защищённых от реинжиниринга патентов. Второй минус - базы знаний сейчас создаются “под инженеров”, то есть в основном прикладной направленности. Фундаментальные исследования, таким образом, в них не попадают.

Теперь немного о плюсах. Создание базы знаний - это великолепный процесс обучения. “Побочным продуктом” является значительное повышение уровня знаний разработчиков и получение высококлассных специалистов, умеющих решать поставленныезадачи. Второй плюс - при определённом алгоритме формирования запросов база знаний может быть источником новых решений, не описанных и ещё не созданных. Например, при запросе по закалке металла база знаний может выдать список ресурсов, которые обладают необходимыми свойствами (температура, текучесть) и подтолкнуть к созданию новых решений, таких как закалка в расплавах полимеров, закалка с одновременным окислением поверхности, точечная и неравномерная закалка. Третий плюс. Вероятно, многие даже не задумывались, что суть процессов изложенных в научной статье или патенте формулируется не более чем в сотне слов. В то же время, объём статей исчисляется минимум несколькими страницами, а патентов - до нескольких сотен страниц. Переработка материала под систему базы знаний позволит в дальнейшем не тратить время на чтение малозначащих подробностей и отличий от аналогов, непременно описываемых в исходных материалах.

Небольшой итог. Базы знаний исключительно полезны для прикладных разработок, особенно на передовых рубежах науки. Они позволяют получать готовые решения для той или иной задачи. Их создание в то же время, сильно повышает профессиональный уровень разработчиков и позволяет получать отличных специалистов.

Отличия знаний от данных

Информация, данные, знания

Информация существует в трех видах: в виде данных (Data ), собственно информации (Information ) и знаний (Knowledge ).

При компьютерной обработке информации исходные данные понимаются как данные , и должны быть представлены в форме, которую можно хранить, обрабатывать, передавать.

Данные – зафиксированные наблюдения, которые в данный момент времени не оказывают воздействия на принятие решения.

Данные обычно представлены в форме, которая позволяет использовать их для компьютерной обработки и передачи, то есть, закодированы, могут храниться.

Примеры данных: словарь – упорядоченный набор текстовых данных, энциклопедия – упорядоченный набор данных, произвольный текст (статья, конспект).

Из данных можно извлечь информацию.

Информация – это обработанные данные, которые представлены в виде, пригодном для принятия получателем решения.

Примеры информации: извлеченное из словаря толкование слова, извлеченное из энциклопедии значение термина.

Информацией является содержание, значение данных, или факты, которые используются для принятия решения.

Знания – факты, сообщения об окружающей среде, процедуры и правила манипулирования фактами, а также информация о том, когда и как следует применять эти процедуры и правила.

В целом, знания – это проверенный практикой результат познания действительности, вид информации, которая отображает знания человека, специалиста в предметной области.

Знания различаются: есть декларативные (факты) и процедурные (правила). Декларативные, это знания об определенных явлениях, событиях, свойствах объектов («Я знаю, что…»). Процедурные, это знания о действиях, которые нужно предпринять для достижения какой-либо цели («Я знаю, как…»).

Отличия знаний от данных

1. Интерпретация . Хранимые данные могут быть интерпретированы только человеком или программой. Данные не несут информации. Знания содержат как данные, так и их описание (правила интерпретации).

2. Наличие связей классификации . Данные не имеют эффективного описания связей между различными типами данных. Знания структурированы, так как можно установить соответствие между единицами знаний.

3. Наличие ситуационных связей . Связи описывают множество текущих ситуаций объекта. Данные трудно поддаются анализу. Из структуры и состава знаний по ситуации возможно построение процедур анализа знаний.

Подходы к определению количества информации
(способы измерения информации)

В теории информации доказано, что информация допускает количественную оценку, то есть может быть измерена объективно.

Очевидно, что для этого нужно сделать допущения: в определенных условиях можно пренебречь качественными особенностями информации. Тогда количество информации может быть измерено числом, следовательно, можно сравнить количество информации, содержащейся в различных сообщениях.

5.1. Отличия знаний от данных

Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области. При этом возникает естественный вопрос, что такое знания и чем они отличаются от обычных данных, об­рабатываемых ЭВМ.

Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной облас­ти, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

Исходная форма существования данных (результаты наблю­дений и измерений, таблицы, справочники, диаграммы, графики и т.д.);

Представление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;

Базы данных на машинных носителях информации.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда на­зывают структурированными данными. Знания могут быть полу­чены на основе обработки эмпирических данных. Они представ­ляют собой результат мыслительной деятельности человека, на­правленной на обобщение его опыта, полученного в результате практической деятельности.

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два основных способа наделения знаниями программных систем. Первый - по­местить знания в программу, написанную на обычном языке про­граммирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Несмотря на то что основная задача будет решена, в этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Нелегким делом яв­ляются модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.

Второй способ базируется на концепции баз данных и заклю­чается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. Ба­за знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограниче­ния на структуру БЗ и операции с нею. В современных ИИС при­нят этот способ.

Следует заметить, что для того, чтобы поместить знания в компьютер, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки ин­теллектуальной системы. Следовательно, при разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем зна­ния представляются определенными структурами данных, удоб­ными для хранения и обработки в ЭВМ. Знания в ИИС сущест­вуют в следующих формах:

Исходные знания (правила, выведенные на основе практи­ческого опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением време­ни; функции, диаграммы, графы и т. д.);

Описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или про­дукционных правил, семантическая сеть, фреймы и т. п.);

Представление знаний структурами данных, которые пред­назначены для хранения и обработки в ЭВМ;

Базы знаний на машинных носителях информации.

Что же такое знания? Приведем несколько определений.

Из толкового словаря С. И. Ожегова: 1) «Знание - постиже­ние действительности сознанием, наука»; 2) «Знание - это сово­купность сведений, познаний в какой-либо области».

Определение термина «знания» включает в себя большей частью философские элементы. Например, знание - это проверенный практикой результат познания действительности, верное ее отображение в сознании человека.

Знание есть результат, полученный познанием окружающего мира и его объектов. В простейших ситуациях знания рассматривают как констатацию фактов и их описание.

Исследователями в области ИИ даются более конкретные оп­ределения знаний.

«Знания - это закономерности предметной области (принци­пы, связи, законы), полученные в результате практической дея­тельности и профессионального опыта, позволяющие специали­стам ставить и решать задачи в этой области» .

«Знания - это хорошо структурированные данные или дан­ные о данных, или метаданные» .

«Знания - формализованная информация, на которую ссы­лаются или используют в процессе логического вывода» .

В области систем ИИ и инженерии знаний определение знаний увязывается с логическим выводом: знания - это информация, на основании которой реализуется процесс логического вывода, т.е. на основании этой информации можно делать различные заключения по имеющимся в системе данным с помощью логического вывода. Механизм логического вывода позволяет связывать воедино отдельные фрагменты, а затем на этой последовательности связанных фрагментов делать заключение.

Знания - это формализованная информация, на которую ссылаются или которую используют в процессе логического вывода (рис. 5.1.).


Рис. 5.1. Процесс логического вывода в ИС

Под знанием будем понимать совокупность фактов и правил. Понятие правила, представляющего фрагмент знаний, имеет вид:

Если <условие> то <действие>.

Это определение есть частный случай предыдущего определения.

Однако признается, что отличительные качественные особенности знаний обусловлены наличием у них больших возможностей в направлении структурирования и взаимосвязанности составных единиц, их интерпретируемости, наличие метрики, функциональной целостности, активности.

Существует множество классификаций знаний. Как правило, с помощью классификаций систематизируют знания конкретных предметных областей. На абстрактном уровне рассмотрения можно говорить о признаках, по которым подразделяются зна­ния, а не о классификациях. По своей природе знания можно разделить на декларативные и процедурные.

Декларативные знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, а также включают описания основных связей и закономерностей, в которые эти факты и явления входят.

Процедурные знания - это описания действий, которые воз­можны при манипулировании фактами и явлениями для дости­жения намеченных целей.

Для описания знаний на абстрактном уровне разработаны специальные языки - языки описания знаний. Эти языки также делятся на языки процедурного типа и декларативного. Все языки описания знаний, ориентированные на использование тради­ционных компьютеров фон-неймановской архитектуры, являют­ся языками процедурного типа. Разработка языков декларатив­ного типа, удобных для представления знаний, является актуаль­ной проблемой сегодняшнего дня.

По способу приобретения знания можно разделить на факты и эвристику (правила, которые позволяют сделать выбор при отсут­ствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной пред­метной области обстоятельства. Вторая категория знаний осно­вана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.

По типу представления знания делятся на факты и правила, Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции, - это знания типа «ЕСЛИ А, ТО В».

Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффектив­ной организации процедур логического вывода.

Форма представления знаний оказывает существенное влия­ние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Однако все знания, которые привлекает человек в процессе решения сложных задач, смоделировать не­возможно. Поэтому в интеллектуальных системах требуется чет­ко разделить знания на те, которые предназначены для обработ­ки компьютером, и знания, используемые человеком. Очевидно, что для решения сложных задач БЗ должна иметь достаточно большой объем, в связи с чем неизбежно возникают проблемы управления такой базой. Поэтому при выборе модели представ­ления знаний следует учитывать такие факторы, как однород­ность представления и простота понимания. Однородность пред­ставления приводит к упрощению механизма управления знани­ями. Простота понимания важна для пользователей интеллекту­альных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации зна­ний. Следует заметить, что одновременно выполнить эти требо­вания довольно сложно, особенно в больших системах, где неиз­бежным становится структурирование и модульное представле­ние знаний.

Решение задач инженерии знаний выдвигает проблему преобразования информации, полученной от экспертов в виде фактов и правил их использования, в форму, которая может быть эффективно реализована при машинной обработке этой информации. С этой целью созданы и используются в действующих системах различные модели представления знаний.

К классическим моделям представления знаний относятся логи­ческая, продукционная, фреймовая и модель семантической сети.

Каждой модели отвечает свой язык представления знаний. Однако на практике редко удается обойтись рамками одной мо­дели при разработке ИИС за исключением самых простых случа­ев, поэтому представление знаний получается сложным. Кроме комбинированного представления с помощью различных моде­лей, обычно используются специальные средства, позволяющие отразить особенности конкретных знаний о предметной области, а также различные способы устранения и учета нечеткости и не­полноты знаний.