УДК 618.518

 

ПРОБЛЕМЫ ИЗВЛЕЧЕНИЯ ЗНАНИЙ И ПОДХОДЫ К ИХ РЕШЕНИЮ

 

(sazonova.rar)

 

Ó 2006 г. Сазонова К. В.

 

В статье рассмотрены проблемы извлечения экспертной информации. Одним из возможных путей решения указанных проблем является установление соответствия между методами извлечения знаний и классами задач предметной области. Приводятся примерные правила обоснованного выбора указанных методов при извлечении знаний о технологии решения задач управления.

 

 

В результате анализа существующих методических и инструментальных средств извлечения и обработки знаний и поддержки деятельности инженера по знаниям можно выделить две группы проблем, характерных для существующих систем извлечения и обработки знаний – методологические и технологические проблемы [1].

Технологические проблемы являются естественным следствием методологических и порождены ими. Одной из технологических проблем является отсутствие классификаций и рекомендаций по выбору подходящего метода извлечения знаний.

Решение данной проблемы возможно в результате установления соответствия между методами извлечения знаний и классами задач предметной области, информацию (знания) о решении которых необходимо извлекать. В данном случае имеются в виду классы задач предметной области, соответствующие этапам процесса управления (рис. 1) [2].

 

Рис.1. Этапы, характерные для любого процесса управления

 

Существующие методы извлечения знаний в соответствии с их источником принято разделять на две группы: коммуникативные и  текстологические методы [1].

В свою очередь каждая из указанных групп также может быть разбита на несколько подгрупп, при этом коммуникативные методы разбиваются в соответствии с непосредственным источником знаний – экспертом, а текстологические – в соответствии с видами документов.

Применение рассматриваемых методов позволяет извлечь из экспертов или из различных документов знания о порядке решения задач конкретной предметной области. Извлекаемые знания по своей сущности должны содержать сведения о том, как решать конкретную задачу – непосредственно технологию ее решения, какие функции реализуются при этом и какие виды и типы информации используются для решения рассматриваемой задачи.      

Исходя из этого, для обеспечения обоснованного выбора подходящего метода (группы методов) извлечения знаний указанные задачи внутри каждого класса следует классифицировать по ряду признаков (аспектов):

функциональный признак – реализуемые функции в объекте (системе);

технологический признак – технология решения задачи на объекте (в системе);

информационный признак – используемые при этом типы и виды информации.

Таким образом, соответствие между указанными методами излечения знаний и классами решаемых задач может быть уставлено согласно указанных признаков и представлено в виде отображения группы методов извлечения информации о технологии решения рассматриваемых задач предметной области на их классы (рис. 2).

С целью формализованного представления данных соответствий был использован математический аппарат теоретико-множественного подхода. В частности перечни рассматриваемых задач предметной области, а также методов извлечения экспертной информации о технологии их решения были представлены в виде конечных, но расширяемых множеств.

С целью упорядочения элементов указанных множеств, а также обеспечения удобства доступа к ним при их выборке и обработке над элементами данных множеств заданы отношения порядка и доминирования.

 

 

Рис. 2. Связь между методами извлечения знаний и классами задач

 

Множества классов задач управления представлены в табл. 1, используемые методы извлечения экспертной информации – в табл. 2.

 

Таблица 1

 

Классы задач

Наименование класса задач

Список задач

Класс задач {Z1}

сбора, обработки, обобщения

информации об обстановке, поступающей от различных источников

Z11 – задача сбора, обработки, обобщения информации о характере действий исследуемого объекта

Z12 – задача сбора, обработки, обобщения информации об обстановке

Класс задач {Z2}

оценки обстановки

Z21 – задача оценки исследуемого объекта

Z22 – задача оценки времени

Z23 – задача оценки района

Класс задач {Z3}

выработки и принятия решений

Z31 – задача выработки альтернатив 

Z32 – задача определения критериев (правил) для последующего выбора альтернатив

Z33 – задача выбора альтернатив

Класс задач {Z4}

постановки задач исполнителям

Z41 – постановка задач исполнителям на выполнение ими необходимых действий

Класс задач {Z5}

контроля исполнения решения

Z51 – задача контроля исполнения решения поставленной задачи 

 

Таблица 2

 

Множества методов извлечения и обработки экспертной информации

№ п/п

Множество методов извлечения

экспертной информации {МИk},

1.

Метод анкетирования МИ1

2.

Метод интервью МИ2

3.

Метод диалога МИ3

4.

Метод “мозгового штурма” МИ4

5.

Метод круглого стола МИ5

6.

Метод наблюдения МИ6

7.

Метод протокола “мыслей вслух” МИ7

8.

Метод лекций МИ8

9.

Метод ролевых игр МИ9

10.

Метод экспертных игр МИ10

11.

Метод анализа специальной литературы МИ11

12.

Метод анализа учебников МИ12

13.

Метод анализа статей МИ13

14.

Метод анализа документов МИ14

 

Структурно указанное соответствие представлено на рис. 3 на примере двух классов задач  – сбора, обработки и обобщения информации и оценки обстановки. Аналогично можно выделить соответствие между задачами других классов и существующими методами извлечения знаний об их решении.

 С целью установления соответствия между методами извлечения знаний и, например, решаемой задачей сбора, обработки и обобщения информации об объекте (системе) был проведен опрос десяти экспертов по шкале веса важности каждого метода от 0 до 10 баллов применительно к пяти значениям термов лингвистической переменной “Соответствие метода извлечения знаний и класса решаемых задач” = {“не подходит”, “мало подходит”, “подходит”, “хорошо подходит”, “отлично подходит”}. 

 

 

Рис. 3. Соответствие между задачами и существующими методами извлечения знаний об их решении

 

Результаты экспертного опроса о применимости метода наблюдения к извлечению знаний о решении указанной задачи представлены в табл. 3.

Из анализа табл. 3 видно, что опрашиваемые эксперты считают, что метод наблюдения “хорошо подходит” для извлечения знаний о решении задачи сбора, обработки и обобщения информации.

Аналогично можно провести опрос о применимости других методов для извлечения знаний о порядке решения рассматриваемой задачи, а также и других задач управления.

Таблица 3

 

Результаты опроса десяти экспертов

 

Терм

Значение

эксперт 1

эксперт 2

эксперт 3

эксперт 4

эксперт 5

эксперт 6

эксперт 7

эксперт 8

эксперт 9

эксперт 10

не

подходит

1

2

1

3

2

1

3

1

2

1

мало

подходит

3

4

4

5

5

5

4

3

4

5

подходит

5

6

7

6

7

7

6

5

6

7

хорошо подходит

7

8

9

7

8

9

8

7

8

8

отлично подходит

6

6

8

6

6

8

7

7

7

6

 

В результате на основе полученных данных была построена логико-лингвистическая шкала (ЛЛШ) соответствия между методами излечения знаний и классами решаемых задач, показанная на рис. 4, в полной мере соответствующая классическому виду ее представления.

Для построения ЛЛШ был использован метод статистической оценки функции принадлежности, реализованный средствами математического пакета Mathcad 13 [3].

 

Рис. 4. Логико-лингвистическая шкала соответствия между методами

излечения знаний и классами решаемых задач

 

Наличие такого соответствия в распоряжении инженера по знаниям способствует повышению эффективности реализации процесса извлечения экспертной информации в целом, т. к. при этом упрощается выбор метода или методов, с помощью которого можно извлекать знания о решении конкретной задачи с наименьшими потерями знаний и временными затратами.

В принципе, данный подход может быть реализован при извлечении экспертной информации о порядке решения задач в составе любого классического процесса управления, включающего 6 этапов, показанных выше.

Т.к. всего существующих методов извлечения знаний 11, а классов задач управления 6, то может быть построено 66 аналогичных ЛЛШ (рис. 4) на основе результатов экспертных опросов.

Учитывая неопределенный (нечеткий) характер выделенных связей, характеризующих соответствие классов задач и самих задач предметной области методам извлечения знаний об их решении, для формализованного представления указанных соответствий предполагается использовать математический аппарат нечетких множеств и нечеткий ситуационный логический вывод.

 Ниже приводится пример формализованного описания в общем виде указанных соответствий и решения задачи выбора подходящего метода извлечения знаний о конкретной задачи на основе нечетких продукционных правил типа “если-то-…” [4].

 

П1: если х есть Z1, то (у есть M1 и у есть M2 и у есть M3 и у есть M4);

П2: если х есть Z2, то (у есть M2 и у есть M3 и у есть M4),

 

где х – входная переменная;

у – переменная вывода;

Z1 – задача сбора, обработки и обобщения информации об объекте (системе);

Z2 – задача оценки обстановки;

М1 – метод наблюдения;

М2 – метод анкетирования;

М3 – метод интервью;

М4 – метод анализа документов;

Т.е., для извлечения знаний о порядке решения задач управления класса сбора, обработки и обобщения информации (Z1) следует использовать следующие методы извлечения экспертной информации: метод наблюдения (М1), метод анкетирования (М2) и т.д. А для извлечения знаний о порядке решения задач управления класса оценки обстановки следует использовать методы – анкетирования (М2), интервью (М3) и анализа документов (М4). 

Таким образом, далее представлены общие правила выбора методов извлечения экспертной информации применительно к рассматриваемым задачам предметной области.

Для выбора методов извлечения экспертной информации о решении конкретной задачи предметной области  правила должны иметь вид [4]:

ПИЗ: если х1 есть Zn, то у1 есть МИ = {MИk}, n = 1, …, N,           

где х1 – входная переменная (наименование задачи);

у1 – переменная вывода (перечень методов извлечения знаний);

Zn – задача предметной области;

МИ  – множество методов извлечения экспертной информации, отобранных по условию предпочтения и со значением уровня соответствия большем или равным 0.5, т. е. результирующая оценка .

         

Использование таких правил в практике работы инженера по знаниям, позволит уже на этапе идентификации задачи сразу определить, какой метод или группу методов извлечения знаний о ее решении нужно использовать.

В соответствии с изложенным, установление соответствия между методами извлечения знаний и классами решаемых задач является одним из подходов к решению технологической проблемы извлечения и обработки экспертной информации.

Таким образом, установленное соответствие упрощает выбор метода или группы методов, с помощью которого можно извлекать знания о решении конкретной задачи предметной области, а также данное соответствие можно формализовано описать с помощью нечетких продукционных правил.

 

Литература

 

1. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. СПб., Питер, 2001.

2. Коршунов Ю. М. Математические основы кибернетики: Учеб. пособие для вузов. 2-е изд., перераб. и доп. М., Энергия, 1980.

3. Борисов А. Н., Крумберг О. А., Федоров И. П. Принятие решений на основе нечетких моделей: Примеры использования. Рига, Зинатне, 1990.

4. Круглов В. В., Борисов В. В. Искусственные нейронные сети. Теория и практика. М., Горячая линия – Телеком, 2001.

 

 

 

THE PROBLEMS OF KNOWLEDGE EXTRACTION AND

APPROACHES TO THEIR DECISION

 

Sazonova K. V.

 

This article consider problems of expert information extraction. One of the possible ways of specified problem  decision is establishment of conformity between  extraction methods of knowledge and classes of subject area  tasks. The rules of knowledge extraction methods choice and technology of management tasks decision are considered .

 

Лаборатория специального математического и программного обеспечения (СМПО)

Научно-исследовательский центр (НИЦ) ВА В ПВО ВС РФ

Поступила в редакция 15.09.2006.