Интеллектуальные информационные системы

Версия от 08:53, 14 декабря 2021; Коняева Анастасия (Vita Vitte) (обсуждение | вклад)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

База знаний

Материалы статьи предоставлены Сергеем Исаевым

Как работать на уровне знаний, а не данных

Сергей Исаев показал участникам конференции будущее информационных систем и обозначил их отличительную особенность: работа на уровне знаний, а не данных. На сегодняшний день существуют информационно-справочные системы, и их главное функциональное назначение — это возможность поиска информации в данных.

Сергей показал различия понятий «данные» и «информация»: «Что такое данные? Это когда у нас что-то есть и мы с этим ничего не можем сделать. А чем информация отличается от данных? Это когда мы в конкретный момент времени можем получить то, что хотим. И данные превращаются в информацию. Главное назначение информационных систем в том, что мы к ним обращаемся, что-то спрашиваем у них, а они нам что-то отвечают. Там есть системы фильтров, поиск по содержимому текста или какие-то комбинации фильтров. И главная концептуальная проблема всех информационных систем состоит в том, что системы не могут по-настоящему понимать смысл того, что мы у них спрашиваем. Системе все равно, что нолик, что единичка, что «а», что «б». Мы задаем конкретный вопрос, мы ее обучили отвечать ровно на этот вопрос, и она нам отвечает. Если мы спрашиваем что-то не то, она нам ничего не отвечает. Она отвечает только то, что заранее запрограммировано».

Это относится сейчас ко всем поисковым системам: и к Яндексу, и к Гуглу. Если у них спрашивать что-то, они в ответ выдают только такие результаты поиска, где есть прямое совпадение того или иного. Есть другой класс таких систем, это IBM Watson и Wolfram Alpha. Их можно назвать частично интеллектуальными: если им задать вопрос, они понимают смысл этого вопроса и отвечают на то, что в этот вопрос заложено. Например, «кто на свете всех милее, и румяней, и белее?». Эти системы не будут искать все совпадения, где есть данная фраза, а, может быть, скажут, что это Анжелина Джоли. Здесь происходит переход к новому классу интеллектуальных систем. Чем они отличаются? Тем, что система может понимать смысл запроса в понятиях человека. Допустим, если у системы спросить, какая будет налоговая ставка, если стать резидентом «Сколково», то она не будет искать все совпадения, она выдаст конкретное число, потому что поймет семантику этого вопроса, его смысл. И главное отличие работы этих систем: они будут работать на уровне знаний, а не на уровне данных.

Если у системы спросить, какая будет налоговая ставка, если стать резидентом «Сколково», то она не будет искать все совпадения, она выдаст конкретное число, потому что поймет семантику этого вопроса, его смысл.

Чем знания отличаются от данных? Если взять шариковую ручку, то это данные. Без какого-то контекста это неинтересно и с этим ничего нельзя сделать. А вот если сказать, что ручкой можно писать, это минимальная единица знаний. И именно эти знания, как минимальная единица, будут храниться в базе данных. Ручкой можно писать. Ручка красного цвета. Ручка пластмассовая. Эти три единицы знаний будут храниться в базе данных, и этими понятиями будет оперировать информационная система. Как хранить эти знания? Есть объект, субъект и предикат. Можно написать: «Исайя — друг Эрика», или: «Ручка красного цвета», или: «Я директор такой-то компании». И если хранить много таких знаний, то получится некий граф знаний. И если, например, спросить, как Элис связана с Да Винчи, система поймет, что у Элис есть друг Боб, Боб интересуется картиной Мона Лиза, Мону Лизу нарисовал Да Винчи. Система поймет связь между Элис и Леонардо Да Винчи. Пример хранения информационной системы, основанной на знаниях, — это то, как в федеральной налоговой службе хранится информация про компанию. Есть компания, у компании есть учредители, у учредителей есть имена, и есть еще генеральный директор. Именно таково представление базы данных нового типа информационных систем. Чем это интересно? Тем, что система становится логической. В систему можно задавать логические вопросы.

Пример хранения информационной системы, основанной на знаниях, — это то, как в федеральной налоговой службе хранится информация про компанию.

Сергей привел простые примеры: «Как это сейчас происходит? Вы задаете вопрос системе, она отвечает, и ни вправо, ни влево нельзя. Система сломается. А в новых типах систем появляются вычисляемые связи. Что это такое? Например, я отец, у меня есть сын Иван, второй сын Петр. На самом деле система сама вычислила, что Иван и Петр братья. Я заранее эту информацию в систему не закладывал, но она сама ее вычислила, потому что в систему заложена модель семьи. Или я отец Сергей, у меня есть дочка София, но это же автоматически означает, что у Софии есть отец, это я».

Такая работа системы позволяет задавать открытые вопросы и вопросы, на которые изначально не подразумевается ответ. Сергей привел пример изображения связей между всеми юридическими лицами «Мегафона» на основе данных ФНС. Есть компания «Мегафон», у нее есть учредители, владельцы, филиалы, адреса и большой граф знаний, по которому можно ходить и задавать системе разные вопросы. Например: «Сколько филиалов у компании Мегафон?» Или вопрос другого типа: «Покажи мне все компании, которые занимаются деревообработкой в Ленинградской области, в совете директоров которых есть Елена, на которую ни разу не подавали в суд». Это совершенно релевантный вопрос в новый класс систем.

Появляется новый класс информационных систем, основанный на системах искусственного интеллекта не на машинном обучении, а на основе инженерии знаний. Этим системам можно будет задавать открытые вопросы, и они будут на них отвечать, потому что в них заранее заложена какая-то модель мира, какой-то контекст вокруг данных. И они будут понимать смысл того, что вы спрашиваете, не просто нолик-один, «а» или «б», а смысл в человеческих понятиях.

Источники