Web 2.0 умер! Да здравствует 3.0?

 | 17.56

А началось все семь лет назад, в мае 2001 года, когда изобретатель Интернета сэр Тимоти Бернерс-Ли (см. hi-Tech PRO 12/2007) указал новое направление развития Всемирной сети, которое получило название «Семантическая паутина». Следующее воплощение Интернета должно затронуть все существующие веб-ресурсы и эволюционно объединить традиционные интернет-сайты и проекты Веб 2.0 в единую базу знаний с принципиально новым подходом к организации информации. Ресурсы, отвечающие критериям Семантической паутины, и соответствующие сервисы уже успели окрестить термином «Веб 3.0» (ru.wikipedia.org/wiki/Семантическая_паутина).

Объектное мышление

По сути, Семантическая паутина — это лишь надстройка над существующей Всемирной сетью, максимально облегчающая обработку информации поисковиками. Если раньше поисковые машины основное внимание уделяли глубине и способам анализа текстовых данных, то в Семантическом Интернете на сцену выходят информационные объекты и соответствующие им мета-, иначе говоря вспомогательные, данные. Например, информационный объект Киев обладает набором метахарактеристик, которые предоставляют данные о его географическом расположении, численности населения и т. д.
Всемирная сеть третьего поколения (как и традиционный Интернет) будет построена на использовании универсальных идентификаторов ресурсов — веб-ссылок URI. Но адресуемыми объектами станут не только физические документы (веб-страницы, изображения, звукозаписи и т. д.), но и абстрактные понятия, недоступные для скачивания. Так называемые семантические ссылки будут адресовать нас на определенные географические объекты, отдельные личности, разделы науки, общественные организации…

Хранилище знаний

Проекты Веб 2.0 отличались от традиционных интернет-ресурсов способом генерирования информации: пользователь стал играть ведущую роль в создании контента, заняв место администратора. Основное же отличие Веб 3.0 в том, что контент трансформируется в вид, в котором компьютеры смогут понимать его, а не только обрабатывать. А понимать информацию означает понимать пользователей.

Упростить взаимопонимание человека и машины предлагается не с помощью традиционного инструмента разметки текста HTML, который исчерпал свои возможности по организации контента, а с помощью языков описания метаданных: расширяемого языка разметки XML, модели описания ресурсов RDF и языка веб-онтологий OWL.

Не стоит удивляться столь большому количеству инструментов структурирования информации. Одно дело заявить о необходимости создания перекрестных семантических ссылок, а другое — реализовать это на практике. Чтобы сослаться на абстрактный объект, его нужно выделить из информационного массива. Причем выделить однозначно и при этом не забыть о том, что один и тот же объект может принадлежать к нескольким понятиям.

Скажем, понятие «двухместный номер в трехзвездочной гостинице на берегу Красного моря» принадлежит к понятиям «Египет», «туризм», «отдых вдвоем», «море», «романтическое путешествие», «бюджетный отель» и т. д. Соответственно конкретное предложение об отдыхе в этой гостинице может быть выдано поисковиком при запросе: «Где лучше отдохнуть вдвоем этим летом так, чтобы забыть обо всем на свете, но не очень дорого?».
Как поисковик сможет интерпретировать столь неоднозначный запрос, ведь наличие ссылок на абстрактные понятия не означает способность понимать человеческую речь? Сделать это предлагается путем использования новейшего метода представления знаний, который кроме Семантической паутины применяется в проектировании искусственного интеллекта. Речь идет об онтологях.

Бытие определяет сознание

С помощью онтологий информация интернет-ресурсов третьего поколения будет структурирована в многомерную иерархическую схему, содержащую все существующие абстрактные понятия с указанием связей между ними. Причем эти связи будут однозначно толковаться поисковиками. Благодаря онтологиям поисковая машина поймет, что «хорошая гостиница» лучше, чем «неплохой отель», а «забыть обо всем на свете» можно в «романтическом путешествии». При этом на веб-странице с рекламой упомянутого двухместного номера может не быть ни одного приведенного словосочетания.

Вообще онтология — это раздел философии, который изучает основополагающие проблемы бытия. В XVII веке человечество выделило онтологию в отдельную науку и попыталось структурировать различные способы оценки реальности: с точки зрения материального и духовного мира, социальных и личностных взаимоотношений… В XX веке акцент этой науки сместился на изучение сознания. Философская онтология представляет собой попытку описания дискретной реальности как единой целостной системы.
Применительно к Семантической паутине онтология является инструментом, который систематизирует все знания человечества в единую структурную схему.

Структура метаданных

К веб-ресурсам третьего поколения будут предъявляться достаточно серьезные требования. Сами документы станут создаваться на основе расширяемого языка разметки XML, причем все веб-страницы должны соответствовать стандартной XML-схеме. Таким образом, будет создана база данных в едином формате. С помощью языка RDF будут задаваться медатанные всех информационных объектов, которые тоже должны соответствовать стандартной схеме. Отношения и связи между объектами предлагается строить с помощью языка OWL. Именно благодаря использованию языка OWL Паутина из базы данных превратится в базу знаний и станет обладать признаками интеллекта, то есть сможет самостоятельно давать ответы на неформализованные запросы.

В итоге возможен результат, когда стандарт сайтов третьего поколения не только объединит традиционные интернет-сервисы и проекты Веб 2.0, но и спровоцирует революцию в представлении данных, подключив к Семантической паутине рабочие станции и наделив интеллектом обычные офисные приложения.


Глоссарий

База знаний — раздел искусственного интеллекта, представляющий собой базу данных, снабженных метаинформацией с описанием взаимоотношений и связей между данными.

Онтология — попытка всеобъемлющей и детальной

формализации реальности.

Семантика — система толкования информационных

языковых конструкций.

Синтаксис — набор правил построения информационных конструкций с помощью языка.

Robo User
Web-droid editor

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *