В разговорах и публикациях о завтрашнем дне Интернета все чаще мелькают слова «семантическая паутина» (Semantic Web). Недавно Facebook представил инструмент социального поиска (Graph Search), основанный на семантических технологиях. Что это — очередная «нанотехнология» или действительно некий технологический прорыв, который ощутимо изменит принципы нашей работы со всемирной сетью?
И термин «семантическая паутина», и сами принципы, которые под ним скрываются, придуманы группой разработчиков во главе с Тимом Бернерс-Ли, одним из авторов современного, привычного нам, Интернета. Суть состоит в следующем. Основное содержимое Интернета сегодня — это текст. Механизм поиска информации в Интернете — это тоже, по сути, поиск текста. Когда мы делаем запрос «купить смартфон дешево», поисковик всего лишь находит страницы, в которых есть все эти слова. Да еще и ранжирует результаты по алгоритму, который никому в точности неизвестен. Таким образом, мы не можем иметь уверенности в том, что поисковик действительно подскажет нам, где подешевле купить смартфон; скорее, он покажет нам те предложения, авторы которых вложили больше денег и усилий в продвижение своего сайта.
Семантические технологии должны изменить принцип хранения данных в Интернете. Вместо конгломерата страниц веб-сайты и сервисы должны стать хранилищами структурированной информации. Поисковые машины смогут «понимать смысл» (семантику) этой информации, и позволят людям делать осмысленные запросы к ней. Потренироваться в использовании таких технологий можно уже сегодня: на схожих принципах основан Яндекс.Маркет и другие сервисы Яндекса (работа, недвижимость, авто). Если мы хотим купить смартфон, мы можем выбрать платформу, указать ценовой диапазон, задать множество других параметров. Полученный результат будет логически вычисленным, и пользователь получит действительно лучшие предложения, отвечающие точно заданным критериям поиска. Среди других примеров использования семантических технологий — проект DBpedia (содержимое wikipedia, переведенное в семантическую форму), и уже упомянутый «социальный поиск» Facebook. С его помощью мы сможем найти все кафе, которые понравились нашим родственникам, или всех выпускников УрФУ, живущих в Сыктывкаре. Ни один инструмент, не использующий семантических технологий, не сможет справиться с такими поисковыми запросами.
Сфера применения семантических технологий выходит далеко за пределы общедоступных интернет-сервисов. Еще одна интересная область их использования — интеграция информационных систем. Часто предприятия тратят на организацию обмена данными между различными программами больше денег, чем вложили в их внедрение. Семантические технологии полностью меняют подход к интеграции, делая ее намного легче и надежнее, чем мы привыкли. Несогласованность различных информационных баз доставляет множество неудобств и гражданам, обращающимся за услугами муниципальных и государственных учреждений, и компаниям, которые вынуждены бороться с несогласованностью данных в CRM, ERP и других информационных системах. Разработкой средств решения подобных проблем занимается, в том числе, уральская компания
«Бизнес Семантика». Сегодня эта сфера — «передний край» информационных технологий, та область, где можно добиться революционных практических результатов инновационной деятельности.
Технический директор центра информационных технологий «Index.art»
Сергей Горшков