Подтверждением известной мысли выдающегося ученого Михаила Ломоносова о том,
что "может собственных Платонов и быстрых разумом Невтонов
российская земля рождать", может служить одна из последних
разработок студентов и аспирантов Московского
государственного университета имени Михаила Ломоносова.
Речь идет об интеллектуальной поисковой системе Nigma.ru,
официально запущенной в статусе альфа-версии (то есть самой
ранней). Несмотря на то, что работы над поисковой
системой научный коллектив продолжал меньше трех месяцев,
уже разработаны оригинальные алгоритмы ранжирования результатов,
полученных от набора поисковых систем, с поддержкой русской
морфологии, и двухуровневая кластеризация.
В чем же суть этого изобретения и его практическая значимость?
По мнению специалистов, оно может облегчить работу
в Интернете. Дело в том, что на подавляющее большинство поисковых
запросов Nigma.ru выдает на порядок больше найденных сайтов, чем,
например, при простом поиске на сайте Google.ru. Для того чтобы
пользователь не запутался в этих результатах, они группируются в
так называемые "кластеры". Каждый кластер - это группа сайтов,
относящихся, по разумению поисковой системы, к общей тематике.
Научная группа, состоящая из студентов и аспирантов,
решила использовать частотную кластеризацию по ключевым словам,
поэтому названия кластеров - это тоже ключевые слова, которые
пользователь может применять для расширения своего запроса.
В свою очередь, поскольку количество найденных кластеров
также зачастую очень велико, интеллектуальный алгоритм объединяет
кластеры в иерархию (пока - двухуровневую), которая позволяет
представить их в более компактном виде. Например, введя очень
общий запрос "новости", на который поисковая система Nigma.ru
выдает порядка полумиллиарда документов, в левой колонке
пользователь видит самые популярные темы новостей, которые
встречаются в Интернете. Нажав на тему (например, "спорт"), он
получает примеры новостных ресурсов, которые освещают эту
тему. Если он захочет получить больше ресурсов о новостях
спорта, нужно нажать на "Расширить запрос" - тогда система выдаст
более двух миллионов ссылок о новостях спорта. Они, в свою очередь,
тоже отклассифицированы по темам - есть футбол, хоккей и т.п.
Как сообщают сами же исследователи при помощи сети Интернет,
работа их научной группы в части кластеризующих алгоритмов находится
в начальной стадии, и ее участники планируют продолжать ее
совершенствование. В ближайшее время поисковая система будет
расширена экспертными системами, психологическими тестами и
другими методами, базирующимися на алгоритмах искусственного
интеллекта.
Добавим, что проект системы Nigma.ru сформировался из
благотворительного проекта Виктора Лавренко, который в течение
нескольких лет спонсировал научные исследования студентов МГУ в
области искусственного интеллекта. С этого года он является
соискателем на степень кандидата физико-математических наук,
занимается научной работой на факультете ВМиК МГУ имени
М.В.Ломоносова, являясь руководителем проекта Nigma.ru.
Несомненно, подобные разработки в их окончательном виде
найдут своих поклонников, ведь они чрезвычайно актуальны.
Автор: Любовь Колоколова