понедельник, 30 июня 2008 г.

Система Powerset пытается трактовать семантику поисковых запросов

Система Powerset пытается трактовать семантику поисковых запросов

13 мая 2008 года, 16:27 | Текст: Владимир Парамонов

Молодая американская компания Powerset открыла тестовую версию одноименного сервиса, призванного упростить поиск информации в интернете.

Скриншот Powerset

Скриншот Powerset

Главная особенность Powerset, по утверждению создателей, заключается в том, что поисковик способен воспринимать запросы на обычном разговорном языке. Система анализирует введённый пользователем текст и пытается анализировать его смысл, после чего генерирует список результатов с наиболее релевантной информацией. То есть, в идеале пользователям не придется тщательно подбирать термины и ключевые слова, а достаточно будет просто ввести в поисковой строке Powerset обычную фразу с интересующим вопросом, как если бы это было сделано при разговоре с другим человеком.

Однако на текущий момент система Powerset имеет ряд ограничений, и авторам проекта предстоит проделать огромный объем работ, чтобы реализовать все задуманное. Во-первых, Powerset пока ищет ответы на запросы только в базе данных онлайновой энциклопедии Wikipedia. Во-вторых, система воспринимает фразы исключительно на английском языке и не имеет других локализованных версий. Да и во многих случаях ответы на казалось бы элементарные вопросы не оказываются в списке первых результатов. Так, например, если спросить у поисковика "Who is the President of the United States?" (Кто президент Соединенных Штатов?), то упоминание действующего президента Джорджа Буша не попадет на первую страницу.

Стоит добавить, что в основу работы поисковика Powerset отчасти положены технологии машинного распознавания человеческого языка, разрабатывавшиеся исследовательским центром Xerox в Пало-Альто (Palo Alto Research Center, PARC). Не исключено, что в перспективе Powerset составит конкуренцию таким гигантам, как Google, Yahoo и Microsoft.

Предлагаю ознакомиться с аналогичными статьями:



Комментариев нет: