
Семантический веб обещает стать важнейшим этапом в эволюции Интернета. И пионеры этого направления уже вовсю делят участки: в октябре из закрытого тестирования выпорхнул сервис Twine (www.twine.com), использующий смысловой анализ для автоматической классификации документов.
Основой сервиса служат собираемые пользователями коллекции материалов, так называемые твайны. Каждый из них посвящен какой-либо теме и в простейшем случае содержит несколько ссылок на веб-страницы, но может также включать файлы офисных форматов, фотографии, музыку и видео. Особенность Twine в том, что сервис самостоятельно извлекает из текста максимум характеризующей его информации. Когда документ построен с учетом требований семантического веба, процесс индексации проходит быстрее всего. Если же семантические теги отсутствуют, в дело вступают алгоритмы анализа естественного языка. Так или иначе, в результате Twine получает не просто набор слов, а знания. К примеру, сервис осведомлен, что NASA - это название организации, Шотландия - страна, а Джордж Буш - человек.
Сервис способен автоматически предлагать документы, содержащие не только сведения на выбранную тему, но и близкие по смыслу, так что поиск интересных материалов требует лишь пары кликов. Вдобавок поверх семантического движка навешаны привычные социальные функции. Каждый твайн может быть коллективным, в этом случае другие пользователи смогут просматривать его, обсуждать и добавлять новые документы, тем самым пополняя копилку знаний системы.

В настоящий момент ресурс объединяет примерно 50 тысяч активных пользователей, силами которых создано и поддерживается 20 тысяч тематических твайнов. Это число в ближайшее время должно увеличиться многократно, ведь Twine - один из самых
