четверг, декабря 21, 2006

Всемирная помойка, или почему поиск не всегда помогает

Интернет - это всемирная помойка. Это утверждение уже давно стало общим местом. И ведь действительно - интернет заполнен спамом, огромную долю “информационного” наполнения сайтов составляет порнография. Из оставшегося - неимоверное количество различных форумов и мест общения, качество информационного наполнения которых просто неимоверно низко. Огромное количество непроверенной, неточной, неполной, неприменимой к конкретному случаю и просто ложной информации. Масса псевдонаучных, лживых и популистских ресурсов, на которых рассказывается о вечных двигателях, дармовых источниках энергии, инопланетянах, телепатии и тому подобном.

Все это - явления из реальной жизни, перекочевавшие в виртуальную и нашедшие там свой второй дом. Причем этот второй дом - существенно лучше первого. Огромная разница, благодаря которой все это стало возможным, состоит в анонимности интернета. До появления Сети, многочисленной армии шарлатанов, графоманов (коим принадлежит без сомнения и ваш покорный слуга) и прочих недостаточно компетентных личностей, противостояла армия редакторов, корректоров, рецензентов и так далее. Книга статья или заметка не может появиться, без того чобы её прочел редактор, корректор, возможно один или несколько научных консультантов. Попасть “в печать” было трудно. Многие не справлялись с этими трудностями и просто не могли проникнуть на страницы изданий и стать доступными широким массам читателей. Конечно, в этом было много плохого - можно было пользоваться всеми этими “заградотрядами” как цензурой, отсекать инакомыслящих и “не давать дороги молодым перспективным ученым”. Но было в этом и хорошее - псевдонаучные, безграмотные теории не могли пройти редакторов и консультантов. А самое главное - автор не мог остаться в тени. Уже если книга или статья выходила, и оказывалось что её научное “качество” не заслуживает никакой критики, то репутация автора очень страдала. И наоборот, хорошая работа, выполненная на высоком уровне, давала автору заслуженную славу и уважение коллег. Репутация автора - очень важная вещь. При помощи репутации автора мы выбираем книги, музыку, фильмы. Это не всегда может быть правлиьный подход, но это подход которым пользуются люди - даже современный мир шоу-бизнеса основан на репутации раскрученных звезд. Собственно “раскрутка” - это и есть способ искуственного поднятия репутации.

Наш способ первоначального “нахождения” вещей основан на репутации - мы смотрим кто автор того или иного произведения искусства, теории или гипотезы и на основании личности автора часто делаем вывод, заслуживает ли его создание дальнейшего рассмотрения. Мы идем на “Дениса Мацуева”, а не на Ивана Иванова, если мы ничего не знаем про Иванова. Мы выбираем учебник “Фихтенгольца”, потому что у него заслуженная репутация.

Анонимность - это вещь препятствующая репутации. Как можно выбрать между двумя учебниками, если неизвестно кто написал их - студент второго курса или маститый ученый? Как можно решить пойти ли смотреть фильм Иванова или Петрова, если мы ничего не знаем ни про Иванова, ни про Петрова? Только одним способом - посмотреть оба фильма, выбрать лучший и в следующий раз у вас уже будет знание… А что если фильм не подписан? Очень трудно сделать осознанный выбор, имея только анонимные данные.

С другой стороны, для некомпетентного автора, анонимность - лучший подарок. Можно совершенно не опасаться последствий.

Мне кажется что именно из-за того, что Интернет-технологии не предлагают никаких простых механизмов для обеспечения авторства и получается это самое наполнение Сети мусором.
Необходимо разрабатывать системы, обеспечивающие наличие и обеспечение авторства, тогда и поиск будет работать как надо.

( Между прочим такие системы вроде бы уже есть и разрабатываются, но конечно до массового применения им пока далеко. Проект пионера гипертекста Теда Нельсона Xanadu включал в себя обязательный copyright, то есть по сути систему гарантирующую авторство. Надо признать, что это очень интересный (особенно учитывая тот факт что он зародился ещё в 60-е годы), но совершенно провальный проект. )

Заметим, что поиск информации - это тот же выбор. Системы поиска, ранжирующие результаты по количеству внешних ссылок, по сути пользуются вторичным индексом. Человек, как мне кажется, ищет пользуясь репутационными критериями. А уже в результате этих репутационных критериев возникает желание сослаться натого или иного автора. Но не наоборот! Я включу книгу Страуструпа в свою библиографию не потому что его книгу уже включили другие, а потому что его репутация в моих глазах достаточно высока!

Поиск должен быть репутационным, документы следует ранжировать не по ссылочной популярности, а по репутационной, то есть по степени уважаемости автора данной страницы. Для этого конечно необходима соответствующая техническая поддержка авторства, которая обеспечивала бы необходимую и неизменяемую технологию подписи и соответствия подписи реальному человеку или компании. Тогда, неподписанные, анонимные статьи попадали бы на более низкие места в поисковых запросах, и может быть стали бы исчезать.

1 комментарий:

Анонимный комментирует...

Да, всё верно написано про "помойку" - бывает очень нелегко найти нужную информацию.