топ-100 русскоязычных блогов
Кажется, что только я один пока не написал про этот новый рейтинг. В двух словах суть его в том, что из Technorati берутся данные о ссылках на тот или иной блог и на основании их строится рейтинг, где на первом месте оказывается самый авторитетный (популярный?) блог, на который больше всего ссылаются.
Идея хороша с первого взгляда, но вот по мере роста количества блогов, мы получим ситуацию, когда функцию фильтрации и нахождения новых и интересных блогов этот сервис станет выполнять просто никак. Блогов будет слишком много, а на первых местах будут те, которые и так всем известны.
В этой связи идея автора сервиса о категоризации блогов видится вполне здравой и рабочей. Т. е. при условии категоризации вполне может получитсья, что будут находиться новые и интересные блоги. Вот только как эта категоризация будет осуществляться?
Сверху? Как планиурется сейчас? Такой способ с малым количеством категорий и однозначностью классификации показал себя неэффективным уже неоднократно. Введение же множетсва категорий и поликатегориальность блогов потребует существенной работы со стороны автора.
Снизу? Фолксономией? Владельцы блогов конечно прокатегоризируют каждый свой, а дальше? Зачем мне категоризировать какой-нибудь экслер.ру или дерти.ру? Как лично мне в дальнейшем поможет эта моя категоризация?
Кроме того, в условиях, когда блог - это прежде всего авторский проект, т. е. проекция личности, многогранной личности, категоризировать его однозначно - это значит, что однозначно причислить человека к тому или иному разряду, что есть неправильно.
Какой тут выход может быть? А скорее всего никакого вменяемого выхода не получится.
Хорошо бы конечно, чтобы можно было проанализировать категории каждого блога. Ведь сам автор категоризирует каждую свою запись, а в рамках общей их совокупности категоризирует весь контент блога. Вот у меня, в правой колонке, в облаке тагов соврешенно однозначно выделяются отдельные позиции, а значит можно с большой уверенностью сказать, чо этот блог про то-то и про то-то. Так же и у других блогов - записи по тем или иным категориям преобладают, а значит преимущественно блог посвящен именно этим вопросам. Ну а после анализа всех категорий и их удельного веса можно было бы ввести шаклу детализации отнесения блога к той или иной категории. Т. е. брать например либо самую популярную категорию и соответственно относить блог к ней одной, либо брать “эн” самых популярных категорий и заносить блог сразу в несколько этих категорий.
Но тут конечно опять же встает существенная и неустранимая пока что проблема - проблема лингвистическая. Категории “дизайн”, “design” и “диз” могут в разных блогах обозначать одно и то же. Но вот для машины они будут разными сущностями и значит програмно склеить их в одну не получится, а значит вся моя идея с автокатегоризацией всей совокупности блогов на основе имманентных для отдельно взятого блога категорий летит к чертям. Хотя на бумаге она, признаюсь, выглядит лично для меня очень аппетитно!
