топ-100 русскоязычных блогов
Кажется, что только я один пока не написал про этот новый рейтинг. В двух словах суть его в том, что из Technorati берутся данные о ссылках на тот или иной блог и на основании их строится рейтинг, где на первом месте оказывается самый авторитетный (популярный?) блог, на который больше всего ссылаются.
Идея хороша с первого взгляда, но вот по мере роста количества блогов, мы получим ситуацию, когда функцию фильтрации и нахождения новых и интересных блогов этот сервис станет выполнять просто никак. Блогов будет слишком много, а на первых местах будут те, которые и так всем известны.
В этой связи идея автора сервиса о категоризации блогов видится вполне здравой и рабочей. Т. е. при условии категоризации вполне может получитсья, что будут находиться новые и интересные блоги. Вот только как эта категоризация будет осуществляться?
Сверху? Как планиурется сейчас? Такой способ с малым количеством категорий и однозначностью классификации показал себя неэффективным уже неоднократно. Введение же множетсва категорий и поликатегориальность блогов потребует существенной работы со стороны автора.
Снизу? Фолксономией? Владельцы блогов конечно прокатегоризируют каждый свой, а дальше? Зачем мне категоризировать какой-нибудь экслер.ру или дерти.ру? Как лично мне в дальнейшем поможет эта моя категоризация?
Кроме того, в условиях, когда блог - это прежде всего авторский проект, т. е. проекция личности, многогранной личности, категоризировать его однозначно - это значит, что однозначно причислить человека к тому или иному разряду, что есть неправильно.
Какой тут выход может быть? А скорее всего никакого вменяемого выхода не получится.
Хорошо бы конечно, чтобы можно было проанализировать категории каждого блога. Ведь сам автор категоризирует каждую свою запись, а в рамках общей их совокупности категоризирует весь контент блога. Вот у меня, в правой колонке, в облаке тагов соврешенно однозначно выделяются отдельные позиции, а значит можно с большой уверенностью сказать, чо этот блог про то-то и про то-то. Так же и у других блогов - записи по тем или иным категориям преобладают, а значит преимущественно блог посвящен именно этим вопросам. Ну а после анализа всех категорий и их удельного веса можно было бы ввести шаклу детализации отнесения блога к той или иной категории. Т. е. брать например либо самую популярную категорию и соответственно относить блог к ней одной, либо брать “эн” самых популярных категорий и заносить блог сразу в несколько этих категорий.
Но тут конечно опять же встает существенная и неустранимая пока что проблема - проблема лингвистическая. Категории “дизайн”, “design” и “диз” могут в разных блогах обозначать одно и то же. Но вот для машины они будут разными сущностями и значит програмно склеить их в одну не получится, а значит вся моя идея с автокатегоризацией всей совокупности блогов на основе имманентных для отдельно взятого блога категорий летит к чертям. Хотя на бумаге она, признаюсь, выглядит лично для меня очень аппетитно!

11 Comments
injun #576871
Гм… честно сказать, я скептически отношусь к таким рейтингам, в основном, по умопянутым вами причинам - все известные блоги всегда будут лидерами… а составлять список (рейтинг?) ради простого перечисления всем_известным блогов не имеет смысла…
Что касается категорий - это идея интересная…но не спасительная…
Ну это мое ИМХО конечно….
cactusinside
Я вообще не понимаю сути всей этой шумихи кроме как народу не про что больше писать. Еще и технократи выбрали для подсчета статистики, пол года назад там вообще не найти было русских записей, но они же были.
cactusinside
А там рейтинг оценвается за все время существования или за прошлую неделю/месяц/…? Второй вариант как раз бы помогал неизвесным блогам выходить наверх засчет хороших записей.
alex-and-r
Фигта! Там просто берется общее количество ссылок на блог за все время. Т. е. чем старее и популярнее блог, тем соответственно на него боьше ссылок. Так что опер, дерти, экслер и т. д. будут всех давить почерному…
Денис
а вот постите линки на блоги здесь: Linkstore
Там просто голоса за 3 дня.
а общее количество ссылок конечно же ничего не даст.
То есть старые и всем известные всегда так и будут наверху
cactusinside
кстати, при необходимости можно накрутить эти ссылки и вылезти вверх
c0nst
Наилучшие каталоги - те, которые модерируются вручную. Но процесс можно частично автоматизировать.
Идея с занесением блога в различные категории очень даже неплохая. Можно рейтинг технорати умножать на некий коефициент (0
c0nst
Извините, продолжу:
коэф. меньше единицы, но больше нуля.
Коэфициентом может быть например процентное соотношение статей по заданной тематике к общему кол-ву постов на блоге. Но разделять статьи по категориям опять же должны люди, а не компьютеры.
alex-and-r
2 c0nst
Вот-вот, как раз про это я и говорил, когда предлагал взять таги и количество постов по каждому из них. Ведь облако тагов у меня в правой колонке как раз и получается взвешиванием каждой категории по количеству постов.
А автоматического механизма сейчас нет.
Но вот взвешивание это в ручную? Для достаточно серьезного рейтинга - это нереально!
Воскресные ба&hellip
“Blogotraka”: Добавлена информация Yandex Blog Search
На днях мы встречались с Романом Ивановым, отвечающим за “Поиск по блогам” Яндекса, и договорились о возможности использования резу…
Воскресные ба&hellip
[…] Были высказаны сомнения (напр., здесь - кстати, отличный пост о проблеме категоризации) относительно возможности сервиса действительно помочь в нахождении новых и интересных, а не всем известных блогов. В нынешнем его виде - если и сможет, то лишь ограниченно. По опыту того же Технорати, основной объем - несколько десятков тысяч - интересных нишевых блогов - это как раз “середина хвоста”, т.е. не топ100 и даже не топ1000. Мы осознаем эту проблему и поверьте, ее решение - одна из первых и главных целей. Об этом позже в подробностях. […]
Leave a Comment
Some HTML allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>
Trackback this post | Subscribe to the comments via RSS Feed