топ-100 русскоязычных блогов

Кажется, что только я один пока не написал про этот новый рейтинг. В двух словах суть его в том, что из Technorati берутся данные о ссылках на тот или иной блог и на основании их строится рейтинг, где на первом месте оказывается самый авторитетный (популярный?) блог, на который больше всего ссылаются.

Идея хороша с первого взгляда, но вот по мере роста количества блогов, мы получим ситуацию, когда функцию фильтрации и нахождения новых и интересных блогов этот сервис станет выполнять просто никак. Блогов будет слишком много, а на первых местах будут те, которые и так всем известны.

В этой связи идея автора сервиса о категоризации блогов видится вполне здравой и рабочей. Т. е. при условии категоризации вполне может получитсья, что будут находиться новые и интересные блоги. Вот только как эта категоризация будет осуществляться?
Сверху? Как планиурется сейчас? Такой способ с малым количеством категорий и однозначностью классификации показал себя неэффективным уже неоднократно. Введение же множетсва категорий и поликатегориальность блогов потребует существенной работы со стороны автора.
Снизу? Фолксономией? Владельцы блогов конечно прокатегоризируют каждый свой, а дальше? Зачем мне категоризировать какой-нибудь экслер.ру или дерти.ру? Как лично мне в дальнейшем поможет эта моя категоризация?
Кроме того, в условиях, когда блог - это прежде всего авторский проект, т. е. проекция личности, многогранной личности, категоризировать его однозначно - это значит, что однозначно причислить человека к тому или иному разряду, что есть неправильно.

Какой тут выход может быть? А скорее всего никакого вменяемого выхода не получится.
Хорошо бы конечно, чтобы можно было проанализировать категории каждого блога. Ведь сам автор категоризирует каждую свою запись, а в рамках общей их совокупности категоризирует весь контент блога. Вот у меня, в правой колонке, в облаке тагов соврешенно однозначно выделяются отдельные позиции, а значит можно с большой уверенностью сказать, чо этот блог про то-то и про то-то. Так же и у других блогов - записи по тем или иным категориям преобладают, а значит преимущественно блог посвящен именно этим вопросам. Ну а после анализа всех категорий и их удельного веса можно было бы ввести шаклу детализации отнесения блога к той или иной категории. Т. е. брать например либо самую популярную категорию и соответственно относить блог к ней одной, либо брать “эн” самых популярных категорий и заносить блог сразу в несколько этих категорий.
Но тут конечно опять же встает существенная и неустранимая пока что проблема - проблема лингвистическая. Категории “дизайн”, “design” и “диз” могут в разных блогах обозначать одно и то же. Но вот для машины они будут разными сущностями и значит програмно склеить их в одну не получится, а значит вся моя идея с автокатегоризацией всей совокупности блогов на основе имманентных для отдельно взятого блога категорий летит к чертям. Хотя на бумаге она, признаюсь, выглядит лично для меня очень аппетитно! :)

Февраль 28th, 2006

11 Comments

  1. injun #576871

    Гм… честно сказать, я скептически отношусь к таким рейтингам, в основном, по умопянутым вами причинам - все известные блоги всегда будут лидерами… а составлять список (рейтинг?) ради простого перечисления всем_известным блогов не имеет смысла…
    Что касается категорий - это идея интересная…но не спасительная…
    Ну это мое ИМХО конечно….

    Март 1st, 2006
  2. cactusinside

    Я вообще не понимаю сути всей этой шумихи кроме как народу не про что больше писать. Еще и технократи выбрали для подсчета статистики, пол года назад там вообще не найти было русских записей, но они же были.

    Март 1st, 2006
  3. cactusinside

    А там рейтинг оценвается за все время существования или за прошлую неделю/месяц/…? Второй вариант как раз бы помогал неизвесным блогам выходить наверх засчет хороших записей.

    Март 1st, 2006
  4. alex-and-r

    Фигта! Там просто берется общее количество ссылок на блог за все время. Т. е. чем старее и популярнее блог, тем соответственно на него боьше ссылок. Так что опер, дерти, экслер и т. д. будут всех давить почерному…

    Март 1st, 2006
  5. Денис

    а вот постите линки на блоги здесь: Linkstore
    Там просто голоса за 3 дня.

    а общее количество ссылок конечно же ничего не даст.
    То есть старые и всем известные всегда так и будут наверху

    Март 1st, 2006
  6. cactusinside

    кстати, при необходимости можно накрутить эти ссылки и вылезти вверх

    Март 1st, 2006
  7. c0nst

    Наилучшие каталоги - те, которые модерируются вручную. Но процесс можно частично автоматизировать.
    Идея с занесением блога в различные категории очень даже неплохая. Можно рейтинг технорати умножать на некий коефициент (0

    Март 2nd, 2006
  8. c0nst

    Извините, продолжу:
    коэф. меньше единицы, но больше нуля.
    Коэфициентом может быть например процентное соотношение статей по заданной тематике к общему кол-ву постов на блоге. Но разделять статьи по категориям опять же должны люди, а не компьютеры.

    Март 2nd, 2006
  9. alex-and-r

    2 c0nst

    Вот-вот, как раз про это я и говорил, когда предлагал взять таги и количество постов по каждому из них. Ведь облако тагов у меня в правой колонке как раз и получается взвешиванием каждой категории по количеству постов.
    Но вот взвешивание это в ручную? Для достаточно серьезного рейтинга - это нереально! :( А автоматического механизма сейчас нет.

    Март 3rd, 2006
  10. Воскресные ба&hellip

    “Blogotraka”: Добавлена информация Yandex Blog Search

    На днях мы встречались с Романом Ивановым, отвечающим за “Поиск по блогам” Яндекса, и договорились о возможности использования резу…

    Март 14th, 2006
  11. Воскресные ба&hellip

    […] Были высказаны сомнения (напр., здесь - кстати, отличный пост о проблеме категоризации) относительно возможности сервиса действительно помочь в нахождении новых и интересных, а не всем известных блогов. В нынешнем его виде - если и сможет, то лишь ограниченно. По опыту того же Технорати, основной объем - несколько десятков тысяч - интересных нишевых блогов - это как раз “середина хвоста”, т.е. не топ100 и даже не топ1000. Мы осознаем эту проблему и поверьте, ее решение - одна из первых и главных целей. Об этом позже в подробностях. […]

    Апрель 4th, 2006

Leave a Comment

Required

Required, hidden

Some HTML allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

Trackback this post  |  Subscribe to the comments via RSS Feed

My del.icio.us

Links