Вес тагов и время

Categories: ideas, tagging

Частный вопрос таггирования. Просто идея возникла.

Любой “продвинутый” пользователь сейчас знает, что такое облако тагов. А также этот самый пользователь знает, как это облако строится: берется список тагов, а их размер в облаке зависит от количества записей (или фотографий, или ссылок, или любых других единиц совокупности), которым они присвоены. Т. е. чем больше записей категоризированы по тому или иному тагу, то тем больше его размер (вес) в облаке. Но это все проза. В общем случае облако тагов - есть характеристика (семантическая) некоей информационной совокупности, показывающая, какие из семантических составляющих этой совокупности превалируют.
Однако на сегодняшний день такая характеристика является статичной, т. е. одномоментной, взятой на какую-то отчетную дату.

И тут собственно идея.

Но ведь любая информационная совокупность на сегодняшний день не является статичной. Все эти наборы записей, ссылок, фоток постоянно расширяются, пополняются, обновляются. Т. е. живут во времени. В то же самое время облако тагов не учитывает фактор времени.
Почему бы не сделать так, чтобы оно его учитывало? Т. е. брать вес тага не в лоб по количеству записей, а вводить дополнительный фактор: таг тем значимее, чем больше записей по нему было добавлено в последнее время.
Ведь таким образом мы покажем не просто, какова совокупность информации, а какова она сейчас. Я, например, мог на заре своей блоггерской жизни увлекаться исключительно юмором и создать в своем блоге внушительную подборку глупых анекдотов. В то же время в последнее время я мог переосмыслить все на свете, уйти в монастырь и оттуда интересоваться исключительно инфоархитектурой. В то же время объем записей “про юмор” останется огромен и они так и будут давить в облаке все остальное. А вот если учесть, что за последние месяцы записей по этому тагу вообще не проскакивало, но зато появлялись исключительно записи по инфоарху, то облако можно изменить таким образом, чтобы юмор уже не давил так сильно.

В общем мне кажется эта идея интересной, а главное вполне осуществимой, а вам?

Ну и конечно стоит ввести возможность включения/отключения фактора времени.

UPDATE (05.04.2006): Кстати, забыл дать ссылку. tagschema - весьма интересный блог о таггировании вцелом и архитектуре баз данных для тагов - в частности. (Правда давно не обнослялся.)

Апрель 5th, 2006

просто несколько ссылок 6

И снова классический веблоггинг. Ниже просто ссылки и небольшие окмментарии к ним.

Ноябрь 16th, 2005

Вопрос про категории

Categories: tagging, yandex

Очень интересный, на мой взгляд, вопрос про то, при каких условиях все же обычному пользователю может понадобиться категоризация (таггирование). И особенно интереным он становится, если учесть, что задал его человек, работающий в Яндексе.

Октябрь 29th, 2005

за время отутсвия

Был в работе. Не мог вылезти и писать. Собственно даже читать ЖЖ и фиды не было времени.

Итак, что же интересного произошло за время моего недолгого отсутсвия?

Сентябрь 21st, 2005

to keyword or not to keyword

Зашли ко мне по запросу «догвиль». Попали на запись, где я таки транслитерировал английское название по-русски.
При
этом в тот же день я посвятил по крайней мере еще 3 записи той же теме. На странице, куда привел ищущего его запрос с яндекса этих записей не было, была только одна. Вопрос остался открытым: нашел ли он остальные записи, в которых я давал достаточно много интересных ссылок? сподобился ли он отредактировать адресную строку, оставив только дату? нашел ли он вообще то, что искал?
Ответов не последует, а появится лишь бюольше вопросов.

Первоначально, формулируя концепцию МОИХ ключевых слов, я решил не привязываться в них к каким-либо понятиям относительным во времени, т. е., например, к названиям фильмов, игр, наименованиям событий и подобному. Однако я неосознанно этот принцип нарушил чуть ли не в первый день добавив ключевые слова dirty_ru, goblin и lebedev, хотя я не об этом. А о том, что такие ключевые слова, на мой взгляд, стали бы бесполезным мусором спустя минимум пол-года с момента их введения ввиду утраты актуальности предметом, к которому они относятся.
Однако в примере, с которого я начал, такие слова оказали бы пользователю неоценимую услугу, выведя его на другие записи по конкретному предмету. Т. е. если бы я ввел ключевое слово «dogville», то щелкнов по нему ищущий мгновенно получил бы всю информацию по интересующему его предмету. В то же время, стоявшее там ключевое слово «films» не дало бы ему почти ничего, т. к. категория «фильмы» слишком широка.
В этой связи я собственно подхожу к сути и хочу указать на один недостаток существующей системы ключевых слов в регистре. Она хаотична. Она нуждается в рубрикации. Это система наименования (labeling), создающаяся на лету и наобум, а значит не носящая никакого четкого смысла, а следовательно практически бесполезная (я сказал практически, т. к. не так уж она и плоха).
В общем мы вновь подходим к той самой нашей архитектуре (которая информационная), а точнее к одному из ее аспектов, стягом которой нынче машут на всех углах.

Одним словом, нужно перед тем, как лепить ключевые слова, хотя бы чуть-чуть продумать их структуру.

P. S. А ключевое слово «dogville» я все-таки ввел!

Июль 21st, 2003

[infoarch?] ::: ideal learning book

Дочитывая книгу по иллюстратору подумалось об идеале подобной книги, книги самоучителя по какому-либо програмному продукту. И тут подобно кролику из шляпы на верх всплывает все таже ИА, без нее щас никуда, как и без ее тезки - ослика…

Книги такие читают люди уже имеющие определенную подготовку (not dummies?), поэтому размусоливание всех примудростей сложнейшего процесса серфинга по меню не имеет ни малейшего смысла. Собственно этого и нет (что хорошо), а есть по сути обзор (в идеале) ВСЕХ возможностей программы на примерах, т. е. даются конкретные трюки, иллюстрирующие все базовые возможности программы, трюки, структурированные по темам. Это кирпичи, на основании которых и применяя которые в последствии пользователь сможет строить здание своих навыков и приемов работы с прогой и здание своего опыта работы в ней.
Поэтому по сути процесс чтения книги сводится к ознакомлению со ВСЕМИ базовыми возможностями инструмента, а в последствие эта книга используется по принципу справочника: “Ага, я помнится читал, как сделать этот эффект. Пойду освежу память и сделаю сам.”
В этой то связи и нужно быстрое нахождение материала в книге. Содержание не всегда помогает, т. к. там все по темам, а по названию темы не всегда поймешь, о чем там в ней говорится и какие конкретные трюки описываются. Поэтому как всегда мы подходим к ключевым словам.
Нужно например нам нужно сделать уже рассмотренную мной ранее текстуру в стиле гранж. Соответсвенно на вскидку идут ключевые слова: текстура, грязь, прозрачность, фильтры… Фигачим по этим словам и получаем список топиков. В принципе это уже организовано в поиске по хелпу, но там нет конкретных примеров, которые есть в книге.
Трюки, подайте народу трюки, которые легко находить.

А содержание сосет, как бессодержательное.

Апрель 28th, 2003

My del.icio.us

Links