Выбери любимый жанр

Журнал «Компьютерра» № 9 от 06 марта 2007 года - Компьютерра - Страница 26


Изменить размер шрифта:

26

Год спустя Мартин Ваттенберг (Martin Wattenberg), математик из Беркли, разместил в Интернете графическую историю изменений имен, даваемых новорожденным. Простенькая визуализация породила волну обсуждений в блогах и традиционных изданиях. Тысячи пользователей ссылались на результаты, полученные Ваттенбергом, как на исходную точку для своих исследований, как любительских, так и профессиональных. После этого в VAL решили разработать универсальную платформу для проведения подобных обсуждений и совместить ее с новейшими программными продуктами, создаваемыми в исследовательских лабораториях IBM.

Исторические потоки

Среди других проектов визуализации данных, связанных с Web 2.0, можно отметить приложение HistoryFlow, над которым раньше трудились разработчики ManyEyes. Сервис иллюстрирует динамику модификации документов, с которыми одновременно работает многочисленная авторская команда. В настоящее время сервис позволяет отследить эволюцию статей в Wikipedia. Просматривая эти хроники, можно легко выявить конфликты между создателями, каждый из которых отстаивает свою точку зрения на описываемый предмет, а также определить влияние внешних событий на модификацию текста (например, для статьи «Iraq»). Результаты анализа представляются в виде диаграммы изменений, формирование которой разработчики объясняют на примере.

Пусть три автора под никами Mary, Suzanne и Martin в разное время участвуют в редактировании Wiki-статьи. Первую версию документа создает Mary. Этот этап отражается на диаграмме появлением первой вертикальной линии, окрашенной в авторский цвет, длина которой соответствует объему текста [1].

Журнал «Компьютерра» № 9 от 06 марта 2007 года - _hf1.jpg

Через некоторое время Suzanne дописывает в конец этой статьи свои дополнения [2].

Журнал «Компьютерра» № 9 от 06 марта 2007 года - _hf2.jpg

Martin полагает, что текст можно сократить, и удаляет часть дополнений от Suzanne [3].

Журнал «Компьютерра» № 9 от 06 марта 2007 года - _hf22.jpg

Suzanne возвращается и вносит свою лепту в середину статьи [4].

Журнал «Компьютерра» № 9 от 06 марта 2007 года - _hf4.jpg

Хронология перехода статьи от своего начального вида к текущему будет выглядеть следующим образом [5].

Журнал «Компьютерра» № 9 от 06 марта 2007 года - _hf55.jpg

Полученную картинку можно просматривать в нескольких режимах. По умолчанию установлен вариант «комьюнити». При желании можно выделить деятельность конкретного автора, а также визуализировать «возраст» каждой правки (диаграмма в этом случае представлена в черно-белом цвете, и в зависимости от времени, прошедшего после редактирования, авторский «шлейф» будет темнеть).

Результаты такого анализа Wiki-статей позволяют выявить несколько интересных моментов. В частности, авторы HistoryFlow исследовали эволюцию нескольких спорных тем и заметили, что содержание ряда статей во время атак вандалов было удалено фактически полностью. Однако, как показывает практика, первоначальный вариант текста восстанавливается достаточно оперативно, и абсолютное большинство читателей просто не успевают заметить последствий. На картинке приведен пример со статьей «Islam», которая подвергалась вмешательству вандалов [6].

Журнал «Компьютерра» № 9 от 06 марта 2007 года - _hf5.jpg

Как уверяют разработчики, ManyEyes позволяет обеспечить более глубокий анализ информации за счет использования знаний сотен и тысяч людей. В общем-то, это аргумент почти всех компаний, продвигающих средства для коллективной работы в онлайне, который сводится к старой пословице «Одна голова хорошо, а две лучше». В IBM указывают, что этот проект может быть полезен не только частным лицам, но и бизнесу и правительственным структурам при принятии более точных решений на основе предиктивного анализа. Приложение должно помочь компаниям и госведомствам значительно ускорить темпы освоения новых технологий за счет веб-сервисной модели ПО. Весьма полезной такая модель является и для самой IBM, поскольку стимулирует коллективные инновации среди пользователей и гарантирует оперативную обратную связь, что вкупе способствует быстрой отладке и выводу на рынок свежих технологий.

Впрочем, также ни для кого не является секретом, что создатели всех wiki-приложений и подобных им сервисов сталкиваются со спамерами, вандалистами и прочими любителями «посорить в общественных местах», вносящими некорректные правки в статьи, документы или, как в данном случае, наборы данных. Так например, в Wikipedia пришлось даже отказаться от излишней «демократии» во внесении правок, поскольку этим правом слишком часто злоупотребляли, что существенно подорвало репутацию проекта. Подастся ли модерированию ManyEyes или же в будущем возможности по редактированию визуализаций также придется ограничить, покажет время. Пока сервис еще не получил столь массовой популярности, и эти проблемы обходят его стороной.

Данные

Весь ресурс делится на две глобальных части — для участников и любопытствующих. Последние могут помимо библиотеки визуализаций ознакомиться со списком исходных табличных данных и лентой последних комментариев в обсуждениях, на которую можно оформить RSS-подписку. Также они имеют право создавать свои собственные диаграммы на основе внесенных другими участниками данных. Для того чтобы загрузить собственные информационные массивы, нужно зарегистрироваться и получить общий для всех веб-ресурсов IBM идентификатор (IBM ID). Высказать свою точку зрения на форуме можно и без аутентификации. Пока в ManyEyes разрешены сообщения от анонимных пользователей. Сразу нужно оговориться, что для просмотра визуализаций необходимо обзавестись последней версией Java-плагина для браузера. Причем, он, похоже, не умеет работать с кириллицей. По крайней мере, у меня данные, введенные на русском языке, в табличном виде смотрелись нормально, а на сгенерированных графиках не отображались.

Загрузить свои исходные данные в систему (например, изменение рождаемости в зависимости от динамики среднедушевого дохода в стране) достаточно просто. Стандартной формой представления экспортных данных является таблица. Ее можно загрузить в виде текстового файла, в котором значения отделяются табуляцией, а первой строкой идут заголовки колонок. Например:

Fruit Color Calories

Apple Red 100

Banana Yellow 120

Размер файла не должен превышать пяти мегабайт. Или же можно скопировать и вставить соответствующую табличку из Excel.

Другие проекты

Разработчиками HistoryFlow и ManyEyes в разное время были созданы такие сервисы визуализации, как SmartMoney Map of The Market и Shape of Song. Первый позволяет анализировать котировки акций на бирже и демонстрирует изменения курса, группируя компании по отраслям. На его основе позднее в ManyEyes был разработан один из типов визуализаций (древовидные карты).

Журнал «Компьютерра» № 9 от 06 марта 2007 года - _smart.jpg
26
Перейти на страницу:
Мир литературы