Блез Агуэра-и-Аркас проводит блестящую демонстрацию Photosynth, программы, способной изменить наш взгляд на цифровые изображения. С помощью фотографий, взятых из Интернета, Photosynth создает волшебные, захватывающие дух фантазии, позволяя нам перемещаться среди них.
Прежде всего, как можно скорее, я хочу представить вам одну серьезную работу, новую технологию, которую мы предоставили Microsoft как часть ее приобретения почти год назад. Это Seadragon («Морской дракон»). В этом режиме можно работать с огромным количеством видеоинформации, локально или удаленно.
Перед нашими глазами проходят мириады гигабайт цифровых фотографий, и мы можем незаметно и непрерывно увеличивать изображение, горизонтально его прокручивать, перестраивать его, как хотим. Не имеет значения, сколько информации проходит у нас перед глазами, насколько велики эти коллекции или сами изображения. Большинство из них – это снимки, сделанные обычным цифровым фотоаппаратом, но вот эта, например, отсканирована в Библиотеке Конгресса, она выполнена с разрешением в 300 мегапикселей. Но это не имеет никакого значения, потому что единственное, что ограничивает эффективность подобной системы – это количество пикселей на вашем экране
в данный момент. Это очень гибкая архитектура. Вот целая книга, пример данных без изображения. Это «Холодный дом» Диккенса. Каждый столбец – это глава. Чтобы доказать вам, что это на самом деле текст, а не изображение, мы можем сделать вот что, чтобы действительно показать, что это настоящее представление текста; это не рисунок. Может быть, читать электронную книгу таким образом не совсем привычно. Я бы не советовал читать ее так.
А это более удачный пример. Это выпуск газеты Guardian. Каждое большое изображение – это начало раздела. И так вы действительно почувствуете радость и ощущение того, что читаете настоящую печатную версию журнала или газеты, которая, по сути, является носителем информации с разными масштабами. Мы кое-что сделали здесь, в уголке этого выпуска Guardian. Мы составили фиктивную рекламу очень высокого разрешения, намного выше, чем в обычной рекламе, и вставили дополнительное содержание. Если вы хотите увидеть характеристики этой машины, они находятся вот здесь. Или другие модели или даже техническое описание. Здесь мы приблизились к тому, чтобы покончить со всякими ограничениями реального объема экрана. Мы надеемся, нам больше не понадобятся всплывающие окна и всякая подобная ерунда.
Конечно, один из способов применения подобной технологии, что сразу приходит на ум, – это составление карт. Я не буду на этом останавливаться, просто скажу, что мы можем кое-что привнести и в данную отрасль. Это все дороги США, нанесенные поверх геопространственного изображения NASA. А сейчас давайте остановимся на другом. Вот это сейчас размещено в сети в режиме реального времени, вы можете сами посмотреть.
Этот проект называется Photosynth («Фотосинтез»), он объединяет в себе две различные технологии. Одна из них – это Seadragon, а вторая – прекрасное исследование машинного зрения, выполненное Ноа Снейвли, аспирантом университета Вашингтона, его консультировали Стив Зейтц из университета Вашингтона и Рик Силински из Microsoft Research. Просто прекрасная команда. Этот проект размещен в сети. Поддерживается с помощью Seadragon. Вы видите, что когда мы используем эти режимы просмотра, мы можем проникать через изображения и получаем эффект переменной разрешающей способности.
Но пространственное расположение изображений имеет определенный смысл. Алгоритмы машинного зрения зарегистрировали эти изображения таким образом, что они соответствуют реальному пространству – это было снято в районе озер Грасси в канадских горах – где эти снимки были сделаны. Вы видите элементы устойчивой покадровой или панорамной визуализации, и все это было связано в пространстве. Я не уверен, есть ли у меня время показать вам другие режимы просмотра. Существуют режимы, которые еще лучше передают пространство. Я хотел бы перейти к одному из оригинальных наборов данных Ноа, они взяты из раннего прототипа Photosynth, с которым мы впервые начали работать летом, чтобы продемонстрировать вам то, что я считаю действительно кульминационным моментом в этой технологии, технологии Photosynth. Когда смотришь на режимы просмотра, предложенные нами на веб-сайте, это не так заметно. Мы тогда переживали по поводу юристов и так далее.
Это реконструкция собора Парижской Богоматери, полностью выполненная с помощью компьютера на основе изображений, собранных на сервисе Flickr. Вы просто печатаете «Нотр-Дам» во Flickr’е, и получаете изображения ребят в футболках, изображения студенческого городка и так далее. А каждый из этих оранжевых конусов представляет изображение, относящееся к этой модели. Это все изображения из Flickr’а, таким образом, они все были соединены пространственно. И навигация здесь очень проста. (Аплодисменты).
Вы знаете, я никогда не думал, что буду работать в Microsoft. Такой прием – это просто огромное удовольствие для меня. (Смех)
Думаю, вы видите, все это многообразие различных видов фотоаппаратов: от камеры в мобильном телефоне до профессиональных зеркальных фотоаппаратов, их много, и они соединены в этом режиме просмотра. Если получится, я найду что-нибудь необычное. Многие изображения перекрываются. Тут где-то есть серия фотографий, а, вот они. Это плакат собора Парижской Богоматери, правильно зарегистрированный. Из этого плаката мы можем перейти в физический ракурс этой среды.
Дело в том, что мы можем взаимодействовать с социальной средой. Брать данные у любого человека, из общей коллективной памяти, чтобы видеть, как выглядит Земля, и связывать все это вместе. Все эти фотографии связаны вместе, и из них возникает нечто большее, чем просто сумма составляющих. Вы постепенно получаете модель целой планеты. Считайте, что это продолжение работы Стивена Лоулера «Виртуальная Земля». Когда ее начинают использовать, она становится все сложнее, в процессе ее использования увеличиваются ее преимущества. Фотографии пользователей связываются с метаданными, которые ввел кто-то другой. Если кто-то ввел информацию обо всех этих святых, указал, кто они такие, тогда моя фотография собора Парижской Богоматери внезапно обогащается всеми этими данными, и я могу ее использовать как точку входа для погружения в это пространство, в эту метавселенную, используя фотографии других людей и, таким образом, приобретя перекрестно-модальный и перекрестно-пользовательский социальный опыт. И, конечно, побочный результат всего этого – это виртуальные модели любой интересующей части Земли с чрезвычайно богатым содержанием, собранные не только со съемок местности и изображений со спутника и из всего такого прочего, но и из коллективной памяти.
Большое спасибо. (Аплодисменты)
Крис Андерсон: Я правильно понимаю? Ваше программное обеспечение позволит когда-нибудь, уже в ближайшие несколько лет, по существу, связать воедино все изображения, которые кто-либо размещал в сети во всем мире?
БАА: Да. Программа их находит. То есть создает гиперссылки, если угодно, между изображениями. Программа делает это, основываясь на контенте внутри изображений. Это просто потрясающе, если вы подумаете о богатстве семантической информации, которой обладают большинство из этих изображений. Например, когда вы ищете изображения в сети, вы набираете фразы, а текст на веб-странице содержит большое количество информации об этом изображении. А что если это изображение связано со всеми вашими изображениями? Тогда количество семантических взаимосвязей и весь тот объем информации, который вы получите, становится просто огромным. Это классический сетевой эффект.
КА: Блейз, это просто невероятно. Я вас поздравляю.