Облачные технологии- основные понятия, задачи и тенденции развития


Чтобы посмотреть этот PDF файл с форматированием и разметкой, скачайте его и откройте на своем компьютере.
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


1

УДК
004.6: 004.75


ОБЛАЧНЫЕ ТЕХНОЛОГИИ:

ОСНОВНЫЕ ПОНЯТИЯ,

ЗАДАЧИ И ТЕНДЕНЦИИ Р
АЗВИТИЯ


Т.В. Батура
,

к.ф.
-
м.н.
;
Ф.А. Мурзин
,

к.ф.
-
м.н.
;

Д.Ф. Семич
,

к.ф.
-
м.н.


(
Институт систем информатики
им. А.П. Ершова СО РАН, пр. Акад. Лаврентьева, 6,

г. Новосибирск, 630090, Россия, bur@ns.ru, murzin@iis.nsk.su, deimn32@ns.ru
)


Аннотация
.
В статье делается обзор по облачным информационным технологиям. Под облачными
вычислениями (от англ.
cloud
computing
, также используется термин «облачная (рассеянная) обработка
данных») обычно понимается предоставление пользователю компьютерных ресурсов и мощностей в в
и-
де интернет
-
сервисов. Рассмотрены основные модели предоставления услуг облачных вычислений: I
aaS,
PS и другие, особенности облачных платформ, хранилищ данных и программного обеспечения от ра
з-
личных поставщиков. Перечислены некоторые задачи, связанные с обработкой больших объемов да
н-
ных, и обсуждаются тенденции развития.

Ключевые слова:

облачные
вычисления, web
-
приложение, виртуализация серверов, хранилище да
н-
ных, центр данных
.


Идея облачных вычислений появилась еще в 1960 году, когда Джон Маккарти высказал предполож
е-
ние, что когда
-
нибудь компьютерные вычисления будут производиться с помощью «общ
енародных ут
и-
лит». Считается, что идеология облачных вычислений получила популярность с 2007 года благодаря б
ы-
строму развитию каналов связи и стремительно растущим потребностям пользователей.

Под облачными вычислениями

(от англ.
cloud computing
, также испо
льзуется термин «о
блачная (ра
с-
сеянная) обработка данных»
) обычно понимается предоставление пользователю компьютерных ресурсов
и мощностей в виде интернет
-
сервиса. Таким образом, вычислительные ресурсы предоставляются пол
ь-
зователю в «чистом» виде, и пользов
атель может не знать, какие компьютеры обрабатывают его запросы,
под управлением какой операционной системы это происходит и т.д.

Часто облака сравнивают с мэйнфреймами (
mainframe
), находя между ними много общего. Принц
и-
пиальное отличие облака от мэйнфрей
мов в том, что его вычислительная мощность теоретически не о
г-
раничена. Второе принципиальное отличие в том, что, попросту говоря, терминалы для мэйнфреймов
служили только для интерактивного взаимодействия пользователя с запущенной на обработку задачей.

В
облаке же терминал сам является мощным вычислительным устройством, способным не только нака
п-
ливать промежуточную информацию, но и непосредственно управлять глобальной системой вычисл
и-
тельных ресурсов.

Среди ранее возникших (в 1990
-
х г
г.
) технологий обработ
ки данных некоторое распространение п
о-
лучили так называемые rid
-
вычисления. Это направление первоначально рассматривалось как возмо
ж-
ность использования свободных ресурсов процессоров и развития системы добровольной аренды вычи
с-
лительных мощностей. Ряд про
ектов (GIMPS, disribued.ne, SETI@home) доказали, что такая модель
вычислений достаточно эффективна. Сегодня эта технология применяется для решения научных, мат
е-
матических задач, где требуются значительные вычислительные ресурсы.
Известно, что
grid
-
вычис
ления
также применяются для коммерческих целей. Например, с их помощью выполняются некоторые труд
о-
емкие задачи, связанные с экономическим прогнозированием, анализом сейсмических данных, разрабо
т-
кой и изучением свойств вакцин и новых лекарств. Действительно
,
grid
-
вычисления и облака имеют мн
о-
го схожих черт в архитектуре и применяемых принципах. Тем не менее, модель облачных вычислений
считается сегодня более перспективной благодаря значительно более гибкой платформе для работы с
удаленными вычислительными
ресурсами.

В настоящее время крупные вычислительные облака состоят из тысяч серверов, размещенных в
це
н-
трах обработки данных

(ЦОД). Они обеспечивают ресурсами десятки тысяч приложений, которые о
д-
новременно используют миллионы пользователей [1]. Облачные те
хнологии являются удобным инстр
у-
ментом для предприятий, которым слишком дорого содержать собственные ERP, CRM или другие се
р-
веры, требующие п
риобретения

и настройки дополнительного оборудования.

ERP (
Enterprise Resource Planning



планирование ресурсов предприятия)


организационная страт
е-
гия интеграции производства и операций, управления трудовыми ресурсами, финансового менеджмента
и управления активами, ориентированная на непрерывную балансировку и оптимизацию ресурсов пре
д-
прия
тия посредством специализированного интегрированного пакета прикладного программного обе
с-
печения, обеспечивающего общую модель данных и процессов для всех сфер деятельности предприятия.

CRM (Customer Relationship Management)


система управления взаимоотн
ошениями с клиентами, то
есть прикладное программное обеспечение, предназначенное для автоматизации стратегий взаимодейс
т-
вия с заказчиками (клиентами), в частности, для повышения уровня продаж, оптимизации маркетинга и
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


2

улучшения обслуживания клиентов путем

сохранения информации о клиентах и истории взаимоотнош
е-
ний с ними, установления и улучшения бизнес
-
процедур и последующего анализа результатов.

Среди частных пользователей широкое распространение

постепенно получают

благодаря своему
удобству такие облачны
е услуги, как, например, предоставляемые компанией Gooe («Документы»,
«Календарь» и др.).

Причины возрастающей популярности облачных технологий понятны: возможности их применения
очень разнообразны и позволяют экономить как на обслуживании и персонале, т
ак и на инфраструктуре.
Аппаратное обеспечение может быть сильно упрощено при обработке данных и хранении информации в
удаленных центрах данных. Все эти проблемы почти полностью перекладываются на провайдера услуг.

К тому же такой подход позволяет стандарт
изировать ПО, даже если на компьютерах предприятия
установлены разные операционный системы (Windows, Linux, McOS и т.п.). Облачные технологии о
б-
легчают обеспечение доступа к данным компании как для клиентов, так и для собственных сотрудников,
находящихся
вне офиса, но имеющих возможность подключиться через Интернет.

Понятно, что использование облачных вычислений намного удобнее. Самым главным недостатком,
который можно сразу заметить, является полная зависимость от поставщика этих услуг. Фактически
предпри
ятие (пользователь) оказывается заложником провайдера сервисов и провайдера доступа в сеть
Интернет.
Хотя

надежность поставщиков облачных вычислений

возраста
ет
, для обеспечения надежности
и безопасности данных необходимо приложить немало усилий, например,
иметь дублирующие каналы
связи, дублирующие мощности для возможности переключения на них и, конечно же, подумать о до
с-
тупности информации и безопасности. Кроме этого, облачные вычисления совершенно не подходят для
предприятий, имеющих отношение к государст
венной и военной тайне. Ни одна комиссия не выдаст
сертификат на такую систему при работе с информацией, не подлежащей разглашению.

Как отмечено в [2], современные облачные технологии не только используются в готовом сетевом

и серверном оборудовании, но и

постепенно проникают на рынок встраиваемых систем (
embedded

cloud
)
и становятся причиной масштабной реструктуризации рынка. Внедрение встраиваемых систем приводит
к размещению компьютерных процессоров в таких изделиях, как счетчики учета расхода ресурсов,

и
н-
теллектуальные датчики, М2М
-
модули, автомобили, бытовая техника и т.д. Это позволяет управлять р
а-
ботой устройств, сбором данных и обеспечением интерактивных возможностей посредством подключ
е-
ния к компьютерной сети.

Идею подключения всевозможных устройст
в к глобальной сети называют
Интернетом вещей

(
Inte
r-
net

of

Things



IoT
). По мнению Кевина Далласа, генерального менеджера
Microsoft

Windows

Embedded

[3], идея Интернета вещей существует уже много лет, однако для ее реализации не хватало одного звена,
чтоб
ы построить такую сеть,


облака.

Так как количество встраиваемых компьютеров увеличивается благодаря снижению цен на процесс
о-
ры и повсеместному распространению Интернета, растут также и объемы передаваемых данных с посл
е-
дующей их обработкой (часто в режим
е реального времени). Поэтому можно предположить, что в бл
и-
жайшие годы роль Интернета вещей и облачных вычислений будет увеличиваться.


Основные модели предоставления услуг облачных вычислений


Модели развертывания облачных технологий


По модели развертывания облака разделяют на частные, общедоступные (публичные) и гибридные

[2, 4].

Частные облака


это внутренние облачные инфраструктура и службы предприятия. Эти облака н
а-
ходятся в пределах корпоративной сети. Организация может управлят
ь частным облаком самостоятельно
или поручить эту задачу внешнему подрядчику. Инфраструктура может размещаться либо в помещениях
заказчика, либо у внешнего оператора, либо частично у заказчика и частично у оператора. Идеальный
вариант частного облака


обл
ако, развернутое на территории организации, обслуживаемое и контрол
и-
руемое ее сотрудниками.

Частные облака обладают теми же преимуществами, что и общедоступные, но с одной важной ос
о-
бенностью: предприятие само занимается установкой и поддержкой облака. Сло
жность и стоимость со
з-
дания внутреннего облака могут быть очень высоки, а расходы на его эксплуатацию могут превышать
стоимость использования общедоступных облаков.

Следует отметить, что у частных обл
аков есть преимущества перед общ
едоступными
:

б
олее детал
ь-
ный контроль над различными ресурсами облака обеспечивает компании любые доступные варианты
конфигурации. Кроме того, частные облака идеальны, когда нужно выполнять работы, которые нельзя
доверить общедоступному облаку
из соображений

безопасности.

Общедос
тупные (публичные) облака


это облачные услуги, предоставляемые поставщиком. Они
находятся за пределами корпоративной сети. Пользователи данных облаков не имеют возможности
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


3

управлять данным облаком или обслуживать его, вся ответственность возложена на вла
дельца
эт
ого о
б-
лака. Поставщик облачных услуг принимает на себя обязанности по установке, управлению, предоста
в-
лению и обслуживанию программного обеспечения, инфраструктуры приложений или физической и
н-
фраструктуры. Клиенты платят только за ресурсы, которые

они используют.

Абонентом предлагаемых сервисов может стать любая компания и индивидуальный пользователь.
Они предлагают легкий и доступный по цене способ развертывания веб
-
сайтов или бизнес
-
систем

с большими возможностями масштабирования, которые в друг
их решениях были бы недоступны. Пр
и-
меры
:
онлайн
-
сервисы

Amazon EC2
и

Amazon Simple Storage Service (S3), Google Apps/Docs,
Salesforce.com, Microsoft Office Web.

Вместе с тем услуги публичных облаков в основном предоставляются в виде стандартных конфиг
у-
раци
й, то есть исходя из условий наиболее распространенных случаев использования. Это значит, что у
пользователя остается меньше возможностей по выбору конфигурации по сравнению с системами, в к
о-
торых ресурсами управляет сам потребитель. Следует также иметь в
виду, что, поскольку потребители
слабо контролируют инфраструктуру, процессы, требующие строгих мер безопасности и соответствия
нормативным требованиям, не всегда подходят для реализации в общедоступном облаке.

Гибридные облака

представляют собой сочетание

общедоступных и частных облаков. Обычно они
создаются предприятием, а обязанности по управлению ими распределяются между предприятием и п
о-
ставщиком общедоступного облака. Гибридное облако предоставляет услуги, часть которых относится к
общедоступным, а ча
сть


к частным. Обычно такой тип облаков используется, когда организация имеет
сезонные периоды активности. Другими словами, как только внутренняя ИТ
-
инфраструктура не справл
я-
ется с текущими задачами, часть мощностей перебрасывается на публичное облако (н
апример, большие
объемы статистической информации, которые в необработанном виде не представляют ценности для
предприятия), а также для предоставления доступа пользователям к ресурсам предприятия (к частному
облаку) через публичное облако. Хорошо продуманн
ое гибридное облако может обслуживать как тр
е-
бующие безопасности критически важные процессы, такие как получение платежей от клиентов, так и
более второстепенные.

Основным недостатком этого типа облака является сложность эффективного создания подобных р
е-
ш
ений и управления ими. Необходимо получать услуги из разных источников и организовать их так, как
если бы это был единый источник. Взаимодействие между частным и общедоступным компонентами
может еще больше усложнить решение. Поскольку это относительно нова
я архитектурная концепция в
сфере облачных вычислений, для этой модели появляются все новые и новые практические рекоменд
а-
ции и инструменты, и ее широкое распространение может затянуться до тех пор, пока она не будет лу
ч-
ше изучена.

По мнению Тома Биттмана,

вице
-
президента и ведущего аналитика американской исследовательской
и консалтинговой компании “Grner” [5, 6], среди вышеперечисленных трех моделей развертывания о
б-
лаков наиболее актуальной для бизнеса в данный момент являются частные облака. Биттман выд
елил
пять основных моментов, которые помогают получить более точное представление об устройстве час
т-
ного облака.

Облако


это не только виртуализация.

Хотя виртуализация серверов и инфраструктуры составл
я-
ет важный фундамент частных облачных вычислений, сами по себе виртуализация и управление вирту
а-
лизированной средой еще не являются частным облаком.

Виртуализация позволяет лучше структурировать, объединять в пул и динамически предоставлять р
е-
сурсы инфраст
руктуры: серверы, десктопы, емкости для хранения, сетевое оборудование, связующее ПО
и т.д. Но, чтобы среда
технически
могла считаться облачной, нужны еще и другие составляющие, такие
как виртуальные машины, операционные системы или контейнеры связующего ПО, высокоустойчивые
операционные системы, ПО rid
-
вычислений, ПО для абстрагирования ресурсов хранения, средства
масшта
бирования и кластеризации.

Термин «частное облако» в отличие от общедоступного или гибридного относится к ресурсам, и
с-
пользуемым единственной организацией, либо означает, что облачные ресурсы организации полностью
изолированы в облаке от остальных.

Облако


необязательно источник экономии.

Одно из главных заблуждений состоит в том, что о
б-
лако будет экономить деньги. Экономия возможна, но не является обязательным атрибутом.

Частное облако позволяет более эффективно перераспределять ресурсы, чтобы удовлетвор
ить корп
о-
ративные требования, и способно уменьшить капитальные затраты на оборудование. Но частное облако
требует инвестиций в автоматизацию, и одна лишь экономия может не окупать всей стоимости. Так что
,

снижение затрат не является главным преимуществом э
той модели. С этой точки зрения, главным ст
и-
мулом к внедрению облачной модели должна быть не экономия, а скорость выхода на рынок, возмо
ж-
ность быстрой адаптации и динамического масштабирования в соответствии со спросом, которые позв
о-
ляют повысить скорость
внедрения новых сервисов.

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


4

Частное облако не всегда внедрено у заказчика.

Частное облако означает конфиденциальность, а не
конкретное местоположение, владение ресурсами или самостоятельное управление. Многие поставщики
предлагают нелокальные частные облака,

то есть выделяют ресурсы единственному заказчику, исключая
совместное использование одного пула несколькими клиентами. «Облако называется частным по его
приватности, а не по тому, где оно развернуто, кто им владеет и несет ответственность за управление»,


подчеркивает Биттман. Некоторые, например, могут свои ЦОД размещать у хостинг
-
провайдеров или
объединять в пул ресурсы разных заказчиков, но изолировать их друг от друга с помощью виртуальной
частной сети (
V
irtual
P
rivate
N
etwork


VPN) и других подобных

технологий.

Частное облако (как и публичное облако)


это не только инфраструктурные сервисы.

Серве
р-
ная виртуализация


крупная тенденция и поэтому мощный двигатель частных облачных вычислений.
Но частное облако не сводится только к инфраструктуре как усл
уге (IS). Например, для разработки и
тестирования нового ПО высокоуровневая платформа как услуга (PS) имеет больше смысла, чем пр
о-
сто предоставление виртуальных машин.

Сегодня самый быстро растущий сегмент облачных вычислений


это IS. Она предостав
ляет самые
низкоуровневые ресурсы ЦОД в простой для использования форме, но не меняет фундаментально при
н-
ципы работы. Чтобы создать новые приложения, изначально предназначенные для облака и предоста
в-
ляющие совершенно новые услуги, которые могут очень отлич
аться от того, что давали прежние прил
о-
жения, разработчикам удобнее использовать PS.

Частное облако может перестать быть частным.

С одной стороны, частное облако предостав
л
я-
ет преимущества облака: быстроту перестройки, масштабируемость и эффективность, и
збавляет от нек
о-
торых угроз безопасности, потенциальных и реальных, которые характерны для общедоступных облаков.
С другой стороны, со временем уровень обслуживания, безопасность и контроль соблюдения требований
в общедоступных облачных сервисах безусловно

будут повышаться. Поэтому некоторые частные облака,
возможно,
целиком перейдут в категорию общ
едоступных. Большинство же сервисов частного облака,
скорее всего, будут эволюционировать в гибридные облачные сервисы, расширяя доступные возможн
о-
сти за счет ис
пользования общедоступных облачных услуг и других сторонних ресурсов.


Основные свойства облачных технологий


Национальный Институт стандартов и технологий
NIST

(
National

Institute of Standards and Technology,
USA
) в своем документе “The NIST Definiion of

Coud Compuin” [5] определяет следующие характер
и-
стики облаков:



возможность в высокой степени автоматизированного самообслуживания системы со стороны пр
о-
вайдера;



наличие

системы

Broad Network Access;



сосредоточенность ресурсов на отдельных площадк
ах для их эффективного распределения;



быстрая масштабируемость (ресурсы могут неограниченно выделяться и высвобождаться с бол
ь-
шой скоростью в зависимости от потребностей);



управляемый сервис (система управления облаком автоматически контролирует и опти
мизирует
выделение ресурсов).

Самообслуживание по требованию (On
-
demand self
-
service)
. У потребителя есть возможность п
о-
лучить доступ к предоставляемым вычислительным ресурсам в одностороннем порядке по мере потре
б-
ности, автоматически, без необходимости вз
аимодействия с сотрудниками каждого поставщика услуг.

Широкий сетевой доступ (Brod nework ccess)
. Предоставляемые вычислительные ресурсы до
с-
тупны по сети через стандартные механизмы для различных платформ, тонких и толстых клиентов

(мобильных телефонов
, планшетов, ноутбуков, рабочих станций и т.п.).

Объединение ресурсов в пулы (Resorce pooin)
. Вычислительные ресурсы провайдера объедин
я-
ются в пулы для обслуживания многих потребителей по многоарендной (mui
-
enn) модели. Пулы
включают в себя различны
е физические и виртуальные ресурсы, которые могут быть динамически н
а-
значены и переназначены в соответствии с потребительскими запросами. Нет необходимости в том, чт
о-
бы потребитель знал точное местоположение ресурсов, однако можно указать их местонахождени
е на
более высоком уровне абстракции (например, страна, регион или ЦОД). Примерами такого рода ресу
р-
сов могут быть системы хранения, вычислительные мощности, память, пропускная способность сети.

Мгновенная эластичность (Rpid esiciy)
. Ресурсы могут быт
ь легко выделены и освобождены, в
некоторых случаях автоматически, для быстрого масштабирования соразмерно спросу. Для потребителя
возможности предоставления ресурсов видятся как неограниченные, то есть они могут быть присвоены в
любом количестве и в любое

время.

Измеряемый

сервис

(
Measured

service
)
.
Облачные системы автоматически управляют и оптимиз
и-
руют ресурсы с помощью средств измерения, реализованных на уровне абстракции применительно для
разного рода сервисов (например, управление внешней памятью, обр
аботкой, полосой пропускания или
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


5

активными пользовательскими сессиями). Использованные ресурсы можно отслеживать и контролир
о-
вать, что обеспечивает прозрачность как для поставщика, так и для потребителя, использующего сервис.


Модели обслуживания облачных
технологий


В настоящее время принято выделять [4, 5, 7

9] три основные модели обслуживания облачных техн
о-
логий, которые иногда называют слоями облака. Можно сказать, что эти три слоя


услуги инфрастру
к-
туры, услуги платформы и услуги приложений


отражают

строение не только облачных технологий, но
и информационных технологий в целом. Остановимся подробнее на каждом из них.

К
услугам инфраструктуры (Infrsrucure s 
S
ervice


IaaS)
можно отнести
набор физических
ресурсов, таких как серверы, сетевое обору
дование и накопители, предлагаемые заказчикам в качестве
предоставляемых услуг. Услуги инфраструктуры решают задачу надлежащего оснащения ЦОД, предо
с-
тавляя вычислительные мощности по мере необходимости. Обычно эти услуги поддерживают инфр
а-
структуру и гораз
до большее число потребителей по сравнению с услугами приложений. Частным пр
и-
мером услуг инфраструктуры является
а
ппаратное обеспечение как услуга (Hrdwre s  Service


HaaS
)
.

В качестве услуги пользователь получает оборудование, на основе которого разв
орачивает свою
собственную инфраструктуру с использованием наиболее подходящего ПО.

Потребитель при этом не управляет базовой инфраструктурой облака, но имеет контроль над опер
а-
ционными системами, системами хранения, развернутыми приложениями и, возможно,
ограниченный
контроль выбора сетевых компонентов (например, хост с сетевыми экранами). В таком случае защиту
платформ и приложений обеспечивает сам потребитель, а провайдер облака должен организовать защиту
инфраструктуры. Для предоставления ресурсов по тр
ебованию часто используется виртуализация.

Преимущества.

Снижение капиталовложений в аппаратное обеспечение. Поскольку в этой модели
обычно используются методы виртуализации, можно добиться экономии в результате более эффективн
о-
го использования ресурсов. У
меньшение риска потери инвестиций и порога внедрения, возможность
плавного автоматического масштабирования.

Недостатки.

Бизнес
-
эффективность и производительность очень зависят от возможностей поста
в-
щика. Существует вероятность, что потребуются потенциальн
о большие долгосрочные расходы. Центр
а-
лизация требует новых подходов к мерам безопасности.

Примерами

услуг инфраструктуры служат IBM SmrCoud Enerpris
e
, VMWare, Amazon EC2,
Wi
n-
dows

Azure
,
G
oogle
C
loud
S
torage,
Parallels

Cloud Server

и многие другие.

Услуги платформы (Pform s 
S
ervice


PaaS)


э
то модель обслуживания, в которой потребит
е-
лю предоставляются приложения (созданные или приобретенные) как набор услуг. В него входят,

в частности, промежуточное ПО как услуг
а
, обмен сообщениями как услуг
а
, интеграция как услуг
а
, и
н-
формация как услуг
а
, связь как услуг
а

и т.д. Например,
р
абочее место как услуга (Workpce s 
Service


WaaS
)

позволяет
компании использовать облачные вычисления для организации рабочих мест
своих сотрудников, настроив и установив все необходимое для работы персонала ПО.
Данные как услуга
(Data as a Service


DaaS
)

предоставляют
пользователю дисковое пространство, которое о
н может

использовать для хранения больших объемов информации.
Безопасность как услуга (Securiy s 
Service


SaaS
)

дает
возможность пользователям быстро развертывать продукты, позволяющие обесп
е-
чить безопасное использование веб
-
технологий, безопасность
электронной переписки, а также безопа
с-
ность локальной системы. Этот сервис позволяет пользователям экономить на развертывании и подде
р-
жании своей собственной системы безопасности.

Другими словами, модель
PaaS



это
IaaS

вместе с операционной системой и ее
интерфейсом пр
и-
кладного программирования (
API



Appicion Prormmin Inerfce). Потребитель при этом не упра
в-
ляет базовой инфраструктурой облака, в том числе сетями, серверами, операционными системами и си
с-
темами хранения данных, но имеет контроль над
развернутыми приложениями и, возможно, некоторыми
параметрами конфигурации среды хостинга. Таким образом, потребитель должен позаботиться об обе
с-
печении защиты приложений, которые будут развернуты на предоставленных платформах.

Приложения могут работать ка
к в облаке, так и в традиционных ЦОД предприятия. Для достижения
масштабируемости, необходимой в облаке, различные предлагаемые услуги часто виртуализируются, как
и рассмотренные ранее услуги инфраструктуры.

Преимущества.

Плавное развертывание версий. Пла
вность означает, что в идеале пользователь до
л-
жен слабо ощущать или даже вообще не ощущать изменения ПО в облаке.

Недостатки.

Как и у предыдущей модели обслуживания, централизация требует надежных мер
безопасности.

Примерами

услуг

платформы

служат

IBM Sma
rtCloud Application Services
, Amazon Web Services,
Windows Azure, Boomi, Cast Iron, Google App Engine
и

другие
.

Услуги приложений (Sofwre s 
S
ervice


SaaS)

предполагают доступ к приложениям как к се
р-
вису, то есть приложения провайдера запускаются в
облаке и предоставляются пользователям по треб
о-
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


6

ванию как услуги. Другими словами, пользователь может получать доступ к ПО, развернутому на уд
а-
ленных серверах, посредством Интернета, причем все вопросы обновления и лицензий на данное ПО р
е-
гулирую
тся поставщ
иком данной услуги. Оплата в данном случае осуществляется за фактическое и
с-
пользование ПО. Иногда эти услуги поставщики делают бесплатными, так как у них есть возможность
получать доход, например
,

от рекламы.

Приложения доступны посредством различных клиен
тских устройств или через интерфейсы тонких
клиентов, такие, например, как веб
-
браузер, или веб
-
почта, или интерфейсы программ. Потребитель при
этом не управляет базовой инфраструктурой облака, в том числе сетями, серверами, операционными
системами. На кон
ечном пользователе лежит ответственность только за сохранность параметров доступа
(логинов, паролей и т.д.) и выполнение рекомендаций провайдера по безопасным настройкам прилож
е-
ний.

Услуги приложений

более всего знакомы повседневному пользователю. Самым ра
спространенным
примером приложений данного типа являются почтовые сервисы GMi,
Mail
.
ru
, Yhoo Mi. Вообще
существуют тысячи приложений SS, и благодаря технологии Web 2.0 их число растет с каждым днем.
Среди служб приложений имеется множество приложени
й, нацеленных на корпоративное сообщество.
Существует ПО, управляющее начислением заработной платы, кадровыми ресурсами, коллективной р
а-
ботой, взаимоотношениями с клиентами и бизнес
-
партнерами и т.п.

Преимущества.

Снижение капиталовложений в аппаратное об
еспечение и трудовые ресурсы; умен
ь-
шение риска потери инвестиций; плавное итеративное обновление.

Недостатки.

Как и в предыдущих двух моделях, централизация требует надежных мер безопасности.

Примерами

SS являются Gmi, Gooe Docs, Nefix, Phooshop.c
om, Acrobat.com, Intuit QuickBooks
Onine, IBM LousLive, Unye, Sesforce.com, Sur CRM и WebEx. Значительная часть растущего рынка
мобильных приложений также является реализацией SS.

Существует мнение, что принятое в настоящее время деление облачных
вычислений по мере развития
технологий в ближайшем будущем уйдет в прошлое [2]. В облачных приложениях будущего, предпол
о-
жительно, будут сочетаться не только инфраструктурные и платформенные элементы от одного поста
в-
щика, но и различные сервисы, собранные
от разных поставщиков. Возможно, в итоге облачные вычи
с-
ления приведут к появлению концепции
Всё

как

услуга

(
Everything

as

a

Service



EaaS
)
.

При таком

виде сервиса пользователю будет предоставлено все


от программно
-
аппаратной части до управления
бизнес
-
процессами, включая взаимодействие между пользователями.


Обзор решений ведущих вендоров


На сегодняшний день существует большое множество поставщиков
облачных платформ, хранилищ и
ПО. В связи с этим предпринимаются попытки каким
-
то образом сравнить их между собой. В Интернете
можно найти массу обзоров на эту тему [10

12]. Но из
-
за многообразия предоставляемых услуг раз
о-
браться в том, кто из них лучше, д
овольно трудно. Поэтому необходимо выбрать несколько основных
показателей, которые могут помочь при сравнении, например,
емкость, защищенность, простота, фун
к-
циональность, доступность и др. При этом, несомненно, каждый пользователь выбирает то или иное р
е-
ш
ение в зависимости от необходимости.


Сравнение платформ Amzon, Gooe и Microsof


В настоящий момент основными поставщиками облачной инфраструктуры считаются Amzon,
Gooe и Microsof. У каждой из компаний имеется целая линейка предоставляемых услуг.
В данных м
а-
териалах описаны только некоторые из них, наиболее популярные. Также не обсуждается вопрос, к к
а-
кой именно модели относится та или иная услуга и какие вендоры предоставляют только публичные о
б-
лака, а какие могут участвовать в создании частных об
лаков.

Google

[13]

https
://
developers
.
google
.
com

Google Drive


облачное хранилище данных, принадлежащее компании
Google
, позволяющее польз
о-
вателям хранить свои данные на серверах в облаке и делиться ими с
другими пользователями в Интерн
е-
те. Gooe Drive отличается лаконичным интерфейсом и предлагает установить удобные программные
клиенты для смартфонов и планшетов на базе
операционной системы

Android, ПК и ноутбуков под
управлением
операционной системы

Wind
ows или McOS, мобильных устройств iPhone и iPd. В буд
у-
щем ожидается более тесная интеграция хранилища с операционной системой Chrome OS и поддержка
Linux. Каждый пользователь Gooe Drive получает до 15 Гбайт свободного пространства на все сервисы
Google

(в том числе Gmi и Phoos). При этом он сам может решить, сколько места выделить под почту и
какой объем оставить под важные файлы. Работать с файлами в Gooe Drive можно прямо в браузере.
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


7

Gooe Drive можно превратить в отдельную папку в документах см
артфона, планшета или ПК, и ее с
о-
держимое будет синхронизироваться автоматически.

Google Docs



бесплатный онлайн
-
офис, включающий в себя текстовый, табличный процессоры и
сервис для создания презентаций, а также интернет
-
сервис облачного хранения файлов с

функциями
файлообмена. Позволяет создавать и редактировать стандартные документы, таблицы и презентации, а
также поддерживает функции совместной работы над ними.

Google App Engine



сервис хостинга сайтов и web
-
приложений на серверах Gooe. Бесплатно пр
е-
доставляется до 1 Гб дискового пространства, 10 Гб входящего трафика в день, 10 Гб исходящего траф
и-
ка в день, 200 миллионов гигациклов CPU в день и 2 000 операций отправления электронной почты в
день. Приложения, разворачиваемые на базе App Enine, должны

быть написаны на Pyhon, Jv либо Go.
Предлагается набор API для сервисов хранилища dsore API (BiTbe) аккаунтов Gooe, набор API
для загрузки данных по URL, электронной почты и т.д.

Платформа Gooe конкурирует с аналогичными сервисами от Amzon,

которые предоставляют во
з-
можност
ь

размещать файлы и веб
-
приложения, используя свою инфраструктуру. В отличие от многих
обычных размещений приложений на виртуальных машинах, таких как Amzon EC2, платформа App
Engine

тесно интегрирована с приложениями и накладывает на разработчиков некоторые ограничения.

G
oogle
C
loud
S
torage



сервис хостинга файлов, основанный на
IaaS
. Все файлы, которые записыв
а-
ются или перезаписываются на серверы, автоматически шифруются по алгори
тму AES
-
128. Является
конкурентом продукта
Amazon S3.

Amazon
[14]

http://aws.amazon.com

Amazon Simple Storage Service

(Amazon S3)


онлайновая веб
-
служба, предлагаемая Amzon Web
Services, предоставляющая возможность
для хранения и получения любого объема данных, в любое вр
е-
мя из любой точки сети, так называемый файловый хостинг. В марте 2012 года компания Nsuni провела
опыт, в течение которого поочередно передавала массивный объем данных (12 Тб) из одного облачного
с
ервиса в другой [15]. В эксперименте участвовали наиболее рейтинговые облака: Amzon S3, Windows
Azure и Rckspce. К удивлению исследователей, скорость передачи данных сильно отличалась в зав
и-
симости от того, какое облако принимало данные. Самый лучший по
казатель скорости записи данных
оказался у Amzon S3, передача данных из двух других сервисов занимала всего 4

5 часов, в то время
как передача данных в Rckspce заняла чуть меньше недели, а в Windows Azure


40 часов.

Amazon Elastic Compute Cloud

(Amazon

EC2)


веб
-
сервис, предоставляющ
ий вычислительные
мощности в облаке. Он дает пользователям полный контроль над вычислительными ресурсами, а также
доступную среду для работы.
Amazon

EC
2 позволяет пользователям создать Amzon Mchine Ime
(AMI), который бу
дет содержать их приложения, библиотеки, данные и связанные с ними конфигурац
и-
онные параметры, или использовать заранее настроенные шаблоны образов для работы Amzon S3.
Amzon EC2 предоставляет инструменты для хранения AMI. Amzon S3 предоставляет безопас
ное, н
а-
дежное и быстрое хранилище для хранения образов.

Microsoft

[16
]

http
://
www
.
windowsazure
.
com

Microsoft SkyDrive


интернет
-
сервис хранения файлов с функциями файлообмена, созданный и
управляемый компанией
Microsof. Сервис SkyDrive позволяет хранить до 7 ГБ информации (или 25 ГБ
для пользователей, имеющих право на бесплатное обновление) в виде стандартных папок. Пользователи
могут просматривать, загружать, создавать, редактировать и обмениваться документами

Microsoft Office
(Word, Exce, PowerPoin и OneNoe) непосредственно в веб
-
браузере. Присутствует удаленный доступ к
компьютеру, работающему под управлением Windows.

Windows

Azure



платформа облачных сервисов, разработанная Microsof. Реализует модели P
S и
IaaS
. Платформа предоставляет возможность разработки и выполнения приложений и хранения данных
на серверах, расположенных в распределенных центрах данных.



Windows

Azure

Compute



компонент, реализующий вычисления на платформе Windows Azure,
предоставл
яет среду выполнения на основе ролевой модели.



Windows

Azure

Storage



компонент хранилища, предоставляющий масштабируемое хранилище.
Не имеет возможности использовать реляционную модель и является альтернативой (либо дополня
ю-
щим решением) SQL Dbses (S
QL Azure)


масштабируемой «облачной» версией SQL Server.



Windows

Azure

Fabric



по своему назначению является контролером и ядром платформы, в
ы-
полняя функции мониторинга в реальном времени, обеспечения отказоустойчивости, выделения мощн
о-
стей, развертывани
я серверов, виртуальных машин и приложений, балансировки нагрузки и управления
оборудованием.

Платформа Windows Azure имеет API, построенное на REST, HTTP и XML, что позволяет разрабо
т-
чикам использовать облачные сервисы с любой операционной системой,
устройствами и платформами.

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


8

В работе [17] рассмотрены несколько типовых задач и сравниваются их

возможные решения на ка
ж-
дой из платформ


Amazon

EC
2,

Google App Engine,
Windows

Azure
.

Задача 1.

Необходимо отправить в облако на обработку л
окально созданное приложение; причем
приложение, как правило, построенное на базе технологий Jv или .NET, не должно менять свое соде
р-
жание в процессе исполнения.

Задача 2.

Необходимо запустить
w
eb
-
приложение, использующее фоновое обновление данных и
средства балансировки нагрузки.

Задача 3.

Необходимо выполнить в автоматическом режиме без применения интерфейса с пользов
а-
телем прикладную вычислительную задачу с использование методов параллельной обработки.

Задача 4.

Необходимо запустить в облаке прилож
ение, которое взаимодействует с локальной пр
о-
граммой или обменивается данными с клиентским ПК.

Решения на платформе
Amazon
, как правило, базируются на том, что
локальный компьютер рассма
т-
ривается как сервер, входящий в состав общего ЦОД, и вносятся необход
имые изменения в конфигур
а-
цию, либо необходимо создать несколько виртуальных машин в зависимости от требуемого уровня ма
с-
штабирования.

На других вышеупомянутых платформах используют специальные средства динамического масшт
а-
бирования, скриптовые

программы, множество различных API. Часть из них весьма удобны, в других
случаях необходимо прилагать достаточно много усилий для существенной или даже почти полной п
е-
реработки исходной программы.


Еще некоторые крупные поставщики облачных технологий


IBM

SmartCloud
[18
]

http://www.ibm.com/cloud
-
computing/us/en/products.html

Облачное решение, предлагаемое компанией
IBM
, а именно IBM SmrCoud, реализует все три мод
е-
ли (
IaaS
,
SaaS
,
PaaS
) в рамках не только публичного, но частного и гибридного облаков. В его состав
входит облачный сервис, ранее называемый
IBM Lous Live, предоставляющий бизнес
-
приложения по
модели
SaaS
. Содержит полный набор интерактивных сервисов, которые предоставляют м
асштабиру
е-
мые решения для организации защищенной системы электронной почты, проведения
w
eb
-
конференций и
коллективной работы. Сервисы свободны от рекламы и не собирают информацию о клиенте, а также не
являются потребительскими приложениями, нацеленными на
бизнес
-
деятельность. С пользователей вз
и-
мается ежемесячная плата. Элементы управления системой защиты, развернутые для Lous Live, обесп
е-
чивают приватность и управляемый доступ к важной информации при выполнении бизнес
-
операций. Все
клиентские взаимодейств
ия кодируются устойчивыми алгоритмами шифрования и осуществляются по
протоколу SSL для HTTP и через RC2 в протоколе системы мгновенного обмена сообщениями Lous
Smeime. Резервные копии системы шифруются.

Rackspace

Cloud

[19]

http
://
www
.
rackspace
.
com
/
cloud
/

Платформа предлагает набор продуктов для автоматизации хостинга и облачных вычислений, реал
и-
зуется модель
PaaS
. Объединяет

в

себе

Cloud

Files
,
Cloud

Servers
,
Cloud

Sites
.
Благодаря серверной ви
р-
туализации
пользователи получают возможность развертывать сотн
и

облачных серверов одновременно и
создавать архитектуру, обеспечивающую высокую доступность. Является

конкурентом

Amazon Web
Services.

Oracle Exalogic Elastic Cloud

[20
]

http://www.oracle.com/us/solutions/cloud/overview/index.html

Компания
ORACLE

работает над концепцией ПО как услуги на протяжении последних 10 лет. На с
е-
годняшний день компания признан
а одним из ведущих поставщиков ПО, построенного по технологии
облака, и работает с более чем 5,5 миллиона пользователей. Компания
ORACLE

предлагает выбор между
моделями развертывания ПО как с использованием
ее
центров данных и основанными на подписке, так
и
с моделями развертывания ПО на территории компании заказчика.

Для большинства центров данных, переходящих на технологию частных облачных вычислений,
ORACLE

в качестве первого шага предлагает консолидацию вычислительных ресурсов и переход на ра
з-
деляемые и

масштабируемые платформы и инфраструктуру.

Серверное оборудование, выделенное под индивидуальные задачи
middleware
, БД и другие прилож
е-
ния, рассчитано на пиковую нагрузку и обладает зарезервированной мощностью, не используемой п
о-
стоянно. Каждый сервер мож
ет включать практически несовместимые программные компоненты от ра
з-
ных поставщиков ПО, что в ряде случаев увеличивает расходы на поддержку и повышает управленч
е-
ские затраты.

Переход на объединенную архитектуру облачных вычислений
ORACLE

со стандартизирован
ными
разделяемыми приложениями по требованию существенно снижает издержки. Консолидация вычисл
и-
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


9

тельных ресурсов может быть выполнена как на уровне IS, с использованием технологий виртуализ
а-
ции, так и на уровне PS, с помощью стандартизации и объединения

на основе БД и/или middewre а
р-
хитектуры.

Консолидация на уровне PS представляет большую ценность, потому что уменьшает разнородность
ПО, объединяя его на основе стандартизированных программных интерфейсов. Консолидация на уровне
IaaS

может также обеспечить более высокую эффективность разделения аппаратных средств, но ничего
не дает для уменьшения сложности поддержки ПО. Наиболее популярной является консолидация ПО на
уровне БД
ORACLE
, частично объединяющей преимущества
PaaS

и
IaaS
.

Дл
я облачных вычислений компания
ORACLE

предлагает две ключевые технологии: виртуализация
и кластеризация серверов. Виртуализация позволяет легко развертывать новые приложения по требов
а-
нию и является хорошим способом разделения аппаратных средств между зада
чами. Объединение в кл
а-
стеры важно для повышения диверсификации ресурсов между приложениями, тем самым повышая их
доступность и отказоустойчивость.

Платформа ORACLE PS

ORACLE

PS является масштабируемой платформой, общей для всех облачных приложений как

ч
а-
стных, так и общественных центров данных. Платформа
ORALCE

PS основана на БД
ORACLE

и пр
и-
ложениях
Oracle

M
iddewre. Она
дает возможность
различным организациям объедин
я
ть существующее
ПО с использованием общей архитектуры, позволяющей создавать новые

приложения, использующие
существующие возможности ПО для расширения спектра услуг, предоставляемых по требованию.

Платформа
ORACLE

PS предоставляет услуги БД по требованию, основанные на БД
ORALCE

и
аппаратных комплексах
Oracle

Exd, а также услуги П
О Middewre по требованию на основе
Oracle

WebLoic и
Oracle

Exalogic.
Oracle

Exadata


это специализированная машина БД, а
Oracle

Exoic явл
я-
ется машиной, оптимизированной для выполнения приложений
M
iddewre, написанных на языке
JAVA
.
Обе машины масшт
абируемы и отказоустойчивы. Они спроектированы и сконфигурированы для совм
е-
стной работы.

Для разработки новых приложений программисты могут использовать знакомые среды проектиров
а-
ния, такие как
JDeveloper
,
NetBeans

и
Eclipse
, а также сетевые инструменты
We
bCenter

Page

Composer
,

BI

Composer

и
BPM

Composer
. Для взаимной интеграции новых и разработанных ранее приложений

в частных и общественных облаках компания
ORACLE

предлагает
Oracle

SOA
Suite

и
Oracle

BPM
Suite
,
а также
Oracle

D Inerion и
Oracle

GodenGe. Идентификация пользователей и распределение прав
осуществляются с помощью
Oracle

Identity

and

Access

Management
. За взаимодействие пользователей с
облаком отвечает программный комплекс
Oracle

WebCener, который позволяет пользователям осущес
т-
вл
ять совместную работу.

Инфраструктура ORACLE IS

Компания
ORACLE

предлагает набор элементов технологии «Инфраструктура по требованию»
(
IaaS
), в том числе вычислительные серверы, услуги хранения и передачи информации, виртуализацию
ПО, операционные систем
ы и системы управления ПО.

Инфраструктура
ORACLE

IS включает серверы, основанные на технологии SPARC и x86, устано
в-
ленные в стойках и лезвиях (
blads
); технологии хранения на
FLASH
, дисковых массивах и лентах; вар
и-
анты виртуализации
Oracle

VM для x86,
Ora
cle

VM для SPARC и
Oracle

Solaris

Containers
; операционные
системы Orce Soris, Orce Linux, и Orce Enerprise Mner.

Гибкая инфраструктура
ORACLE

IS поддерживает объединение гетерогенных ресурсов, масштаб
и-
руемость, быстрое развертывание и высок
ую доступность прикладного ПО, позволяя эффективно упра
в-
лять общественными и частными IS.

Аппаратные комплексы Orce Exd

Аппаратно
-
программный комплекс, серийно выпускаемый корпорацией Orce, позиционируется как
кластер серверов приложений для орга
низации частных облачных и «эластичных» вычислений. Поста
в-
ляется как предварительно собранный телекоммуникационный шкаф из 42 юнит, наполненный серве
р-
ным и сетевым оборудованием. Аппаратная часть комплекса состоит из одноюнитовых серверов на базе
двух проц
ессоров Ine Xeon с двумя твердотельными накопителями в каждом для операционной сист
е-
мы и свопинга, общей для всех серверов системы хранения данных, коммутаторов InfiniBnd и Eherne.
В последних выпусках X3
-
2 устанавливаются восьмиядерные Sndy Bride ч
астотой 2,9 ГГц, в каждом
узле установлено 256 Гбайт оперативной памяти. Заказчикам комплекса предоставляется выбор из двух
64
-
разрядных операционных систем, возможных к предустановке на узлы кластера: Orce Linux или
Soris (операционная система, разраб
отанная компанией Sun Microsysems, которая сейчас принадлежит
корпорация
Oracle
), а с середины 2012 года доступна возможность установки на узлы гипервизора Orce
VM.

Аппаратные комплексы
Oracle

Exadata

выпускаются в виде стандартных стоек для размещения в
ЦОД. Они состоят из серверов, использующих процессоры
Intel

XEON
, основанные на архитектуре
x
86 и
x
64. В
Oracle

Exadata

используются серверы двух типов: хранения данных и обработки. В качестве моста
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


10

ме
жду серверами используются коммутаторы InfiniBnd и Eherne. Как и любая модульная система,
Or
a-
cle

Exadata

обладает свойством масштабируемости. Аппаратные комплексы
Exadata

выпускаются в н
е-
скольких вариантах, заполненных серверами в зависимости от предпол
агаемой максимальной нагрузки.

Каждый аппаратный комплекс
Oracle

Exadata

содержит предварительно установленное ПО
Oracle

D
a-
tabase

с опцией
Real

Application

Cluster
, позволяющей нескольким физическим серверам работать с ед
и-
ным хранилищем как единая БД без п
рограммных модификаций прикладного ПО.

Архитектура
Oracle

Exadata

основывается на принципах симметричного доступа со всех серверов о
б-
работки ко всем узлам хранения (симметричного параллелизма). Такой подход является компромиссом,
так как ориентирован на OL
TP
-

и OLAP
-
обработку данных одновременно. Поэтому решение компании
ORACLE

не является лидером по быстродействию в узкоспециализированных задачах, но рассчитано на
широкий спектр применения.

Специалисты компании считают, что комплексы
Oracle

Exadata

как нел
ьзя лучше подходят под иде
о-
логию облачных вычислений, так как являются универсальными и не требуют специализированного ПО.

Основатель компании Sesforce.com Марк Бениофф считает, что аппаратно
-
программные комплексы
принципиально не могут решить задачу мас
штабируемости для конечного заказчика по сравнению с и
н-
фраструктурой, предоставляемой как услуга, а также отмечает, что концепция таких комплексов означ
а-
ет фактический возврат к концепции мейнфрейма, утратившей актуальность еще в конце 1970
-
х годов.
Несмот
ря на возможность балансировки нагрузки в рамках нескольких приложений нет возможности
функционирования выше предела вычислительных возможностей комплекса, и конечный заказчик в
ы-
нужден приобретать аппаратные мощности под пиковую нагрузку. Подобного рода кр
итика характерна
для концепции частных облачных вычислений в целом.

В 2010 году
Oracle

открыла собственное публичное облако
Oracle Cloud
, предоставляющее как те
х-
нологическое ПО по модели
PaaS
, так и бизнес
-
приложения по модели
SaaS
.

Salesforce.com
[21
]

http://www.salesforce.com

Система управления взаимоотношениями с клиентами (
CRM
-
система


Customer Relationship
Management
) предоставляется заказчикам исключительно под модели SS. Под наименованием
Force.com
компани
я предоставляет PS
-
платформу для самостоятельной разработки приложений, а под
брендом
Database.com



облачную систему управления БД. В зависимости от уровня подписки досту
п-
ны различные технические возможности. Так, в бесплатной версии
Force.com

подписчик
и могут создать
не более десяти сущностей, а в неограниченной версии с ценой $75 на пользователя в месяц


до 2 000.
Подписчики могут размещать разработанные приложения на платформе Force.com в специальном кат
а-
логе (AppExchne) и предлагать свои разработк
и другим заказчикам, в том числе на коммерческой о
с-
нове.

В качестве системы управления БД платформа
Force.com

использует три реплицируемых кластера
Orce RAC из восьми узлов каждый. Кластеры расположены в трех удаленных друг от друга ЦОД. В о
д-
ной схеме O
rce Dbse обрабатываются данные сразу нескольких компаний
-
подписчиков. Использ
у-
ется стабильная схема данных, предварительно подготовленная к расширению дополнительными объе
к-
тами таким образом, что в одних и тех же таблицах хранятся данные различных по
дписчиков независимо
от различия в специфических атрибутах объектов для различных подписчиков. Широко используется
секционирование таблиц БД.

Parallels
[22]

http://www.parallels.com

Предлагает целый ряд продуктов для автоматизации хостинга и облачных вычислений, основанных
на
IaaS
. Pres Coud Server объединяет в себе Pres Coud Sore, Pres
Virtuozzo

Coniners и
Pres Hypervisor, позволяя значительно повысить наде
жность, производительность и рентабельность
серверов. Pres Coud Sore


это гибкое, масштабируемое решение, помогающее увеличить досту
п-
ность и производительность облачных серверов. Pres
Virtuozzo

Containers


решение для серверной
виртуализаци
и, обеспечивающее высокий уровень плотности и производительности, а также довольно
быстрое выделение ресурсов и динамическое изменение сервис
-
планов. Технология Pres Hypervisor
позволяет самостоятельно создавать виртуальные машины.

Возможность размещать множество клиентов на изолированных друг от друга виртуальных серверах
на одном физическом сервере позволяет сервис
-
провайдерам оптимизировать ресурсы и повышать пр
и-
быль.
PACI

(Parallels Automation for Cloud Infrastructure)


решение,

включающее все необходимое для
предоставления облачных услуг на любой аппаратной платформе. Клиенты могут расширять, сужать и
удалять облачные услуги, распределять нагрузку между несколькими виртуальными машинами или ко
н-
тейнерами и защищать свои данные с
помощью брандмауэров. PACI обеспечивает автоматическую б
а-
лансировку нагрузки и безопасность (включая брандмауэры) для всех виртуальных серверов.



Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


11

Slidebar

[23]

www
.
parking
.
ru

Облачная инфраструктура, предоставляемая в аренду IS. Продвигается под брендом SideBr. Ма
с-
штабируемые в реальном времени виртуальные машины с почасовой оплатой за мощность, измеряемую
количеством арендованных процессорных ядер и объемом предоставленног
о хранилища данных. Допо
л-
нительно клиент может заказать гарантированную мощность процессоров (с учетом всех используемых
ядер). SideBr построен на облачной платформе Prkin Сoud. Платформа использует виртуализацию
аппаратного обеспечения Microsof Hype
r
-
V R2 и кластеризацию для распределения нагрузки, повыш
е-
ния надежности и работоспособности системы. Физически кластеры SideBr размещаются в трех ЦОД
компании Prkin.ru, находящихся в Москве. Все дата
-
центры имеют дублированные каналы связи си
с-
темы энер
гообеспечения, климатические системы, системы пожаротушения и постоянную круглосуто
ч-
ную охрану. Серверы кластеров построены на платформе HP с процессорами Ine серии 5500 и испол
ь-
зуют разделяемое сетевое хранилище (SAN) Cuser Shred Voume. Связь с обла
ком предусматривает н
е-
ограниченный трафик с пропускной способностью до 100 Мбит/сек. (гарантирован
н
о


2 Мбит/сек.).

«Трастинфо»

http://www.tietorussia.ru

Совместное предприятие финской компании Tieo

и российской компании «Ай
-
Теко». Со стороны
Tieo добавлены собственные услуги по управлению операциями и технологии ИТ
-
сервисов. К
ним

отн
о-
сятся управление серверами, предоставление вычислительных мощностей по требованию, услуги связи и
обеспечения безоп
асности данных, средства объединенных коммуникаций и совместной работы, упра
в-
ление приложениями, средства консолидации и оптимизации.

Российское облако предполагается сделать частью глобальной облачной сети Tieo, которая включает
Санкт
-
Петербург,
Хельсинки, Стокгольм, Осло и Копенгаген. Заказчикам буд
у
т гарантирован
ы

межд
у-
народный уровень качества услуг и доступ к сервисам и ресурсам Microsof, Cisco и EMC. ЦОД «Тр
а-
стинфо» имеет общую площадь 3000 м
2
, количество стоек


800, среднее энергопотреблен
ие на стойку


5 кВт, пропускная способность волоконно
-
оптических линий связи до 10 Гбит/сек.


Опыт удачного применения готовых облачных решений


Первые проекты по внедрению Windows Azure в крупных российских ИТ
-
компаниях компанией
M
i-
crosoft

были представл
ены журналистам [24]. Так, известный разработчик электронных словарей и си
с-
тем оптического распознавания текста компания
ABBYY

открыла OCR
-
сервис FineReder Onine на
платформе Windows Azure. Пользовательская аудитория FineReder Onine

составляет примерно 250 тыс.
человек. Согласно оценке самой компании ABBYY, миграция на облачную платформу Microsof позв
о-
лит сократить расходы на поддержку сервиса в полтора раза. Платформу Windows Azure активно осва
и-
вает также компания
«Медиалогия»



ра
зработчик первой в России автоматической системы монит
о-
ринга и анализа СМИ в режиме реального времени. Она разрабатывает системы анализа в Интернете
российских и зарубежных блогов и СМИ с последующим предоставлением своим заказчикам монит
о-
ринга по темам и
ключевым словам. Ее заказчиками являются большинство федеральных и регионал
ь-
ных органов власти, а также крупнейшие корпорации. Как подчеркнул Фарит Хуснояров, директор по
развитию компании «Медиалогия», этот бизнес является высокотехнологичным и высококонк
урентным,
поскольку медиапространство непрерывно развивается и совершенствуется. Перед компанией стоят з
а-
дачи постоянного вывода на рынок новых продуктов и доработка уже существующих. Например, «М
е-
диалогия» разработала специализированное решение, предназна
ченное для мониторинга блогов, где, как
известно, наблюдается наибольшая протестная активность, при этом требуется более высокая интенси
в-
ность обновления информации, ведь блоггеры во многих случаях значительно оперативнее журналистов.
Данная система была п
олностью создана на базе Windows Azure, и, по словам Фарита Хусноярова, срок
вывода этого решения на рынок был сокращен в 2

3 раза по сравнению с традиционными способами
разработки. Помимо системы мониторинга блогов, на базе Windows Azure были созданы агре
гатор зар
у-
бежных СМИ и другие решения «Медиалогии», выпущенные в текущем году.

В Санкт
-
Петербургском национальном исследовательском университете информационных технол
о-
гий, механики и оптики под руководством Бухановского А.В. разрабатывается облачная платф
орма
CLAVIRE для обработки данных больших объемов. В основном платформа используется для обработки
большого объема данных, получаемых в
процессе

наблюдений, экспериментов и математического мод
е-
лирования на основе численных методов или компьютерной графики.

Далее приведены ключевые ос
о-
бенности платформы CLAVIRE, определяющие ее архитектуру и функциональные характеристики [25].

1.

Имеется предметно
-
ориентированный язык EsyPcke, который позволяет описать использу
е-
мые прикладные пакеты и источники данных, проц
едуру их вызова, передачу параметров и использу
е-
мые форматы данных.

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


12

2.

Имеется предметно
-
ориентированный язык EsyFow, который позволяет описать сложное (ко
м-
позитное) приложение в форме workfow.

3.

Описанное на предметно
-
ориентированных языках композитное прил
ожение может быть зап
у-
щено в среде облачных вычислений, тем самым получая в автоматическом режиме доступ к интегрир
о-
ванным в нее ресурсам: вычислительным сервисам, источникам данных.

4.

Динамическое планирование выполнения композитного приложения позволяет до
биться улу
ч-
шения производительности с использованием детерминированных и стохастических параметрических
моделей времени выполнения.

5.

Вычислительные ресурсы, различающиеся архитектурой, режимом доступа, набором доступных
сервисов, интегрируются в рамках комп
озитного приложения и вызываются в автоматическом режиме.

6.

Высокоуровневый графический интерфейс предоставляет пользователю возможность работы с
системой с использованием понятий соответствующей предметной области.

7.

Использование экспертных знаний позволяет
обеспечить интеллектуальную поддержку работы
пользователя на протяжении всего процесса использования системы.

8.

Динамический доступ к интегрированным источникам данных и технологическим средствам в
и-
зуализации позволяет реализовать средства визуализации, начи
ная от простого построения графиков до
интерактивных систем виртуальной реальности.

Популярный в Интернете сервис для хостинга слайдов
SlideShare

реализовал переконвертацию н
е-
скольких миллионов накопленных документов из
Flash

к формату
HTML
5 при помощи вир
туальных
серверов компани
и

Amzon [26]. Причин для апгрейда три. Во
-
первых, презентации на HTML5 отобр
а-
жаются на всех устройствах, включая смартфоны/планшеты iPhone/iPd и Android, и на десктопе


и это
один и тот же файл. Таким образом, уменьшается объем
данных на хостинге. Во
-
вторых, документы ст
а-
ли на 40 % компактнее и загружаются на 30 % быстрее. В
-
третьих, документы теперь индексируются п
о-
исковыми системами. Текст без проблем выделяется мышкой и копируется, что всегда было затрудн
и-
тельно с Fsh.

Т
ехно
логии HP сыграли ключевую роль в создании многих кинокартин компании
DreamWorks
,
включая серию фильмов «Шрек», ленты

«Кот в сапогах», «Как приручить дракона», «Кунг
-
Фу Панда» и
«Кунг
-
Фу Панда 2», говорится в заявлении компании [27]. Чтобы обработ
ать

больши
е

объем
ы

данных,
необходимых для производства, например, фильма «Кот в сапогах», DremWorks внедрила облачные
сервисы HP, что позволило избежать наращивания собственных технических ресурсов, на которое, с
о-
гласно оценкам, потребовались бы миллионы долларов.

8 млн часов рендеринга из затраченных в общей
сложности 63 млн часов были выполнены с помощью облачных сервисов HP. На долю рендеринга пр
и-
шлось 45 % от общего объема использования облачных сервисов киностудией. Также решения HP заде
й-
ствованы в построении
масштабируемой 10
-
гигабитной сетевой среды DremWorks, состоящей из гл
о-
бальной и локальной сетей. Это семейство HP Neworkin: коммутаторы серий HP 12508 и 5800, а также
системы HP Neworkin Ineien Mnemen Cener и HP Ineien Resiien Frmewo
rk. Кроме того, в
DremWorks используется сетевая система хранения HP X9000 IBRIX, которая позволяет наращивать
емкость в соответствии с нынешними и будущими потребностями киностудии.

Опыт компании Microsof

В многочисленных докладах Фабрицио Гальярди

[28], имеющихся в сети Интернет (около 20 докл
а-
дов), четко выражена позиция компании Microsof относительно дальнейшего развития облачных вычи
с-
лений и дается информация о ведущихся проектах.

1.

Облачные вычисления станут мощным средством для вычислительной н
ауки, удалят некоторые
традиционные препятствия,
с
низят стоимость доступа к массивным вычислениям и обработке данных.

2.

Облачные вычисления дадут возможность простого использования вычислительных ресурсов для
людей, не являющихся учеными, и для отдаленных ин
ститутов в менее развитых странах.

3.

Это хорошая платформа для сохранения и распространения научных данных.

4.

Доступность информации для финансирующих структур и общественности, что было продемо
н-
стрировано в проекте, объединяющем ЕС и Бразилию.

5.

Корпорация Mic
rosof Reserch доступна для советов и поддерживает экспериментальный доступ к
этой технологии.

6.

Microsof Reserch настроена на взаимодейств
ие с заинтересованными учеными

России.

Облака основываются на больших центрах по сбору данных. В таблице 1 показано
местонахождение
наиболее важных центров данных некоторых компаний [29], а на рисунке приведена фотография центра
данных компании Microsof в Чикаго.

Таблица 1


Компания

Google

Apple

Microsoft

Yahoo

Местонахождение

Lenoir, TN

Apple, NC

Chicago, IL

La Vista
, NE

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


13

В [30] дана достаточно подробная информация о центрах данных компании Gooe.
На момент нап
и-
сания публикации у Gooe было19 центров в США, 12 в Европе, один в
России, один в Южной Америке
и 3

в Азии. В действительности Gooe иногда арендует место в центрах данных других компаний.

Специалисты компании
Microsof отмечают, что в

настоящее время необходимо провести научные
исследования и сделать детальный экономический анализ деятельности для
малого центра данных (1 т
ы-
сяча серверов) и для большого (100 тысяч серверов). Изображенный на фотографии центр данных имеет
размер в 11,5 раза больше размера футбольного поля, и можно только догадываться, сколько в нем с
о-
средоточено серверов.

Главные мотив
ы развития центров данных

1.

Высокая экологическая совместимость с внешней средой.

2.

Эффективное использование энергии.

3.

Адаптивное управление системами.

4.

Возможность сосредоточить до 100 тысяч серверов.

5.

Включение аппаратных средств не позднее, чем через неделю п
осле поставки.

6.

Запуск ПО не позднее, чем через несколько часов.

7.

Живучесть во время отключения энергии или бедствия.

8.

Большой набор ПО и услуг.

9.

Непрерывная коммуникация, безопасность, надежность, производительность.

Некоторые наиболее важные исследовательские центры Microsof Reserch в Европе, в которых
ведутся исследования по облачным вычислениям
:
Barcelona

Supercomputing

Centre
,
Объединенный
центр
Microsoft

Research

и
INRIA
,
The

Microsoft

Research



University

of

Trento

Centre

for

Computational

and

Systems

Biology

(
CoSBi
).

Компания Microsof Reserch подписала большое количество соглашений с партнерами в Европе,
Азии и Латинской Америке по развитию облачных вычислений. Например, в рамках Европейского пр
о-
екта Viru
l multidisciplinary EnviroNments USing Cloud infrastructures (VENUS
-
C) подписано Европейско
-
Бразильское соглашение Open D nd Coud Compuin e
-
Infrastructure for

Biodiversity
(EUBrazilOpenBio)
, направленное на изучение биомногообразия, в нем также учас
твует Microsof
Reserch. Проект VENUS
-
C стремится поддерживать пользовательские сообщества посредством разв
и-
тия легких в использовании услуг, чтобы стимулировать разработку успешных облачных приложений.


Обработка больших объемов данных и некоторые задачи


В настоящее время для моделирования данных в различных предметных областях широко использ
у-
ются графы, позволяющие отобразить взаимные отношения объектов. Постоянно увеличивающиеся об
ъ-
емы данных этих приложений приводят к необходимости использовать масштабируемые платформы и
параллельные вычислительные архитектуры, позволяющие эффективно обрабатывать очень большие
массивы данных, возникающих в связи с анализом графов. Облачные вычислени
я применяются для р
е-
шения задач, связанных с графами, в ряде предметных областей: семантический поиск [31], социальные

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


14

сети, базы знаний, моделирование фотонных кристаллов [32], поиск последовательностей ДНК [33] и т.д.
Вопросам эффективного хранения и обр
аботки данных в системах такого рода посвящено немало работ
[34

36].
И
меется
также много

проблем, прямо не связанных с графами. Рассмотрим некоторые задачи,
возникающие перед разработчиками облачных сервисов и перед
использующими их
специалистами.


Задачи
распределения и использования ресурсов


При организации вычислительных процессов в сетях с облачной инфраструктурой объектами явл
я-
ются виртуальные машины, сервисы, программы, наборы данных, заявки; позициями


в
ычислительные
узлы, устройства памяти, места
в очередях на исполнение. При этом рассматривается ряд количестве
н-
ных характеристик: интенсивность поступающих запросов и степень загрузки центральных устройств,
интенсивность межмашинного взаимодействия через сетевые адаптеры и др. Могут также учитываться

характеристики индикаторного типа, например, наличие необходимого пакета на данном вычислител
ь-
ном узле [37]. Далее возникают, вообще говоря, оптимизационные задачи на графах, связанные с распр
е-
делением и использованием ресурсов и составлением расписаний.
Например, необходимо решить зада
н-
ную прикладную задачу и при этом минимизировать сумму трафика между всеми парами узлов облака
[36]. Для решения возникающих задач используют различные, как правило, приближенные, методы: о
п-
тимизационные, основанные на теори
и игр, статистические, машинного обучения [38].


Модель вычислений MpReduce


MapReduce


модель распределенных вычислений, предложенная компанией Gooe, используемая
для параллельных вычислений над очень большими объемами данных. Точнее, MpReduce


это
фрей
м-
ворк для организации вычислительных процессов на распределенных системах, содержащих большое
количество компьютеров, называемых нодами. Работа MpReduce состоит из двух шагов: Mp и Reduce.
На Mp
-
шаге происходит предварительная обработка входных данн
ых. Для этого один из компьютеров,
называемый главным узлом (mser node), получает входные данные задачи, разделяет их на части и п
е-
редает другим компьютерам, называемым рабочими узлами (worker node), для предварительной обрабо
т-
ки. На Reduce
-
шаге происход
ит «свёртка» предварительно обработанных данных. Главный узел получает
ответы от рабочих узлов и на их основе формирует результат, то есть решение задачи. В рамках данной
парадигмы были реализованы алгоритм Дейкстры нахождения кратчайшего пути в графе, раз
личные а
л-
горитмы нахождения значимых вершин в графе, метод ближайшего соседа, алгоритм байесовской кла
с-
сификации и др. [39

42].


Защита облачной инфраструктуры


В облачной информационной среде возникают многочисленные проблемы информационной безопа
с-
ности:
распространени
е

вредоносного ПО, его обнаружени
е
, выявлени
е

ПО, не являющегося вредоно
с-
ным, но содержащим в себе ошибки, которые могут привести к возникновению деструктивных проце
с-
сов
[43].
Для решения возникающих задач обычно используются существующие реш
ения: антивирусное
ПО, системы обнаружения вторжений, системы предотвращения вторжений.

Однако в силу большого количества вычислительных узлов и больших объемов информации, цирк
у-
лирующей в среде, а также ввиду неоднородности (например многоплатформенности
) среды все задачи
существенно осложняются. Например, сигнатурные методики затруднительно применять для облачных
вычислений в средах, использующих различные программно
-
аппаратные платформы. Даже в случае, к
о-
гда вредоносные алгоритмы будут одинаковы
ми
, их р
еализации на различных платформах будут разл
и-
чаться. Таким образом, приходится хранить целый набор сигнатур. Статистические методы требуют
слишком много информации о вычислительных узлах и программных интерфейсах. В частности, для к
а-
ждой платформы необходи
мо иметь свой набор статистических данных. То есть возникающие задачи в
принципе решаемые, но значительно усложняются в связи с мультиплатформенностью.


Обеспечение надежности работы множества серверов


Очевидно, что в распределенной системе отдельные
серверы могут выходить из строя, поэтому нео
б-
ходимо иметь средства, позволяющие восстанавливать потерянную информацию. Простое дублирование
(реплицирование) данных


это далеко не лучший способ. Более удобно использовать коды, коррект
и-
рующие ошибки.

Предпо
ложим, что в нашем распоряжении имеется
n

серверов
,

S
1
, …,
S
n

,

и на
k
-
м сервере хранится
слово
w
k

в бинарном алфавите. Считаем, что длины этих слов равны
|
w
1
|  …  |
w
n
| =
m
. Далее обозначим
w
ki

i
-
ю букву в слове
w
k
.

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


15

Рассмотрим теперь слово
W
i

=
w
1
i



w
ni

длины
n
. Применим к нему код Хэмминга. При этом так н
а-
зываемые проверочные символы будем приписывать справа. Поэтому можно написать, что
K
(
W
i
) =
W
i

c
1
i


c
ri
, где
c
1
i
,

…,

c
ri



проверочные символы.

Задействуем дополнительные серверы
. При этом на сервере
S

t

будем хранить слово
C
t

=
c
t
1



c
tm
. Все сказанное иллюстрирует таблица 2.

Таблица 2


Сервер

S
1

S
2



S
n

S

1



S

n


Данные

w
1

.

.

.

w
1
m


w
21

.

.

.

w
2
m


.

.

.


w
n
1

.

.

.

w
n
m


c
1
1

.

.

.

c
1
m


.

.

.


c
r
1

.

.

.

c
rm



Можно сказать, что код Хэмминга «работает» внутри каждой строки таблицы. Ясно, что выход из
строя любого из
N

=
n

+

r

серверов не приведет к потере данных. Мы можем их восстановить, действуя
по каждой строке в соответствии с кодом Хэмминга. Очевидно, что д
ля восстановления данных при в
ы-
ходе из строя большего количества серверов необходимо использовать коды, исправляющие большее
количество ошибок. Выигрыш очевиден, так как для такого рода кодов число
r

мало по сравнению с чи
с-
лом
n
. Например, для кода Хэмминг
а
r



log
2
n
. На основе этих идей в Институте систем информатики им.
А.П. Ершова СО РАН
(г. Новосибирск)
Мигинским Д.С. ведутся работы по созданию хранилища да
н-
ных, предназначенного для хранения больших объемов генетической и другой информации.


Гомоморфные коды


Гомоморфное шифрование



это форма шифрования, позволяющая производить определенные мат
е-
матические действия с зашифрованным текстом и получать зашифрованный результат, который соотве
т-
ствует результату операций, выполняемых с открытым текс
том. Обычно рассматривают операции

сложения и умножения. Частично гомоморфные криптосистемы


это такие криптосистемы, которые г
о-
моморфны относительно только одной операции (сложения или умножения). Например, коды
RSA

и
Эль
-
Гамаля гомоморфны относительно
операции умножения. В 2009 году Крейгом Джентри из комп
а-
нии IBM был предложен полностью гомоморфный код [44], то есть код, гомоморфный для операций у
м-
ножения и сложения одновременно. Очевидно, что гомоморфные коды естественно использовать в о
б-
лачных средах
. Однако при повышении уровня безопасности размер зашифрованного текста стрем
и-
тельно растет, что затрудняет применение метода Крейга Джентри на практике. Тем не менее, компания
IBM выпустила свободную криптографическую библиотеку HEib с поддержкой гомомор
фного шифр
о-
вания [45].


Идентификация спам
-
страниц


Наглядным примером использования крупномасштабного графа является задача идентификации
спам
-
страниц

в поисковых сервисах сети Интернет. Поскольку для определения страниц, содержащих
спам, требуются большие вычислительные возможности, разумно пытаться решить данную задачу п
о-
средством облачных технологий. Например, в работе [46] проблема идентификации спа
ма представлена
как задача бинарной классификации с обучаемым классификатором. Поскольку разделение нормальных
web
-
страниц и страниц, содержащих спам, является линейно неотделимой проблемой, в упоминаемой
работе предлагается применять «алгоритм с мягким за
зором для метода опорных векторов» (
S
oft
m
argin
SVM


Soft

margin

Support

Vector

Machines
). Для реализации алгоритма была выбрана распределенная
вычислительная платформа
Hadoop
, а точнее HDFS (распределенная файловая система) и Hdoop
MpReduce (фреймворк
для реализации MpReduce
-
вычислений).
HDFS



Hadoop

Distributed

Filesystem



принадлежит Apche Sofwre Foundion, имеет открытый исходный код, предоставляет пользователям
прозрачную низкоуровневую распределенную инфраструктуру. Инфраструктура
MapReduce

разработана
компанией
Google

и имеет открытый исходный код реализации. На основе принципов
MapReduce

п
о-
строена
Hadoop

MapReduce
.



В алгоритме
S
oft
m
rin SVM целевая функция для линейного классификатора [46] имеет вид

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


16

,

где




параметр;
|
|
w
||
2

=
w



w



классификационный интервал.

К целевой функции предлагается добавить регуляризационный фактор

,

где

ij



вес ссылки со страницы
i

на страницу
i
;




штрафная функция.

Причем эта штрафная функция связана со структурой ссылок между страницами. Если рассматривать
страницы в качестве вершин графа, а связи между страницами в качестве ребер, можно учесть тот факт,
что спам
-
страницы часто ссылаются на нормальные страницы в цел
ях повышения доверия, в то время
как нормальные страницы в большинстве своем не ссылаются на страницы со спамом. Поэтому в качес
т-
ве штрафной функции в рассматриваемой работе была использована функция вида


(
s
,
t
) =
max
(0, |
s



t
|)
.

Процесс идентификации сп
ам
-
страниц с использованием Hdoop MpReduce можно описать следу
ю-
щим образом.

На Mp
-
шаге происходит предварительная обработка входных данных. Для этого один из компьют
е-
ров (называемый главным узлом


mser node) получает входные данные задачи, разделяет
их на части и
передает другим компьютерам (рабочим узлам


worker node) для предварительной обработки. Так, на
Map
-
шаге каждый документ разбивается на слова и возвращаются пары

key
,
value

, где ключом являе
т-
ся само слово, а значением имя документа. Если в

документе одно и то же слово встречается несколько
раз,
после

предварительной обработки данного документа будет столько же пар, сколько раз встретилось
это слово. Все пары с одинаковым ключом объединяются и передаются на вход функции
reduce
.

На
Reduce
-
шаге происходит свертка предварительно обработанных данных. Главный узел получает
ответы от рабочих узлов и на их основе формирует результат


решение задачи, которая формулиров
а-
лась изначально. В данном случае функция
reduce

складывает все пары с одинаковым ключом и таким
образом получает общее количество вхождений конкретного слова во все документы коллекции.

Предобработка текста, вычисление веса векторов и этап классификации осуществляются на платфо
р-
ме
Hadoop

и адаптированы

к инфраструктуре
MapReduce

для повышения эффективности при параллел
ь-
ных вычислениях.

Адаптированная векторная модель (
VSM



Vector

Space

Model
) позволяет представлять коллекции
документов векторами из одного общего для всей коллекции векторного пространст
ва.

Более формально алгоритм можно описать следующим образом. Текст можно представить в виде

n
-
мерного вектора
d

= (
w
1
,
w
2
, …,
w
n
)
, где
w
i

(
i

 1, 2, …,
n
)

обозначает вес
i
-
го термина (слова). В работе
[46] для вычисления веса термина в векторной модели применялся алгоритм
TFIDF

(
T
erm
F
requency

I
nverse
D
ocument
F
reuency), описываемый формулой

w
ij

=
tf
ij

idf
i
,

где
tf
ij



нормализованная частота термина, то есть нормированно
е количество появлений слова в док
у-
менте (
Normalized

Term

Frequency
);
idf
i



логарифм от обратной частоты документа относительно данн
о-
го слова, то есть величина, обратная количеству документов, которые содержат конкретное слово
(
R
everse
D
ocument
F
requency
).

Нормализованная частота терма
tf
ij

вычисляется по формуле

,

где
f
ij



количество вхождений терма
t
i

в документ
d
j
;
|
d
j
|



общее количество слов в документе.

Обратная частота документа
idf
i

вычисляется по формуле

,

где
N



общее количество документов в коллекции;
df
i



количество документов, содержащих слово
t
i

по
крайней мере один раз.

В итоге процесс вычисления величин
tf
ij

и
idf
i

сводится к вычислениям больших объемов данных, п
о-
этому было предложено адаптировать модель программирования
MapReduce
. Например, процесс нахо
ж-
дения величины
f
ij

можно записать в следующем виде:

Mapper
:
Label
,
contents



(
Label
,
token
), 1�

Reducer
: (
Label
,
token
),
list

(1)�


(
Label
,
token
),
f
ij

.

Здесь
token



каждое отдельно взятое слово документа;
Label



имя просматриваемого документа;
contents



текст просматриваемого документа.

На стадии классификации
web
-
страниц происходит разделение файлов согласно их размерам,
Mapper

и
Reducer

завершают задачу параллельно. Алгоритм позволяет улучшить точность распознавания и с
о-
кратить время отклика.

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


17


Поиск информации


Еще один яркий пример применения облачных технологий


организация поиска. Например, в работе
[47] рассматривается задача
нечеткого поиска по ключевым словам в зашифрованных данных.

Основная идея безопасного нечеткого поиска по ключевым словам заключается в использовании двух
этапов: построение нечеткого множества ключевых слов и разработка эффективного и безопасного алг
о-
ритм
а поиска.

Построение нечеткого множества слов
w
t

на основе подстановки с фиксированным расстоянием
d

обозначим
, где

означает набор слов
w

t

с шаблоном

. Например, для сл
о-
ва
CASTLE

при
d

= 1

нечеткое множество ключевых слов, построенное на основе подстановки, будет

S

CASTLE
, 1

= {
CASTLE
, *
CASTLE
, *
ASTLE
,

C
*
ASTLE
,

C
*
STLE
,

…,
CASTL
*
E
,
CASTL
*,
CASTLE
*
}
.

Точнее


речь идет об окрестности определенного радиуса данного слова. При этом рассматривается метрика Л
е-
венштейна. Шаблоны используются для краткого описания множества слов, входящих в окрестность.

В общем случае для заданного ключевого слова
w
i

с длино
й
l

размер множества

при прямом
подходе (то есть при перечислении всех слов, входящих в данное множество) будет равен
(
2
l

+ 1
)

26

+
1
, в то время как при подходе с использованием шаблонов получается
2
l

+ 1 + 1
, что намного
меньше.
Предложенный алгоритм позволяет значительно сократить место для хранения индексов, которые потр
е-
буются при поиске: вместо 30 Гб необходимо примерно 40 М.

Схему нечеткого поиска по ключевым словам можно описать следующим образом.

1. Для построения и
ндекса слова
w
i

с расстоянием
d

владелец данных сначала строит нечеткое мн
о-
жество ключевых слов
, используя технику, основанную на подстановке. Затем вычисляет множес
т-
во так называемых люков

для каждого

с секретным ключом
sk
, известным только вл
а-
дельцу данных и авторизованному пользователю. Владелец шифрует данные. Таблица индексов и з
а-
шифрованные файлы с данными передаются в облачный сервер для хранения.

2. Поиском по
(
w
,
k
)

ав
торизованный пользователь вычисляет множество так называемых люков
, где

s
w
,
k

также получено при построении нечеткого множества на основе подстановки. Затем он
отправляет

на сервер.

3. При получении поискового запроса в виде набора люков

сервер отыскивает их в таблице
индексов и возвращает все возможные идентификаторы зашифрованных файлов согласно определению
нечеткого ключевого слова. Пользователь дешифрует

полученные результаты и извлекает интересующие
его файлы.

В некоторых случаях точный поиск по ключевым словам в зашифрованных данных оказывается ни
з-
коэффективным и может не удовлетворять пользователей, поэтому в облачных технологиях целесоо
б-
разно применят
ь технологии, сохраняющие конфиденциальность ключевых слов. В связи с этим и во
з-
никает задача нечеткого поиска. В работе [47] предложена техника построения нечетких множеств кл
ю-
чевых слов, основанная на подстановке в шаблоны, которая может быть применена д
ля эффективного
удаленного хранения данных и эффективной схемы поиска зашифрованных данных в облаке.


Тенденции развития облачных технологий


Таким образом, облачные вычисления можно рассматривать как новый подход, который даст мо
щ-
ный импульс дальнейшему
развитию информационных технологий и вычислительных наук. Отметим,
что распределенные и параллельные вычисления в Европе и Америке были поддержаны в широких ма
с-
штабах. Например, за последние 10 лет в Европе в распределенные и параллельные вычисления было
в
ложено свыше 1 миллиарда евро. В настоящее время в Европе развивается проект
VENUS
-
C
, который
финансируется, чтобы более детально выявить возможности использования облачных вычислений для
исследований и в промышленности.

Предшественниками облачных вычислен
ий принято считать многочисленные и широко известные
технологии, такие как ресурсные вычисления, rid
-
вычисления, виртуализация, гипервизоры и многое
другое [4, 48]. Сервис
-
ориентированная архитектура (
S
ervice
-
Oriented Architecture


SOA
) также сыграла
важ
ную роль в развитии облачных вычислений. Облачные вычисления являются в некотором смысле
расширением SOA
-
приложений. В последнее время с
SOA

наравне с
Web

2.0 более тесно связывают те
х-
нологию мэшапов (
Mashup
). С технической точки зрения мэшап


это
w
eb
-
при
ложение, которое объед
и-
няет в один интегрированный инструмент данные, полученные из нескольких источников. Известными
примерами мэшапов являются
w
eb
-
сервисы, использующие картографические данные Gooe Mps.

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


18

Однако это далеко не единственное направление ра
звития мэшапов. Дальнейшее совершенствование
связано с методами получения агрегированной информации из сети


w
eb
-
потоки (RSS, Aom) [17].
Многое делается в развитии методов ускоренного разбора HTML
-
страниц, когда от задачи требуется не
получение макета с
траницы, а выборка определенной информации, представленной там. Интересны эк
с-
перименты с мэшапами, которые проводятся с использованием API для доступа сразу к нескольким са
й-
там. В связи с этим часто упоминают об интегрированной выборке информации с сайтов
Amazon, eBay,
Fickr, Gooe, Microsof, Yhoo, YouTube. Еще один пример


недавно открытые API для российского
почтового портала Mi.ru. Подобные приложения позволяют активно использовать российский инфо
р-
мационный контент с переходом к облачным моделям в
ычислений.

Основная цель предприятий и поставщиков, осваивающих облачные решения [4], заключается в том,
чтобы обеспечить предприятию ИТ
-
инфраструктуру как услугу. Опыт, накопленный при интеграции и
предоставлении корпоративных приложений как отдельных усл
уг, сегодня пытаются применять и при
организации уровней инфраструктуры. Предполагается, что
ПО

и физическая инфраструктура, как и
приложения в SOA, должны быть доступными для обнаружения, управляемыми и регулируемыми. Ест
е-
ственно, возникает необходимость
создания специальных стандартов, которые описывали бы, как обн
а-
руживать, потреблять, администрировать и регулировать услуги. Открытые стандарты имеют ключевое
значение для получения максимальной мощности и гибкости от использования облачных технологий [4].

И хотя в настоящее время разработка новых стандартов еще продолжается, часть новых технологий н
а-
ходится на стадии активного внедрения. Например, для взаимодействия с облачными сервисами сейчас
действует стандарт, предусматривающий использование браузеров
на стороне клиента, которые подде
р-
живают технологию AJAX. Их работа в автономном режиме должна соответствовать открытой специф
и-
кации HTML5.

Сегодня существует масса технологий, обеспечивающих решения на основе облачных вычислений.
Если несколько лет назад
их было трудно реализовать из
-
за отсутствия всеобъемлющих, понятных инс
т-
рументов, таких как средства для упаковки и развертывания приложения в облачной инфраструктуре или
привязки к инфраструктуре поставщика облака, то сейчас существуют стандарты, которые
призваны
обеспечить всеобщую поддержку средств виртуализации. Открытым стандартом для работы в облачной
среде является OVF (Open Viru Mchine Form). Он описывает предъявляемые к поставщикам вирт
у-
альных услуг требования по упаковке и развертыванию вирт
уальных объектов, передаваемых клиентам
облачных сервисов. Важно отметить, что OVF не накладывает ограничений на выбор гипервизора или
применение определенной процессорной архитектуры. Это делает его открытым для платформ от разных
поставщиков, что нашло п
одтверждение в полной поддержке предварительной версии OVF, оказанной
практически всеми основными поставщиками средств виртуализации: De, HP, IBM, Microsof, VM
W
are
и XenSource.

Облачный стандарт также не ограничивает выбор программных решений, которые м
огут применяться
для работы. Современный набор решений называют LAMP (акроним от Linux, Apche HTTP Server,
MySQL и Per/PHP/Pyhon); обмен данными выстраивается на технологиях XML и JSON (текстовый
формат обмена данными, основанный на JvScrip), для раб
оты с
w
eb
-
сервисами предусматривается и
с-
пользование REST (
R
E
presentational State Transfer
). Эта технология описывает подход, когда для работы
с данными должен применяться достаточно узкий набор стандартных форматов. Тем самым строго огр
а-
ничивается разнообр
азие методов взаимодействия между объектами и снижается сложность задейств
о-
ванных протоколов [17].

Важными являются стандарты, обеспечивающие работу прикладных программ: поддержку коммун
и-
кационных функций на базе HTTP и XMPP (Exensibe Messin nd Prese
nce Prooco, открытый комм
у-
никационный протокол для ПО класса Middewre, основанный на XML), средства безопасности (OAuh,
OpenID, SSL/TLS) и агрегирования при передаче данных (Aom).

Для разработки ПО и тестирования необходимо приобретать, разворачивать
, настраивать и содержать
среду для выполнения тестирования. Ясно, что для быстрого создания и размещения такой среды как раз
подходят облачные вычисления. В этом случае для групп разработчиков упрощаются непрерывная инт
е-
грация кода и процесс обновления пр
одукта. Группы тестирования могут уделять больше времени пр
о-
верке качества программного продукта и меньше заниматься организаци
ей

процесса тестирования.

Для групп разработчиков, помимо готовой среды исполнения, облако дает еще одно преимущество
:

о
но может
предложить такую разновидность SS, как инструменты как услуги. Вследствие этого инте
г-
рированная среда разработки (
IDE



Integrated
D
evelopment Environment
) и простые редакторы кода ст
а-
новятся хостируемыми программами, доступными любому разработчику в люб
ое время. Это исключает
потребность в локальных средах разработки и, соответственно, в лицензиях на каждую машину, что, н
е-
сомненно, удобно.

Существует еще один фактор влияния облачных вычислений на разработчиков. Для того чтобы о
б-
легчить понимание и подде
ржку исходного кода, упростить взаимодействие между разработчиками при
создании одного и то же программного обеспечения, создаются стандартные интерфейсы прикладного
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


19

программирования (
API
). Конечно, разработчики стремятся придерживаться стандартов, но в не
которых
случаях нестандартные API дают определенную выгоду в производительности. В облаке же любые о
т-
клонения от стандартных API особенно опасны. Потребители знают, что получают услуги от поставщика
облака, но могут не знать деталей реализации этих услуг.
Таким образом, преимущество облачных те
х-
нологий


в универсальности решения. Но вместе с тем это достоинство оборачивается некоторым н
е-
удобством для разработчиков.

Как уже отмечалось ранее, слабым местом облачных технологий является безопасность информаци
и.
До сих пор стандартизация в этой области отсутствует. Это привело к тому, что каждый разработчик о
б-
лачной платформы выбирает сегодня собственную модель обеспечения безопасности. Например, для
Amzon EC2 и Eucypus (решение Open Source с целью создания

частного облака) применяются пары из
сертификатов X.509 и персональных ключей для аутентификации; в Gooe App Enine используется
предварительная аккредитация через Gooe Accouns.

В результате возникшей разнородности пока наблюдаются трудности при обес
печении взаимодейс
т-
вия решений, построенных в разных облачных платформах. Одновременно это сдерживает внедрение
новых функций защиты. Необходимость решения этих вопросов послужила причиной для создания в
2010 году рабочей группы Open Coud Compuin Inerf
ce (OCCI) Workin Group, которая занимается
разработкой стандартов в этой области. Сейчас ее деятельность затрагивает также выпуск стандартиз
и-
рованного набора допустимых операций, а также предоставление полной спецификации на процедуры
аутентификации с пр
именением стандартных для HTTP механизмов и средств шифрования на базе кри
п-
тографических протоколов SSL/TLS.

Таким образом, можно выделить четыре направления, которые необходимо развивать для обеспеч
е-
ния безопасности построения облачного ЦОД:



безопасное
хранение данных в облачных хранилищах;



безопасное исполнение заданий;



безопасная передача данных;



безопасный доступ к данным.

Однако, как можно заметить, облачные технологии имеют больше преимуществ, чем недостатков.

К тому же нельзя не учитывать со
временные тенденции развития ИТ
-
индустрии, в которых все больше
просматривается необходимость обращаться к облачным вычислениям
,

несмотря на отставание систем
защиты информации.

Создание новых стандартов, в том числе для обеспечения безопасности облачных т
ехнологий, на с
е-
годняшний день является приоритетной задачей, а дальнейшее развитие облачных решений будет ос
у-
ществляться вместе с возникновением новых, более надежных способов защиты данных.


Некоторые вызовы и риски


В настоящее время развитие
информационных технологий идет очень быстрыми темпами, поэтому
естественны попытки в той или иной мере спрогнозировать будущее. В частности, обсуждаются разли
ч-
ные возникающие вызовы и риски (chenes
and

risks), с которыми может столкнуться общество. Авт
о-
ры данной статьи также попытались сделать определенные выводы на эту тему. Конечно, в процессе ра
з-
вития с течением времени может оказаться, что какие
-
то из высказанных положений могут оказаться н
е-
верными.

Итак, по мнению авторов, в строительстве больших ц
ентров данных можно увидеть стремление нек
о-
торых транснациональных корпораций типа Microsof, IBM, Gooe к овладению большими объемами
информации. Развитие происходящих сегодня событий можно представить следующим образом.

Например, некая компания сообщае
т, что наряду с обычным ПО ею разработан и облачный вариант.
В действительности обычному пользователю облачный вариант может быть не нужен, но его может и
с-
пользовать какая
-
то компания. Хотя рекламируются удобство для коллективного использования и без
о-
пасно
сть хранения данных, данные становятся доступными для владельцев облаков, то есть для владел
ь-
цев серверов.

Компания может заявить, что в дальнейшем будет поддерживать только облачный вариант программ.
Конечно, можно поддерживать обычный вариант на своем к
омпьютере, но через некоторое время ко
м-
пьютер выйдет из строя, так как изначально, при производстве, заложен ограниченный ресурс времени
его использования. На новом компьютере «железо» будет так изменено, что обычный вариант программ
(не облачный) там уже
не будет работать, как не будут работать и еще множество программ других ко
м-
паний. Таким образом, вам не останется ничего другого, как «отправиться в облака», то есть ваши да
н-
ные станут доступными для посторонних. Конечно, вы можете их кодировать, но в обл
аках работают
специалисты более высокого класса, способные почти все декодировать.

Центры данных позволяют аккумулировать разнообразную информацию: политическую, военную,
экономическую, социологическую, технологическую и др., с помощью автоматизированных
методов
Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


20

вести одновременный диалог с большим количеством людей. Например, компания IBM для обсуждения
ряда технологических проблем привлекла около 140 тысяч человек. На специальном сайте Innovion Jm
2008 обсуждались вопросы изменения бизнес
-
моделей, вза
имодействия с потребителями, глобальной и
н-
теграции и защиты окружающей среды. Innovion Jm строится на разработанном в IBM инструмент
а-
рии для Web 2.0. Пройдя регистрацию, участник попадает на регулируемый модераторами сайт, где в
форме форумов и чатов ид
ет обсуждение по заданным темам и ответвляющимся от них вопросам. Здесь
же в реальном времени отображается подробная статистика по дискуссиям в мире и отдельных странах.
Помощь модераторам в слежении за ходом разговоров и в их последующей классификации ока
зывает а
в-
томатизированное средство обработки текста e
-
Cssifier. То есть, грубо говоря, теперь оказывается во
з-
можным осуществлять мозговые штурмы с участием 140 тысяч человек.

Отдельная тема


социальные сети. Социальная сеть представляет собой интерактив
ный многопол
ь-
зовательский
веб
-
сайт
, содержание (
контент
) которого наполняется самими участниками сети. Сайт
представляет собой автоматизированную социальную среду, позволяющую общаться группе пользоват
е-
лей, объединенных общими интересами. К ним, в частности, относятся и тематические форумы, особе
н-
но отраслевы
е, активно развивающиеся в последнее время. Количество зарегистрированных пользоват
е-
лей только одной сети может превышать население целой страны.

В последнее время все больше и больше говорят о персональных данных в Интернете, об анонимн
о-
сти и других подо
бных вещах. Касается это и социальных сетей, в которых хранится много личных да
н-
ных. Самым безобидным можно считать использование личных данных самими владельцами социал
ь-
ных сетей для развития своего бизнеса. Но этими данными могут воспользоваться и престу
пники, в том
числе совершающие финансовые махинации в электронных сетях.

Отдельно стоит сказать о рекламных технологиях. Многие социальные сети предоставляют прямую
возможность проведения рекламы, и данные технологии быстро развиваются, начиная от простог
о ра
з-
деления по полу (как, например, у сети FceBook) и заканчивая сложными системами слежения и анализа
действий пользователя, на основе которых ему и будет показана реклама. Существуют целые схемы с
применением методов психологического воздействия с цель
ю получения секретной информации, как
правило, коммерческого
характер
а.

Также заслуживают внимания технологии коллективного создания энциклопедий типа Wikipedi. Н
е-
которые компании создают внутренние закрытые системы типа Wikipedi, содержащие технологиче
скую
информацию. Облачные вычисления расширяют эти возможности.

Как уже было отмечено, в центрах данных могут сосредотачиваться персональные данные. Можно
предположить, что через некоторое время станет реальностью оперативная установка координат почти
любо
го человека на планете. Через пять

десять лет любой человек за относительно небольшую сумму
сможет получить свои генетические данные. Появление этих данных обусловит новые проблемы, так как
из них можно будет выяснить не только предрасположенность к опреде
ленным заболеваниям и какими
лекарствами человека лечить, но и какими ядами или вирусами на него легко воздействовать.

Центры данных могут быть объектами, интересными для террористов и как средство получения и
н-
формации, и как объект террористических акций
. В случае военных конфликтов центры данных могут
стать важными целями. Естественно, что военные и спецслужбы типа Агентства национальной безопа
с-
ности США уже создают свои центры данных, в том числе глубоко законспирированные.

Отметим, что создание центров

данных на данном этапе является крайне нерентабельным. Их сто
и-
мость может превышать миллиард долларов. Компенсируются затраты за счет других видов деятельн
о-
сти, например, предоставления рекламных услуг в Интернете. Объемы данных, циркулирующих в общ
е-
стве,

по
-
видимому, еще долго намного будут превышать технические возможности по их накоплению и
обработке. Поэтому процесс овладения большими объемами информации будет происходить не так у
с-
пешно, как хотелось бы некоторым.

Учитывая сказанное, можно сделать выв
од, что развитие облачных вычислений, несмотря на вызовы
и риски, все
-
таки является тенденцией. Поэтому целесообразно участвовать в описанных выше проце
с-
сах для того, чтобы действительно получать доступ к новым возможностям, которые появляются в связи
с ра
звитием облачных вычислений и больших центров данных.


Литература


1.

Miller R. Who Has the Most Web Servers?

2012. URL:

http
://
www
.
datacenterknowledge
.
com
/
archi
-
ves
/2009/05/14/
whos
-
got
-
the
-
most
-
web
-
servers
/

(дата обращения:
29
.0
5
.2014).

2.

Медведев А. Облачные технологии: тенденции развития, примеры исполнения // Современные
технологии автоматизации.
2013. № 2.
С
. 6

9.

3.

Dallas
К
. The Internet of Things is Here
.
2012. URL:

http
://
blogs
.
msdn
.
com
/
b
/
windows
-
embedded
/
archive
/2013/09/06/
the
-
internet
-
of
-
things
-
is
-
here
.
aspx

(дата обращения:
29
.0
5
.2014
).

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


21

4.

Amrhein

D., Quint S.
Cloud computing for the enterprise: Part 1: Capturing the cloud
. 2012. URL:
http
://
www
.
ibm
.
com
/
developerworks
/
websphere
/
techjournal
/0904_
amrhein
/0904_
amrhein
.
html

(дата обращ
е-
ния:
29
.0
5
.2014
).

5.

Облачные вычисления (
Cloud

computing
)
. 2012. URL:
http
://
www
.
tadviser
.
ru
/
index
.
php
/Статья:Об
-
лачные_вычисления_(
Cloud
_
computing
)

(дата обращения:
29
.0
5
.2014
).

6.

Grner призывает к правильному пониманию частного облака.
2012. URL:
http
://
www
.
crn
.
ru
/
news
/

detail
.
php
?
ID
=73064

(дата обращения:
29
.0
5
.2014
).

7.

Орландо Д. Модели сервисов облачных вычислений: инфраструктура как сервис
. 2012. URL:
http
://
www
.
ibm
.
com
/
developerworks
/
ru
/
library
/
cloudservices
1
iaas
/

(дата обращения:
29
.0
5
.201
4
).

8.

Орландо Д. Модели сервисов облачных вычислений: платформа как сервис.
2012. URL:
http://www.ibm.com/developerworks/ru/library/cl
-
cloudservices2paas/

(дата обращения:
29
.0
5
.2014
).

9.

Орландо Д. Модели сервисов облачных вычислений: программное обеспечение как сервис
. 2012.
URL:

http://www.ibm.com/developerworks/ru/library/cl
-
cloudservices3saas/

(дата обращения:
29
.0
5
.2014
).

10.

Шуклин А.
Топ
-
6 облачных хранилищ данных
. 2012. URL:
http://digit.ru/technology/20130731/

403909541.html

(дата обращения:
29
.0
5
.2014
).

11.

Хики Э.
Топ
-
20 вендоров

облачного хранения данных и решений для ЦОДов.
2012. URL:
http://www.crn.ru/news/detail.php?ID=63597

(дата обращения:
29
.0
5
.2014
).

12.

Маккарти Д.
100 самых перспективных поставщиков облачных решений.
2
012. URL:

http://www.crn.ru/numbers/spec
-
numbers/detail.php?ID=79648

(дата обращения:
29
.0
5
.2014
).

13.

Google App Engine.

2012. URL:
http
://
en
.
wikipedia
.
org
/
wiki
/
Google
_
App
_
Engine

(
дата

обращения
:
29
.0
5
.2014
).

14.

Amazon S3
.

2012. URL:
http://ru.wikipedia.org/wiki/Amazon_S3

(дата обращения:
29
.0
5
.2014
).

15.

Не все облачные хранилища

одинаковы
. 2012. URL:

http://www.hi
-
lo.ru/news/survey
-
not
-
all
-
storage
-
clouds
-
are
-
alike

(дата обращения:
29
.0
5
.2014
).

16.

Windows Azure. 2012. URL:
http://en.wikipedia.org/wiki/Windows_Azure

(дата обращения:
29
.0
5
.2014
).

17.

Новиков И.
Облачные вычисления: на пороге перемен
. 2012. URL:

http://www.pcmag.ru/solutions/sub_detail.php?ID=44441&SUB_PAGE=1

(дата обращения:
29
.0
5
.2014
).

18.

Surana A., Vellal D., Guru R.
Introducing IBM LotusLive.
2012. URL:

http
://
www
.
ibm
.
com
/
developerworks
/
lotus
/
library
/
lotuslive
-
intro
/
index
.
html

(дата обращения:
29
.0
5
.2014
).

19.

Rackspace Cloud. 2012. URL:
http
://
en
.
wikipedia
.
org
/
wiki
/
Rackspace
_
Cloud

(дата обращения:
29
.0
5
.2014
).

20.

Exalogic. 2012. URL:
http
://
ru
.
wikipedia
.
org
/
wiki
/
Exalogic

(дата обращения:
29
.0
5
.2014
).

21.

Salesforce.com. 2012. URL:
http
://
ru
.
wikipedia
.
org
/
wiki
/
Salesforce
.
com

(дата обращения:
29
.0
5
.2014
).

22.

Parallels
.

2012. URL:
http
://
ru
.
wikipedia
.
org
/
wiki
/
Parallels

(дата обращения:
29
.0
5
.2014
).

23.

Slidebar
.

2012. URL:
http
://
ru
.
wikipedia
.
org
/
wiki
/
Slidebar

(дата обращения:
29
.0
5
.2014
).

24.

Рудницкий Г.
Microsof представила первых крупных российских клиентов Windows Azure.

2012.
URL:
http://www.it
-
weekly.ru/market/business/29410.html

(дата обращения:
29
.0
5
.2014
).

25.

Васильев В.Н., Князьков К.В., Чуров Т.Н., Насонов Д.А., Марьин С.В., Ковальчук С.В., Бухано
в-
ский А.В. CLAVIRE: о
блачная платформа для обработки данных больших объемов // Информационно
-
измерительные и управляющие системы. 2012. Т. 10. № 11. С. 7

16.

26.

Dignan L. SlideShare dumps Flash goes HTML5: Developer resources vs. multiple apps
. 2012. URL:
http
://
www
.
zdnet
.
com
/
blog
/
btl
/
slideshare
-
dumps
-
flash
-
goes
-
html
5
-
developer
-
resources
-
vs
-
multiple
-
apps
/59006

(дата обращения:
29
.0
5
.2014
).

27.

Tadviser. 2012. URL:
http
://
www
.
tadviser
.
ru
/
index
.
php
/Новости

(дата обращения:
29
.0
5
.2014
).

28.

Fabrizio Gagliardi


Director for Research Connections at Microsoft Research
. 2012. URL:

http://eai.eu/bio/fabrizio
-
gagliardi
-
director
-
research
-
connections
-
microsoft
-
research

(дата обращения:
29
.0
5
.2014
).

29.

Kumar S., Buyya G., Buyya R. Green Cloud c
omputing and Environmental Sustainability // IEEE Xplore
Digital Library, Clo
ud Computing and Distributed Systems (CLOUDS) Laboratory. Dept. of Comp. Sci. and
Software Engineering, Univ. of Melbourne, Australia,
2012,

27 p.

30.

New Datacenter Locations.

20
08
. URL:
http
://
royal
.
pingdom
.
com
/2008/04/11/
map
-
of
-
all
-
google
-
data
-
center
-
locations
/

(
дата

обращения
:
29
.0
5
.2014
).

31.

C
-
Y Sheu P., Shu Wang, Qi Wang , Ke Hao, Ray P.
Semantic Computing, Cloud Computing, and S
e-
ma
n
tic Search Engine. IEEE

Intl Conf. on Semantic Computing, 2009, pp. 654

657.

32.

O‱ Brien N.S., Johnson S.J., Hr E.E., Djidjei K., Cox S.J. Expoiin Coud Compuin for Aorihm
Development. IEEE

Intl Conf.
on Cyber
-
Enabled Distributed Computing and Knowledge Discovery, 2011, pp.
336

342.

33.

Doddavula S.K., Saxena V. Implementation of a Secure Genome Sequence Search Platform on Public
Cloud. Third IEEE

Intl Conf. on Cloud Computing Technology and Science, 2011,
pp. 205

212.

Программные продукты
и системы

и алгоритмы

















№ 1, 2014 г.


22

34.

Papadopoulos A., Katsaros D. A
-
Tree: Distributed Indexing of Multidimensional Data for Cloud Comp
u-
ting Environments. Third IEEE Intl Conf. on Cloud Computing Technology and Science, 2011, pp. 407

414.

35.

Weinman J. Mathematical Proof of the Inevi
tability of Cloud Computing.
2011.
URL:

http
://
www
.
JoeWeinman
.
com
/
Resources
/
Joe
_
Weinman
_
Inevitability
_
Of
_
Cloud
.
pdf

(дата обращения:
29
.0
5
.2014
).

36.

Петров Д.Л. Алгоритмы миграции данных в высокомасштабируемых облачных системах хранения
// Автореф. … канд. дисс. С.
-
Петербургский гос. электротехнич. ун
-
т «ЛЭТИ» им. В.И. Ульянова (Лен
и-
на). СПб, 2011. 18 с.

37.

Суханов В.И. Минимизация трафика в облачной инф
раструктуре // Науч. журн. КубГАУ. 2012.

№ 78 (04). С. 1

10.

38.

Fei Ten Mnemen des données e ordonnncemen des âches sur rchiecures disribuées. Thèse,
Grde de Doceur, Ėcoe Cenre Pris e Mnufcures, 2011, 188 p.

39.

Haeberlen A., Ives Z. Grap
h algorithms in MapReduce. NETS 212: Scalable and Cloud Computing.
Univ. of Pennsylvania, October 15, 2013
,

Presentation
,

61 slides.

40.

Redekopp M., Simmhan Y., Prasanna V.K. Performance Analysis of Vertex
-
centric Graph Algorithms on
the Azure Cloud Platform.

Workshop on High
-
Performance Computing meets Databases (HPCDB), 2011, Salt
Lake City, UT, USA, 8 p.

41.

Kannan R., Vempala S., Woodruff D.P. Nimble Algorithms for Cloud Computing.
2012. URL:
http
://
arxiv
.
org
/
abs
/1304.3162

(дата обращения:
29
.0
5
.2014
).

42.

Ghoting A., Kambadur P., Pednault E., Kannan R. NIMBLE: A Toolkit for the Implementation of Para
l-
lel Data Mining and Machine Learning Algorithms on MapReduce. Proc. of 17th ACM SIGKDD Conf. on
Knowledge Discovery

and Data Mining (KDD 2011). San Diego, CA, USA
,

2011
,

pp. 334

342
.

43.

Туманов Ю.М. Защита сред облачных вычислений путем верификации программного обеспечения
на наличие деструктивных свойств // Автореф. канд. дисс., М.: Изд
-
во НИЯУ «МИФИ», 2012.
20
с
.

44.

Gentry

C. Fully Homomorphic Encryption Using Ideal Lattices // Proc. of 41st Annual ACM Symposium
on Theory of Compuin (STOC‱ 09). ACM NY, NY, USA, 2009
,

pp. 169

178.

45.

Github
. 2012. URL:
https://github.com/shaih/HElib

(дата обращения:
29
.0
5
.2014
).

46.

Chen J., Xu Y., Li Y. Research about spam page identification based on cloud computing in search se
r-
vice // 4th IEEE

Intl Conf. on Intelligent Human
-
Machine Systems and Cybernetics, 2012, pp. 77

80.

47.

Li J., Wang Q., Wang C., Cao N., Ren K., Lou W. Fuzzy keyword search over encrypted data in cloud
computing. Mini
-
Conf. IEEE INFOCOM, 2010, Digital Object Identifier 10.1109/INFOCOM.2010.5462196,

5 p.

48.

Гребнев
E
. Облака: от старых технологий к широким перспективам.
2012. URL:
http://cloud.cnews.ru/reviews/index.shtml?2011/05/20/440918_1

(дата обращения:
29
.0
5
.2014
).



Приложенные файлы

  • pdf 8149850
    Размер файла: 745 kB Загрузок: 1

Добавить комментарий