Роевое обучение: превратите распределенные данные в фактор успеха

Введение

В основе нашей экономики лежат данные. Они поступают от повсеместно используемых датчиков, вычислительных систем и сетей. В различных отраслях, включая здравоохранение, сельское хозяйство, розничную торговлю, транспорт и прочие, каждую секунду образуются петабайты, а то и эксабайты данных. При этом истинная ценность данных заключается в знаниях, которые «спрятаны» в глубине данных, если эти знания позволяют принимать своевременные решения и извлекать прибыль. Данные обычно собираются в вычислительном центре, в публичном или частном облаке, где эти данные используются для обучения статистических моделей или моделей машинного обучения. После обучения можно развернуть модели в облаке или на границе сети, собрать новые входные данные и получить результат работы модели. Такая архитектура машинного обучения с агрегированием учебных данных называется централизованным машинным обучением. Многие области применения машинного обучения, где в большинстве случаев применяется централизованный подход к обучению, оказали значительное влияние на множество аспектов нашей работы и жизни, привели к важным открытиям в области мобильности, образа жизни и промышленного производства. Мы празднуем триумф машинного обучения, но не должны забывать о новых технических и социально-экономических проблемах, а также, в частности, об их влиянии на то, как мы обрабатываем данные и извлекаем знания.

Как завершать проекты в срок

В предыдущей статье мы выяснили, что высокая степень неопределенности проектной среды не является основной причиной срыва сроков проекта . Причина заключается в нашей организации работ на проекте. Таким образом, нам нужно решение, которое бы изменило нашу работу и позволило устранить такие явления как Закон Паркинсона, студенческий синдром, потеря выигрыша времени и передача опозданий в цепи зависимых заданий. Решение должно минимизировать перепрыгивание от задания к заданию, при этом оценка длительности заданий не должна переводиться в разряд обязательств. Что собой представляет решение читаем далее…

Где это можно использовать

Модели роевого интеллекта уже применяют там, где из множества решений нужно выбрать самое оптимальное.

  • Поисково-спасательные операции. Учёные из Курчатовского института запрограммировали группу роботов с помощью роевого интеллекта. Роботы находят предметы, разбросанные по локации, и перетаскивают их в точку сбора по кратчайшему маршруту. При этом муравьиный алгоритм хорошо подходит для устройств, движущихся по поверхности земли, а пчелиный — для летающих (дронов, квадрокоптеров).
  • Автомобильные грузоперевозки. Европейская компания Ant Optima разрабатывает системы, оптимизирующие перевозку грузов на автомобилях. Её программисты написали на основе муравьиного алгоритма ряд для доставки продуктов питания, медикаментов и нефтепродуктов по городам и торговым точкам. Софт Ant Optima отслеживает количество товара на складах, мониторит обстановку на европейских дорогах и помогает выбрать оптимальный маршрут для доставки грузов.
  • Гражданская авиация. Роевой интеллект помогает авиакомпании Southwest Airlines выбирать места для стоянки самолётов и оптимизировать поток пассажиров, которые покупают билеты и проходят регистрацию. Так авиаперевозчик борется с очередями возле касс и стоек регистрации.
  • Градостроение и наука. С помощью муравьиного алгоритма учёные определяют оптимальное расположение электростанций, трансформаторов и линий электропередач, а также разрабатывают дизайн формы портативных антенн.

А вот британские учёные предложили создавать объёмные рисунки с помощью муравьиного и птичьего алгоритмов. Они даже придумали термин «роевое искусство» (Swarm Art).

Исследователи нарисовали простейшие контуры объектов, а затем пустили по ним виртуальную стаю. Перемещаясь вдоль нарисованных линий, виртуальные животные за несколько итераций алгоритма придали рисункам объём.


«Роевое искусство» (Swarm Art): слева — исходный рисунок, справа — результат работы роевого алгоритма. Изображение: M. M. Al-Rifaie, J. M. Bishop, A. Aber / Creative or Not? Birds and Ants Draw with Muscles / AISB 2011: Computing and Philosophy, 2011

Бизнес-консультант в малом и среднем-бизнесе. Кто это и зачем он нужен? Промо

Я не буду здесь давать сухие определения, думаю, они никому не интересны. Бизнес-консультант – это тот самый человек, которого приглашают со стороны, чтобы он помог найти решение каких-то проблем. Также очевидно, что взгляд «со стороны» очень часто помогает выявить то, что вы никогда не обнаружите, будучи сотрудником компании.
Я хочу с вами поговорить исключительно о бизнес-консультантах, которые работают с малым и средним бизнесом, т.к. с предприятиями с численностью сотрудников ориентировочно от 5 до 70 человек. Эта работа во многом отличается от того, что делают специалисты, которых привлекают в подобных случаях крупные компании. И, как раз, с этими нюансами есть смысл разобраться.

Роевой интеллект

Мы привыкли думать о муравьях как о мудрых существах: они строят огромные гнёзда, занимаются «скотоводством» и даже захватывают сородичей в рабство. Но парадокс в том, что отдельно взятый муравей очень глуп. Только действуя сообща, эти насекомые способны добиваться впечатляющих результатов. Особи с примитивными рефлексами взаимодействуют между собой и демонстрируют удивительно эффективное поведение.

Долгие годы учёные пытались понять механизмы функционирования муравьиного общества. Особенно их занимал один факт: передвигаясь от муравейника к источнику пищи, насекомые всегда выбирали самый короткий путь. Сначала явление пытались объяснить таинственными психополями, с помощью которых муравьи якобы взаимодействуют между собой.

К счастью, бельгийский исследователь Марко Дориго создал математическую модель, научно описывающую этот процесс. Он опубликовал её в докторской диссертации в 1992 году и реализовал в виде компьютерного алгоритма. Модель муравьиного алгоритма (Ant Colony Optimization, ACO) Дориго привлекла других учёных к изучению роевого интеллекта (Swarm intelligence).

Роевой интеллект описывает системы, состоящие из множества особей — их называют агентами. Агенты могут быть как реальными роботами, так и виртуальными объектами в компьютерной симуляции. Они взаимодействуют между собой по определённым правилам и вместе находят решение общей задачи.

Каждый охотник желает знать, где сидит фазан, или управление внутренними проектами, танцуем от печки…

Статья, продолжающая цикл публикаций по классификации внутренних проектов, а вернее сказать, их отправная точка.
Ибо ведение проектов происходит не в вакууме, а во вполне конкретной организации, со своим уставом и иерархией отношений.
А что будет с тем, кто сунется со своим укладом в чужой монастырь, нам напомнили как раз в предновогодний вечер: «Да на кол его посадят, всего и делов.»
Чтобы этого не произошло с вами — присмотритесь к предполагаемому месту работы, а я с вами поделюсь очень интересной классификацией организаций от признанных гуру в этой области.
Из-за этого статья пригодится как HR-менеджерам, так и из соискателям. Прошу под кат…

Танцы и пчёлы

Пчёлы тоже демонстрируют удивительные способности к поиску оптимальных решений. Полосатые труженицы находят скопления цветов для сбора нектара и пыльцы в нескольких километрах от улья, а затем «рассказывают» о них товарищам с помощью… танца.

Да, пчёлы способны передавать друг другу информацию с «географическими координатами» посредством ритмических движений. При этом по интенсивности танца сородичей пчёлы делают выводы о количестве цветов в указанной точке пространства (чем больше цветов — тем активнее движения). Это необычное явление обнаружил в середине XX века исследователь насекомых Карл Фриш. За свои работы он был удостоен Нобелевской премии.

В течение многих лет только учёные-биологи исследовали пчелиные методы поиска. А в 2005 году их результатами заинтересовался профессор Дервис Карабога, работавший на кафедре вычислительной техники в турецком университете Эрджиес (Erciyes University). Он опубликовал научную статью и описал в ней модель роевого интеллекта, на создание которой его вдохновили пчелиные танцы. Модель получила название «алгоритм пчелиной колонии» (Artificial Bee Colony).

Как реализовать алгоритм пчелиной колонии

Все пчёлы разделяются на 3 вида: разведчики, рабочие и наблюдатели. Вначале несколько разведчиков вылетают из улья в разных случайно выбранных направлениях. Обнаружив нектар, они возвращаются в улей и рассказывают на «танцполе» пчёлам-наблюдателям о местах своих находок.

По интенсивности танца наблюдатели выбирают разведчиков, которые обнаружили наиболее богатые нектаром площадки, и вылетают в нужном направлении. На месте сбора нектара наблюдатели превращаются в рабочих пчёл. Они облетают это место и оценивают число цветов. Дальше возможны два варианта.

Первый: пчела находит поблизости другую площадку с большим количеством цветов и собирает нектар оттуда, а про старое место забывает. Затем она возвращается в улей, где в танце сообщает пчёлам-наблюдателям координаты нового источника нектара.

Второй: пчела не находит лучшего места и собирает нектар там, куда изначально летела. Дома она рассказывает пчёлам о той же точке.


Алгоритм пчелиной колонии: толстые линии — траектории полёта разведчиков, тонкие — уточнение решений рабочими пчёлами. Изображение:

Процесс повторяется многократно. Прилетев в улей, пчёлы-рабочие сообщают в танце параметры места, с которого собрали нектар, и превращаются в наблюдателей. В следующей итерации они выбирают по танцам своих сородичей новую привлекательную точку, вылетают туда и снова становятся рабочими.

Через некоторое время все пчёлы сосредоточатся на сборе пыльцы и нектара из лучших источников, а координаты менее богатых цветами точек просто забудут.

Псевдокод алгоритма:

Хранить лучшие решения можно в массиве фиксированной длины — он будет выполнять роль «танцпола». Цикл выполняется, пока не выполнятся условия его завершения.

10 способов злоупотребления сотрудниками своим служебным положением и методы борьбы с ними с помощью учетной системы Промо

Не так давно на одном из проектов во время инвентаризации была выявлена очень большая недостача. Как результат, одно из важнейших требований клиента по проекту было: разобраться с тем, что у него происходит в системе, и привести остатки, как он выразился, «в адекватное состояние».
А незадолго до этого у меня в практике был случай, когда уже на второй день после внедрения качественной системы учета движения наличных денежных средств (кассы) также была выявлена недостача, но уже в кассе.
И в первом, и во втором случае вину за возникновение проблемы представители заказчика попытались возложить на людей, которые занимались внедрением новой системы. И только после долгих и, надо признаться, довольно неприятных и очень эмоциональных разбирательств, удалось доказать клиенту, что система работает правильно, а виноваты в случившемся сотрудники компании, которые намеренно или ненамеренно создали фактическую недостачу товара и денег.

Представляем технологию децентрализованного обучения – роевое обучение

Роевое обучение – это платформа, позволяющая набору узлов (каждый узел обрабатывает часть обучающих данных локально) совместно обучать общую модель машинного обучения без обмена собственно учебными данными. Это достигается следующим образом: отдельные узлы обмениваются параметрами (весами), полученными при обучении модели на локальных данных. За счет этого узлы поддерживают конфиденциальность исходных данных. Параметры, предоставленные всеми узлами, объединяются для получения глобальной модели. Более того, процесс объединения осуществляется не постоянным центральным координатором или сервером параметров, а временным ведущим узлом, динамически выбираемым среди всех активных узлов, поэтому сеть роя является децентрализованной. За счет этого обеспечивается гораздо более высокая отказоустойчивость, чем в традиционных платформах с серверами параметров. При использовании глобальной модели каждый узел получает в свое распоряжение все знания сети, при этом исходные данные не выходят за пределы узла. Идея децентрализованного обучения опирается на две проверенные технологии: распределенное машинное обучение и блокчейн. Алгоритм распределенного машинного обучения применяется для обучения общей модели на множестве узлов с подмножеством данных, находящихся в каждом узле (в машинном обучении такой принцип называется парадигмой параллелизма по данным), но без центрального сервера параметров. Блокчейн наделяет систему функциями децентрализованного управления, масштабируемости и отказоустойчивости, чтобы платформа не ограничивалась рамками одной организации. Одновременно блокчейн реализует платформу криптовалюты, защищенной от фальсификации, которую участвующие стороны могут использовать для монетизации своих вкладов в общую модель.

В чём недостатки существующих решений?

За последнее десятилетие системы машинного обучения получили значительное развитие в промышленности и научных исследованиях. Были предприняты усилия по преодолению отдельных проблем централизованного машинного обучения. Тем не менее решения для всех основных проблем централизованного машинного обучения пока не существует.И для федеративного обучения Google , и для алгоритмов эластичного усреднения SGD Facebook проводились исследования возможностей сотрудничества локальных решений для улучшения общей модели. В системах Google и Facebook единый сервер параметров осуществляет объединение всех данных и распределение задач для локального обучения. Такая архитектура с топологией «звезда» обладает очевидной единой точкой отказа, что приводит к снижению отказоустойчивости.Помимо этого недостатка, с децентрализованными системами машинного обучения со множеством участников связывают еще одну, более серьезную проблему — выявление, наказание и исключение посторонних участников. Технические меры помогают обнаруживать посторонних участников и ограничивать их влияние, но обнаружение и восстановление систем занимает время. Чтобы обнаруживать такое злонамеренное поведение, нужно выйти за рамки строго технических мер: у каждого локального участника обучения не должно быть мотивации нарушать установленный порядок, поскольку это повлечет нежелательные последствия.

Для решения проблем с конфиденциальностью в работе Техасского университета в Остине и Корнеллского университета, а также Университета Карнеги-Меллона и корпорации Mitsubishi, к примеру, применяются алгоритмы учета конфиденциальности в многосторонних средах машинного обучения. Это важный шаг на пути к удовлетворению требований конфиденциальности в децентрализованных системах машинного обучения. Поскольку работа сфокусирована на проблеме повышения конфиденциальности, в ней не рассматриваются другие важные проблемы, встречающиеся в обработке распределенных данных у коммерческих компаний, такие как несбалансированные выборки данных, зависимые и идентично распределенные данные. Чтобы избежать возможной нагрузки по перетасовке и реорганизации распределенных данных, требуется децентрализованный подход, изначально разработанный для распределенных данных и способный поддерживать любые инициативы по укреплению конфиденциальности.Кроме того, есть пробел в возможностях существующих платформ децентрализованного машинного обучения для приложений, используемых в коммерческих компаниях. Например, алгоритм федеративного обучения Google обрабатывает данные конечных пользователей в своей собственной экосистеме. Недавно появившийся принцип децентрализованного машинного обучения (Decentralized ML) также ориентирован на конечных потребителей за счет применения машинного обучения с использованием коллективных ресурсов (краудсорсинга). Огромным потенциалом обладают полные решения децентрализованного машинного обучения для корпораций: в таких решениях вычислительные ресурсы объединены с системами хранения и данными. Это решение должно не только устранять конкретные проблемы коммерческих компаний, но и способствовать появлению новых бизнес-моделей для поощрения сотрудничества между компаниями.

Физика роевого интеллекта

То, что множество простых существ могло демонстрировать связное коллективное поведение без какого-либо лидера, вызвало его удивление и изумление, и это продолжалось на протяжении большей части нашего мышления на протяжении следующих тысячелетий.

Статистическая #физика впервые высказала противоположную точку зрения. Когда кусок железа охлаждается до определенной температуры (температуры Кюри), большинство атомов выравнивают свой спин, тем самым делая его магнитным. Никакой атомный генерал не дает никаких команд; каждый атом общается только со своими соседями, и все же существует общее выравнивание.

Несколько сотен лет назад серьезные биологи все еще считали, что координация птиц в стае достигается с помощью телепатии, а синхронное излучение света светлячками в азиатских джунглях объяснялось ошибочным наблюдением наблюдателя.

Введение физических понятий в биологию в значительной степени разрешило эти загадки.

Стаи птиц больше похожи на атомы в железе, чем на армии Наполеона, а светлячки действуют во многом как лазер. В конце концов, коллективное поведение в мире живых существ не так уж отличается от поведения в неодушевленном мире.

Метод простых и сложных систем в физике

На протяжении веков физика концентрировалась на простых системах, поскольку их можно было решить с помощью имеющихся методов. Ученые разделили большую систему на множество простых маленьких, с которыми можно было работать. Собирая их вместе, мы описываем большую систему.

Понимание коллективного поведения сообществ животных, возможно, может стать первым шагом в поисках ответа.

Сегодня мы можем смоделировать стаю птиц на компьютере, позволяя каждой птице свободно перемещаться при соблюдении только двух социальных правил: следуйте за своим соседом, но не толпитесь за ним.

Если поместить в компьютер большое количество таких упрощенных птиц, то получится поведение, наблюдаемое у стай настоящих птиц. Примитивный способ достижения коллективного поведения обеспечивается командами Цезаря или Наполеона;

Более тонкий и естественный способ — позволить многокомпонентной системе двигаться в соответствии с простыми ясными социальными правилами.

Сложная форма коллективного поведения

Еще более сложная форма коллективного поведения проявляется в сообществах насекомых. Теперь целое больше не состоит из одинаковых компонентов.

В колонии муравьев есть рабочие, няни, солдаты и королева. Каждый выполняет определенные задачи. Он зависит от других, чтобы существовать, он не может выжить в одиночку. И каким бы хорошим ни был рабочий #муравей , у него никогда не будет детей, которым он сможет передать свои способности.

Все потомки произведены королевой и трутнями. Выживание наиболее приспособленных Чарльза Дарвина теперь принимает новую и неожиданную форму. Это больше не относится к отдельным людям, а скорее ко всей коллективной системе.

Коллективное поведение людей

Таким образом, общества насекомых в некотором роде предшествуют образцу современных индустриальных обществ, в которых крупные #фирмы нанимают различные «виды» работников для выполнения определенных задач. В большинстве человеческих обществ кастовый статус (пока) не передается по наследству, и возможны кастовые переходы.

В любом случае человеческие общества привели к одной коллективной особенности, не имеющей аналогов на сопоставимом уровне ни у одного животного: у нас есть язык.

Только существование языка допускает абстрактное #мышление людей. Мы можем представить и говорить о прошлом и будущем. Вероятно, это и позволило людям захватить всю землю.

Наиболее типичные ошибки при оценке работ в проектах 1С

Для кого эта статья? Если вы руководитель проектов (РП) с опытом «от трех проектов», то можете не читать: скорее всего, ничего нового вы не узнаете. А если вы хотите стать РП в проектах 1С или вы профессионал (разработчик, аналитик, консультант), к которому часто обращаются за оценкой, то вам будет полезно узнать о типичных ошибках при оценке.
Если вам необходимо реализовать задачу, которую не имеет смысла делать по классической проектной технологии, но заказчик требует фиксированной оценки, и задача на 2-5 человеко-месяцев, — то вам будет полезно понять методы оценки работ.
Если читатель часто пользуется услугами удаленных разработчиков/аналитиков, то вам, возможно, станет понятно, почему «человек все сделал, мы ему заплатили, сколько сказал, а он от нас ушел и больше работать не хочет».
Типичные ошибки распределю по классам.

Критерии успешного решения

Недостатки централизованного машинного обучения обусловлены именно централизованной архитектурой. Естественным образом напрашивается применение противоположного подхода – децентрализованного машинного обучения. В частности, нужен подход к децентрализованному машинному обучению со следующими атрибутами.

Действенность

Децентрализованная система машинного обучения должна обладать точностью, эффективностью и способностью обрабатывать распределенные данные. Точность. Точность модели у такой системы должна быть близкой или такой же, как у системы с централизованным обучением, поскольку точность – главный показатель извлечения знаний из данных. Эффективность

Важно рассматривать эффективность со систематической точки зрения и оценивать всю область применения. Система машинного обучения может охватывать передачу данных и параметров модели, обучение и тестирование модели, развертывание и периодические обновления

Для объективного сравнения нужно принимать во внимание не только временную эффективность, но и продуктивное использование существующих вычислительных и сетевых ресурсов, а также систем хранения данных. Обработка распределенных данных

Децентрализованные системы машинного обучения должны эффективно обрабатывать распределенные данные путем правильного размещения нагрузок, координации работы равноправных систем и синтеза частичных результатов обучения для образования полной модели. Кроме того, сам алгоритм должен уметь работать с ограниченными или несбалансированными выборками данных. В обоих случаях это может быть весьма непросто, поскольку затрудняется согласование модели во время первичного и повторного обучения. Часто бывает, что данные с определенными атрибутами неравномерно распределены между источниками. Кроме того, объем данных может значительно различаться в разных распределенных источниках.

Безопасность

Для децентрализованного машинного обучения требуются функции безопасности, гарантирующие участие в обучении только после проверки подлинности: нужно защитить не только сами распределенные данные, но и параметры и веса модели. Для борьбы с несанкционированными участниками должен быть предусмотрен механизм их исключения. Доступ к данным должен предоставляться только в течение разрешенного периода и только для разрешенной цели. Кроме того, могут потребоваться дополнительные меры, чтобы скрыть сведения о модели машинного обучения.

Сохранность конфиденциальности

Один из доводов в пользу децентрализованного обучения – реализация более надежной конфиденциальности. Успешная децентрализованная система машинного обучения должна предоставлять владельцам данных более полный контроль над их конфиденциальными сведениями, а знания должны извлекаться из данных без нарушения конфиденциальности.

Отказоустойчивость

При централизованном подходе к машинному обучению есть риск единой точки отказа. У децентрализованного обучения такой риск отсутствует, но требуются средства повышения устойчивости систем: они должны быть рассчитанными на динамическое подключение и отключение распределенных ресурсов данных в процесс обучения модели.

Архитектура роевого обучения

Архитектуру роевого обучения можно разделить на четыре уровня: API, управление, данные и монетизация. Компоненты являются модульными, поэтому технологии, использованные в их реализации, можно заменять, сообразуясь с конкретными требованиями. Вся платформа может работать как на стандартных, так и на высокопроизводительных машинах, также поддерживается разнородная инфраструктура в сети. Платформу можно развернуть в пределах одного центра обработки данных или в нескольких центрах обработки данных. Реализована встроенная поддержка отказоустойчивой сети, где узлы могут динамически выходить из сети роя и снова входить в нее без нарушения и замедления процесса построения модели. На рисунке 2 показаны различные уровни роевого обучения с подробным описанием каждого из них:

РИСУНОК 2. Архитектура платформы

Рейтинг
( Пока оценок нет )
Editor
Editor/ автор статьи

Давно интересуюсь темой. Мне нравится писать о том, в чём разбираюсь.

Понравилась статья? Поделиться с друзьями:
Работатека
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: