Обратные задачи с развернутой состязательной регуляризацией

Сквозная реконструкция с развертыванием алгоритма соответствует регуляризации на основе данных для компьютерного зрения

Обратные задачи широко распространены в приложениях для обработки изображений, когда нужно восстановить неизвестный параметр модели из его неполного и зашумленного измерения. Например, это может быть применено для шумоподавления фотографии для извлечения информации в более высоком качестве. Обсуждаемый в этом посте метод развернутой состязательной регуляризации³ (UAR) предназначен для решения этой проблемы. Прежде чем погрузиться в UAR, мы также представляем алгоритм развертывания, который является одним из основных строительных блоков UAR.

Алгоритм развертывания¹

Мотивацией для развертывания алгоритма является поиск связи между традиционными итеративными алгоритмами и глубокими нейронными сетями, управляемыми данными. Основная идея состоит в том, чтобы смоделировать каждую итерацию в алгоритме как один слой в сети, с помощью которого итеративный алгоритм можно смоделировать как несколько объединенных вместе слоев. Таким образом, прохождение через сеть эквивалентно выполнению итеративного алгоритма конечное число раз. Следовательно, параметры алгоритма будут естественным образом представлены параметрами сети, а обученная сеть может быть интерпретирована как алгоритм, оптимизированный по параметрам, эффективно преодолевая недостаток интерпретируемости в большинстве обычных нейронных сетей.

Изученный алгоритм итеративного сокращения и порогового значения²

На рис. 2 показан пример применения идеи развертывания алгоритма. Традиционный алгоритм разреженного кодирования, алгоритм итеративного сокращения и порогового значения (ISTA), развернут и представлен глубокой нейронной сетью. Обратите внимание, что развернутый алгоритм модифицирует исходный метод, не разделяя веса между итерациями (т. Е. Слоями), и поэтому он называется Learned ISTA или LISTA.

Развернутая состязательная регуляризация

Обратная задача, рассматриваемая UAR, может быть резюмирована уравнением 1, где прямой оператор A моделирует процесс измерения в отсутствие шума, а e обозначает шум измерения. Наша цель будет состоять в том, чтобы найти оценщик, который может преобразовывать измерения y в базовую информацию x. Уникальная проблема заключается в том, что в наборе данных исследования y и x часто не идут парами.

При такой постановке многие дискриминационные методы не могут быть применены из-за несовпадения обучающих выборок с метками. Поэтому автор просмотрел литературу по генеративным моделям и почерпнул интуицию из генеративно-состязательных сетей (GAN). В частности, UAR состоит из сети реконструкции (генератора), которая восстанавливает основную информацию x из измерений y, и сети регуляризации (дискриминатора), которая отличает реконструированные изображения от наземные истины.

Цель обучения для сети реконструкции показана в уравнении 2. Первый член в операторе ожидания соответствует потерям при реконструкции, вычисляемым как расстояние между восстановленным изображением и входным изображением. Второй член — это просто потеря регуляризации для реконструированного изображения. Оба члена должны быть сведены к минимуму, чтобы произвести более качественную реконструкцию. Обратите внимание, что эта цель вообще не использует наземную правду, поэтому ее можно обучать только с входными изображениями.

Сеть регуляризации отвечает за отличие реконструкции от наземной истины, поэтому, как показано в уравнении 3, она максимизирует значение потерь для реконструированного изображения и минимизирует его для наземной истины.

Хотя эта структура является общей в том, какие архитектуры использовать для сетей реконструкции и регуляризации, в [3] используются развернутый генератор и обычная глубокая сеть, и поэтому «развернутый» в названии UAR. Кроме того, авторы предоставили строгие теоретические результаты в [3] для UAR, которые мы считаем очень достойными прочтения.

Заключение

Мы рассмотрели развернутую состязательную регуляризацию для обратной задачи обработки изображений. Он опирается на интуицию GAN, элегантно решает проблему непарных обучающих выборок (в некоторой степени отсутствующих данных) и превосходит современные методы в этой области.

GitHub — Subhadip-1/unrolling_meets_data_driven_regularization: Содержит сценарии Python для…
Содержит сценарии Python для состязательного изучения итеративно развернутой реконструкции вместе с управляемой данными…github .com

[1] Монга, Вишал, Юэлун Ли и Йонина С. Эльдар. «Развертывание алгоритма: интерпретируемое, эффективное глубокое обучение для обработки сигналов и изображений». Журнал IEEE Signal Processing 38.2 (2021): 18–44.

[2] Грегор, Кароль и Ян ЛеКун. «Изучение быстрых аппроксимаций разреженного кодирования». Материалы 27-й международной конференции по машинному обучению. 2010.

[3] Мукерджи, Субхадип и др. «Сквозная реконструкция сочетается с управляемой данными регуляризацией для обратных задач». Достижения в области нейронных систем обработки информации 34 (2021).

Предложения по подаче заявок на Mlearning.ai
Как стать писателем на Mlearning.aimedium.com

🔵 Стать писателем

материалы по теме:

Новые материалы

Как работают молекулярные сети часть 2

Траекторная интерпретация доказательства Мозером неравенства Гарнака (arXiv) Автор: Лукас Нибель , Рико Захер Аннотация: В 1971 году Мозер опубликовал упрощенную версию своего..

Повысьте производительность строк C#: советы по минимизации накладных расходов и повышению эффективности

Допустим, вы работаете над проектом, который включает большое количество текстовых файлов. Возможно, вам придется прочитать каждый файл, выполнить некоторые манипуляции со строками и записать..

Узнайте больше о перехвате DLL

Введение Подумайте о сценарии, в котором ваша организация стала жертвой утечки больших данных, которая потребовала от вас отключения сети на несколько часов. Если вы считаете, что..

Как работает агрегация моделей, часть 2 (машинное обучение)

pFedSim: агрегирование моделей с учетом подобия для персонализированного федеративного обучения (arXiv) Автор: Цзяхао Тан , Ипэн Чжоу , Ган Лю , Джесси Хуэй Ван , Шуй Юй . Аннотация:..

Введение Библиотека Python Moto — простой макет сервисов AWS

Добавьте больше достоверности в свои тесты Модульные тесты — это наша первая линия защиты от регрессивных изменений кода. Если ваш код Python требует использования ресурсов AWS, эта статья..

OpenAI платит африканским рабочим по 2 доллара в час, чтобы сделать ChatGPT безопаснее

Юридическое рабство — секрет полишинеля в технологической индустрии OpenAI платила кенийским рабочим от 1,32 до 2 долларов в час за чтение подробностей убийств, сексуального насилия над..

Прогнозирование будущего акций с помощью машинного обучения

Питон в финансах Мир финансов претерпел значительные изменения благодаря технологическому прогрессу. Любой другой Поколение Z , который не считает себя работающим с 9 до 5 до выхода на..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Python Software Development Web Development Coding Deep Learning React AI Software Engineering Nodejs Typescript Front End Development Computer Science Java Development NLP Angular Algorithms Javascript Tips Python Programming HTML Tech Programming Languages Data ChatGPT API Code Developer Reactjs CSS Neural Networks Data Visualization Tutorial Computer Vision Statistics