1. Не тратьте данные впустую: перенесите обучение, чтобы использовать все данные для эмуляции модели климата с машинным обучением(arXiv)

Автор: Рагхул Партипан, Дэймон Дж. Вишик

Аннотация : Как мы можем извлечь уроки из всех доступных данных при обучении моделей климата с машинным обучением, не неся при этом никаких дополнительных затрат во время моделирования? Как правило, обучающие данные содержат крупнозернистые данные высокого разрешения. Но сохранение только этих крупнозернистых данных означает, что остальные данные с высоким разрешением будут отброшены. Мы используем подход к трансфертному обучению, который можно применять к целому ряду моделей машинного обучения, чтобы использовать все данные с высоким разрешением. Мы используем три хаотические системы, чтобы показать, что они стабилизируют обучение, повышают эффективность обобщения и улучшают навыки прогнозирования. Наш анонимный код находится по адресу https://www.dropbox.com/sh/0o1pks1i90mix3q/AAAMGfyD7EyOkdnA_Hp5ZpiWa?dl=0.

2. Неконтролируемая нейростилистическая генерация текста с использованием трансферного обучения и адаптеров(arXiv)

Автор: Винайшекар Баннихатти Кумар, Рашми Гангадхарая, Дэн Рот

Аннотация .Исследования показали, что личность является ключевым фактором для улучшения взаимодействия и взаимодействия с пользователем в диалоговых системах. Разговорные агенты также должны поддерживать постоянный образ, чтобы вести увлекательную беседу с пользователем. Тем не менее, наборы данных генерации текста часто получаются из краудсорсинга и, таким образом, имеют эффект усреднения, когда стиль модели генерации является средним стилем всех краудсорсинговых работников, которые внесли свой вклад в набор данных. Хотя для каждой задачи можно собирать персональные наборы данных, это будет дорогостоящим и трудоемким процессом аннотирования. В этой работе мы предлагаем новую структуру трансферного обучения, которая обновляет только 0,3% параметров модели, чтобы изучить специфические атрибуты стиля для генерации ответов. В рамках данного исследования мы решаем задачу формирования стилистического окончания рассказа с помощью корпуса рассказов РПЦ. Мы изучаем специфические атрибуты стиля из набора данных PERSONALITY-CAPTIONS. Благодаря обширным экспериментам и оценочным показателям мы показываем, что наша новая процедура обучения может улучшить генерацию стиля на 200 по сравнению с базовыми уровнями кодировщика-декодера, сохраняя при этом показатели релевантности контента на уровне.

3.Диагностика неисправностей с помощью eXplainable AI: подход на основе передачи обучения для вращающегося оборудования с использованием дополненных синтетических данных(arXiv)

Автор: Лукас Коста Брито, Джан Антонио Сусто, Хорхе Ней Брито, Маркус Антонио Виана Дуарте

Аннотация:искусственный интеллект (ИИ) — это один из подходов, предложенных для анализа собранных данных (например, сигналов вибрации), обеспечивающих диагностику рабочего состояния актива. Известно, что модели, обученные на размеченных данных (с учителем), достигают отличных результатов, но две основные проблемы затрудняют их применение в производственных процессах: (i) невозможность или длительное время получения выборки всех условий эксплуатации (поскольку отказы случаются редко) и (ii) высокая стоимость экспертов для маркировки всех полученных данных. Еще одним ограничивающим фактором для применимости подходов ИИ в этом контексте является отсутствие интерпретируемости моделей («черные ящики»), что снижает уверенность в диагностике и доверие/принятие со стороны пользователей. Чтобы преодолеть эти проблемы, здесь предлагается новый общий и интерпретируемый подход к классификации неисправностей вращающихся механизмов, основанный на переносе обучения с расширенных синтетических данных на реальные вращающиеся механизмы, а именно FaultD-XAI (диагностика неисправностей с использованием объяснимого ИИ). Чтобы обеспечить масштабируемость с помощью трансферного обучения, создаются синтетические сигналы вибрации, имитирующие характерное поведение сбоев в работе. Применение Gradient-weighted Class Activation Mapping (Grad-CAM) с одномерной сверточной нейронной сетью (1D CNN) позволяет интерпретировать результаты, помогая пользователю в принятии решений и повышая достоверность диагностики. Предложенный подход не только показал многообещающие диагностические характеристики, но также позволил изучить характеристики, используемые экспертами для определения условий в исходной области и применить их в другой целевой области. Экспериментальные результаты предполагают многообещающий подход к использованию трансферного обучения, синтетических данных и объяснимого искусственного интеллекта для диагностики неисправностей. Наконец, чтобы гарантировать воспроизводимость и стимулировать исследования в этой области, разработанный набор данных становится общедоступным.