Публикации по теме 'reinforcement-learning'
Обучение робота-гуманоида навигации с помощью искусственного интеллекта
В этом блоге мы увидим, как робот-гуманоид учится перемещаться к своей цели с помощью искусственного интеллекта (ИИ) в моделировании. ИИ, который мы будем использовать для обучения гуманоидов, называется Обучение с подкреплением .
Что такое обучение с подкреплением?
Мифы о машинном обучении
Машинное обучение прошло через несколько волн своего внедрения. С годами доступность данных увеличилась в геометрической прогрессии. В то же время мощность компьютеров увеличилась в соответствии с законом Мура, создав множество возможностей для машинного обучения.
Машинное обучение претерпевает быструю эволюцию от базового машинного обучения (жесткие методы, которые изначально пришли из статистики) к продвинутому машинному обучению, глубокому машинному обучению и всему комплексу..
Что такое ChatGpt?
CHATGPT — это вариант языковой модели GPT-3 (Generative Pre-trained Transformer 3), разработанной OpenAI. Он разработан, чтобы иметь возможность общаться с людьми в естественной и последовательной манере, аналогично тому, как может работать чат-бот-человек.
Модель GPT-3 обучается на большом наборе данных текста, включая книги, статьи и веб-сайты, которые используются для обучения генерированию человеческого текста. Модель предварительно обучена на этом наборе данных с использованием..
Обучение с подкреплением: подробное руководство
За последние несколько лет обучение с подкреплением (RL) приобрело известность как влиятельная основа для решения сложных задач принятия решений в различных областях. RL — это подполе машинного обучения, в котором особое внимание уделяется обучению агентов делать наилучший возможный выбор в динамических средах, полагаясь на обратную связь в виде вознаграждений или штрафов. В этой статье мы стремимся углубиться в зачатки RL, включая его основные элементы, а также некоторые критические..
Технологии машинного обучения, которые, как мне кажется, изменят финансы
Существует множество новых технологий машинного обучения, две из которых я нахожу действительно интересными и на которых я сосредоточусь для своего нового стартап-фонда, основанного на машинном обучении.
Во-первых, это глубокое обучение. Для незнакомых, методологии глубокого обучения, по сути, пытаются создать большие «нейронные сети», состоящие из «нейронов», которые соединяются друг с другом, усиливая и ослабляя связи на основе базовых моделей, которые они находят в своих наборах..
5 этапов жизненного цикла проекта генеративного ИИ
Жизненный цикл проектов Генеративный ИИ состоит из пяти отдельных этапов, сосредоточенных вокруг большой языковой модели .
1️⃣ Предварительное обучение : включает создание LLM с нуля . Подобные BERT, GPT4, Llama 2 прошли предварительную подготовку на большом массиве данных. Миллиарды параметров обучаются. Предварительное обучение — это задача обучения без учителя , целью которой является генерация текста или прогнозирование следующего маркера . Предварительное обучение — это..
Стратегии развития
Такой простой, но такой мощный
Если вы недавно экспериментировали с алгоритмами обучения с подкреплением (RL), то наверняка заметили, насколько сложно их правильно реализовать: вычисление градиентов, добавление целевых сетей, воспроизведение опыта…
Конечно, вы всегда можете использовать сторонние реализации, например Базовые показатели OpenAI , но это противоречит цели обучения. Вы никогда не сможете полностью освоить алгоритм, если не реализуете его самостоятельно с нуля.
Итак,..
Новые материалы
Алиса в стране машинного обучения — инициатива «100 дней кода машинного обучения»
Covnets, регрессия, классификация, ReLU, предвзятость… — все это интригующие жаргоны, которые я слышал от своих сверстников, выбравших курс машинного обучения, по касательной во время обычного..
Иногда учитель, всегда ученик
Учение Йоды в применении к развитию разработчиков
«Делай или не делай. Нет никакой попытки.”
Обучение программированию превратилось в современное «создание группы» или «написание книги»...
Как создать файл конфигурации сборки в Xcode | Серия настроек проекта Xcode
Эта статья шаг за шагом расскажет вам, как создать новый файл конфигурации сборки в вашем проекте Xcode.
Что такое файл конфигурации сборки?
Файл конфигурации сборки — это обычный..
Venv против Virtualenv в Python — что использовать?
Когда дело доходит до создания виртуальных сред в Python, есть два популярных варианта: venv и virtualenv. Оба инструмента служат одной цели — созданию изолированных сред для ваших проектов..
Реализация персептрона на Python (для абсолютных новичков)
Введение
За последние пару десятилетий было довольно много шумихи вокруг искусственного интеллекта и его приложений. В этой статье мы обсудим, что такое искусственный интеллект и его основное..
С помощью javascript мы можем сделать это в одну строку.
С помощью javascript мы можем сделать это в одну строку.
let x = 5;
let y = 7;
y = [x, x = y][0];
Но то, что мы можем , не обязательно означает, что мы должны это делать.
Визуальное руководство по обозначениям срезов
Любимый способ изучить традиционные обозначения срезов Python.
Нотации срезов обычно являются одними из первых «хитростей», которые программисты изучают в процессе изучения Python. Эта тема..