Как работает дифференциал нестерова: Блокировки дифференциала Нестерова ДАН купить по низкой цене
Дифференциал автоматический Нестерова (ДАН)
Дифференциал автоматический Нестерова (ДАН)
без преднатяга на ВАЗ, УАЗ, ГАЗель, Соболь,
НИВУ и Chevrolet NIVA
Доставка за 3 дня
УВЕЛИЧЕНИЕ ПРОХОДИМОСТИ АВТОМОБИЛЯ
НА ПОЛНЫЙ, ПЕРЕДНИЙ И ЗАДНИЙ ПРИВОД
АКЦИЯ — ЛЕТНЯЯ ГРЯЗЬ! Успейте оставить заявку ДО КОНЦА МЕСЯЦА, и получите скидку 2000 р. на покупку ДАНа
ОСТАВЬТЕ ЗАЯВКУ
и зафиксируйте свою скидку на
ДАН для Вашего автомобиля
100% гарантия возвратав течение 14 дней
Доставкапо всей России
за 1-3 дняБолее 3976 водителейуже приобрели
ДАН у нас12 месяцевгарантия
Возможно без предоплаты.Оплата при получении
6 типичных проблем,с которыми сталкиваются автовладельцы
- Отсутствие устойчивости автомобиля на скользком покрытии (например, езда по кольцу на льду)
- Заносит заднюю часть автомобиля при резком обгоне на трассе
- Застревает в песке, в снегу и в грязи
- Самоблок другого производства теряет предварительное натяжение (преднатяг), и тем самым теряет необходимые свойства автомобиля
- Другие самоблоки разделяются отдельно для города, отдельно для бездорожья
- С другими самоблоками приходится сильно давить на газ, чтобы произошло срабатывание.
Тем самым повышается вероятность застрять в грязи, в снегу, в песке.
Решение найдено
ДАН — единственный самоблок где представлена технология перераспределения моментов сил (усилий, крутящего момента) между колесами
ДАН соединил простоту и надежность жестких блокировок с плавностью передачи момента вращения дисковых и шестеренчатых дифференциалов с преднатягом.
Конструктивная особенность данной модели позволяет не только дифференцировать угловые скорости ведущих колес автомобиля при маневрах (поворотах), но и мягко перераспределять момент вращения от двигателя ведущим колесам, в зависимости от их сцепления с дорожным покрытием.
Принцип работыДАНа
При изменении коэффициента сцепления с дорогой одного из ведущих колес (изменение момента на полуоси) пара цепочка-шнек приходит в движение и плавно перераспределяет мощность на другое колесо.
При прямолинейном движении автомобиля пара шариковая цепочка — шнек неподвижна относительно друг друга.
Срабатывание ДАНа и перенос момента с колеса на колесо происходит практически мгновенно.
Получить дополнительную информацию
1 2 3 4 5 6
корпус дифференциала
крышки дифференциала
шариковые цепочки
полуоськаналы шариковых цепочек
Свойства ДАНа
Максимальный ресурс
Точность перехода шарика из крышки дифференциала на винтовые канавки шнека дает максимальный ресурс узла
Мгновенное срабатывание
ДАН имеет высокое сопряжение деталей, минимальный зазор между шариками составляет ~0,2 мм, что дает его мгновенное срабатывание и отсутствие шума
Надежность
Шнеки изготовлены из высокопрочной стали 25ХГНМТ с дополнительной операцией поверхностного упрочнения профиля, что делает ДАН более надежным и увеличивает срок службы дифференциала
12 причинустановить ДАН
на свой автомобиль
- Повышает проходимость автомобиля на плохих дорогах
- Улучшает управляемость при поворотах на скользких покрытиях
- Значительно увеличивает курсовую устойчивость автомобиля при обгоне на трассе (особенно зимой и в дождь)
- Не даст застрять в снегу, грязи и песке
- Увеличивает динамику разгона (особенно зимой)
- Спокойное использование в смешанном цикле вождения (город/бездорожье/трасса), при этом резина не портится
- Не требует регулировки преднатяга на весь срок службы
- Аналогичен классическому дифференциалу, поэтому не требуются изменения в конструкции автомобиля
- Монтаж автоматического дифференциала на автомобиль не отличается от монтажа классического дифференциала
- Не требует в процессе эксплуатации регулировок и применения специальных масел
- Снижает расход топлива зимой и в сложных дорожных условиях
- Автоматическая блокировка позволяет автомобилю продолжать движение в сложнопроходимых местах
Что говорят наши клиенты о дане
«В снегу и каше машина прёт как танк, при резком разгоне на дороге стоит как влитая!»
Ну вот и я разорился на самоблок. Шума не прибавилось от него! Со светофора стало гораздо легче трогаться! В снегу и каше машина прёт как танк, при резком разгоне на дороге стоит как влитая! В повороты теперь можно под газом вваливать. В общем мне очень понравилось и деньги потрачены не зря!
Дмитрий Терентьев
г. Тольятти, Лада-Гранта«…блокируется моментально, пробуксовки на глаз не видно.»
Отлично работает. На асфальте вообще незаметен, а в грязи прилично помогает, из диагонали задом (в сторону 100% хорошо выезжает) — блокируется моментально, пробуксовки на глаз не видно.
Николай Новиков
г. Москва, Шевроле-Нива«…раскорячивает на колеях и едет пока не зацепится и не выпрыгнет. …»
Себе тоже установил ДАН. Теперь балдею. Катаю как танк, из колеи выталкивает на ура. Если не идет вперед, то отступаю и снова ломлюсь вперед. Диагоналку ни разу не поймал, раскорячивает на колеях и едет пока не зацепится и не выпрыгнет. Разница заметна, горки на радость.
Роман Антоненков
г. Самара, ВАЗ
«Ощущения самые положительные!»
Поездил немного. Ощущения самые положительные! Если с места без блокировки нажать тапку в пол, то машина скорее закапывается, нежели едет. С блокировкой же всё иначе. Оба колеса пробуксовывают, но машина очень уверенно разгоняется. Короче, я очень доволен!
Сергей Юрьев
г. Самара, ВАЗ-2109«…без самоблока при резком старте очень сильно «шлифует» одно колесо. ..»
Сегодня прокатился за городом — решил провести маленькие испытания: старт с места до 100 км/ч на сухом асфальте. Результаты и ощущения: без самоблока при резком старте очень сильно «шлифует» одно колесо, бывает даже и на второй пробуксовывает. Визг стоит просто жуть. С самоблоком же только стоит взвизгнуть (именно взвизгнуть, а не визжать) одному колесу, как сразу машину начинает ощутимо тянуть вперёд.
Алексей Иванов
г. Уфа, Шевроле-Нива-
«…если газ убрать, то машина совершенно под другим радиусом идет в поворот.»
ДАН у меня год и работает достойно — честная 100 % блокировка вперед на тяге от мотора, то есть если газ убрать, то машина совершенно под другим радиусом идет в поворот.
Алексей Лагуткин
г. Москва, Лада-4×4
дифференциал автоматический нестерова в действии
КАК МЫ РАБОТАЕМ
- Вы оставляете заявку или
звоните нам - Наш менеджер свяжется с
Вами для подтверждения
заказа - Мы отправляем Вам
дифференциал в любой
город России - Вы оплачиваете деталь
в офисе транспортной компании
(при заказе с наложенным платежем) - Проходимость Вашего
автомобиля увеличивается
в разы
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Возможно ли поставить самоблок своими силами?
Да, очень часто наши клиенты сами устанавливают дифференциал. Работы по замене дифференциала ДАН не представляют собой большой сложности, и занимают не более 2-х часов.
Какие варианты оплаты?
Оплата может производиться любыми из всевозможных способов: безналичный расчет, кредитные карты, электронные деньги и наличными при получении в Вашем городе (наложенный платеж).
Требуются ли дополнительные настройки по ходу эксплуатации?
В процессе эксплуатации дифференциал ДАН не требует каких либо регулировок и настроек. Как говорится «поставил и не беспокоишься».
Ваш дифференциал нужно устанавливать у официального дилера?
Строгая установка у официальных дилеров не требуется. Вообще великой сложности заменить дифференциал нет — это штатная операция на любом СТО.
Увеличивается ли расход топлива?
Расход топлива не увеличивается, а наоборот уменьшается особенно в зимний период.
Не мешает ли он при обычной езде в городе?
Наш самоблокирующийся дифференциал абсолютно не мешает при езде по городу, а наоборот придает автомобилю дополнительную курсовую устойчивость и безопасность при выполнении маневров.
Какое масло требуется?
Для эксплуатации дифференциала ДАН, не требуется использование специальных, дорогостоящих масел как на винтовых или дисковых дифференциалах.
Кому он подходит?
Самоблокирующийся дифференциал Нестерова подходит большому кругу водителей от начинающих до профессионалов. А также подходит людям ведущие активный образ жизни (охота, рыбалка, грибы и другие выезды на природу).
Какой преднатяг у Вашего самоблока?
Как такового преднатяга у дифференциалов ДАН нет. У него вообще отсутствуют пружины, тем самым его свойства срабатывания никуда не исчезают, в отличие от винтовых и дисковых дифференциалов на весь срок службы.
Можно ли приобрести самоблок в моем городе?
Да конечно. Дилерская сеть партнеров развивается по всей России(уточняйте информацию у менеджера). Если же в Вашем городе отсутствуют такие, то можете приобрести наложенным платежем (оплата в транспортной компании Вашего населенного пункта после осмотра).
При каком усилии двигателя он срабатывает?
В отличие от винтовых и особенно дисковых дифференциалов наш дифференциал передает усилие с двигателя на взвешенное или заблокированное колесо плавно и без рывков. Срабатывание начинается при взвешивании уже через 2-3 см, что интересно на бездорожье и особенно на песке где можно легко закапаться.
Задать свой вопрос
ДОСТАВка В ЛЮБОЙ ГОРОД РОССИИ
Мы работаем по всей России.
Осуществляем доставку в любой город удобной для Вас
транспортной компанией.
Возможна оплата при получении.
ПОЛУЧИТЕ ПОЛНЫЙ КАТАЛОГ ЗАПЧАСТЕЙ
ОСТАВЬТЕ ЗАЯВКУ
и получите полный каталог
запчастей
Контакты
Телефон
8 (9377) 963-669 Работаем 7 дней в неделю 24 часа
Адрес
Самарская обл., г. Тольятти,
ул. Автостроителей 41а корпус 1, офис 12
Остались вопросы?
Задайте их нашему менеджеру
Политика конфиденциальности
Спасибо за заявку!
Наш менеджер обязательно Вам перезвонит
в ближайшее время.
Спасибо за заявку!
Наш менеджер обязательно свяжется с Вами
в ближайшее время.
Спасибо за вопрос!
Мы обязательно ответим на Ваш вопрос
в ближайшее время.
Спасибо за заявку!
Наш менеджер обязательно свяжется с Вами
для подтверждения заказа.
Самоблокирующийся дифференциал: как работает?
Термин «блокировка дифференциала», или «самоблокирующейся дифференциал» (самоблок), слышали многие автомобилисты, а вот как этот процесс выглядит на практике, знают лишь некоторые. И если раньше такой «опцией» автопроизводители оборудовали преимущественно внедорожники, то сейчас ее можно встретить и на вполне городском автомобиле. Кроме того, зачастую владельцы машин не оборудованных самоблоками, поняв, какую пользу они приносят, устанавливают их самостоятельно.
Но прежде чем разбираться с тем, как работает самоблокирующийся дифференциал, нужно понять, как он функционирует без блокировки.
Что такое дифференциал
Дифференциал (дифф) по праву можно считать одним из главных элементов конструкции трансмиссии автомобиля. С его помощью происходит передача, изменение, а также распределение выдаваемого двигателем крутящего момента между парой потребителей: колесами, расположенными на одной оси машины или же между ее мостами. Причем сила потока распределяемой энергии при необходимости может быть различной, а значит, и скорость вращения колес — разной.
В трансмиссии автомобиля дифф может быть установлен: в картере КПП и в раздаточной коробке, в зависимости от устройства привода(ов).
Те диффы, которые установлены в мосту или КПП, называются межколесными, а который находится между осями машины, соответственно — межосевым.
Назначение дифференциала
Как известно, автомобиль во время движения совершает различные маневры: повороты, перестроения, обгоны и т. д. Кроме того, поверхность дороги может содержать неровности, а это значит, что колеса автомобиля, в зависимости от ситуации, в одно и то же время могут проходить различное расстояние. Поэтому, например, при повороте, если скорость вращения колес на оси будет одинаковой, то одно из них неминуемо станет пробуксовывать, что приведет к ускоренному износу покрышек. Но это не самое страшное. Гораздо хуже то, что у транспортного средства значительно снижается управляемость.
Вот для решения подобных проблем и придумали дифференциал — механизм, который будет перераспределять энергию, поступающую от двигателя, между осями автомобиля в соответствии с величиной сопротивления качению: чем оно меньше, тем больше будет скорость вращения колеса, и наоборот.
Механизм дифференциала
На сегодняшний день существует множество разновидностей диффов, и их устройство довольно сложное. Однако принцип работы в целом одинаков, поэтому будет проще для понимания рассмотреть самый простой тип — открытый дифференциал, который состоит из следующих элементов:
- Шестеренок, закрепленных на полуосях.
- Ведомой (коронной) шестерни, выполненной в виде усеченного конуса.
- Ведущей шестерни, закрепленной на конце ведущего вала, которая в совокупности с коронной образует главную передачу. Так как ведомая шестерня по размерам больше ведущей, то последней придется сделать несколько оборотов вокруг своей оси, прежде чем коронная выполнит только один. Следовательно, именно эти два элемента дифференциала снижают величину энергии (скорости), которая в итоге дойдет до колес.
- Сателлитов, которые образуют играющий ключевую роль в обеспечении необходимой разности в скорости вращения колес.
- Корпуса.
Как работает дифференциал
Во время прямолинейного движения автомобиля его полуоси, а значит, и колеса, вращаются с такой же скоростью, как и ведущий вал со своей косозубой шестерней. Но во время поворота воздействующая нагрузка на колеса становится различной (одно из них пытается крутиться быстрей), и за счет этой разницы освобождаются сателлиты. Теперь энергия двигателя проходит через них, а так как пара сателлитов — это две отдельные, независимые шестерни, то к полуосям передается разная по величине частота вращения. Таким образом, мощность, вырабатываемая двигателем, распределяется между колесами, но неравномерно, а в зависимости от действующей на них нагрузки: то, что двигается по внешнему радиусу, испытывает меньшее сопротивление качению, поэтому дифф передает на него больше энергии, раскручивая быстрее.
Разницы в том, как работает межосевой дифференциал и межколесный, нет: принцип действия аналогичен, только в первом случае распределенный крутящий момент направлен к осям автомобиля, а во втором — к его колесам, расположенным на одной оси.
Потребность в межосевом диффе особенно становится заметна во время движения машины по пересеченной местности, когда ее вес давит на ту ось, которая находится ниже другой, например, на подъеме или спуске.
Проблема дифференциала
Несмотря на то что дифференциал, безусловно, играет большую роль в конструкции автомобиля, его работа иногда создает проблемы для водителя. А именно: когда одно из колес оказывается на скользком участке дороги (грязи, льду или снегу), то другое, находящееся на более твердом грунте, начинает испытывать повышенную нагрузку, дифф старается это исправить, перенаправляет энергию двигателя на скользящее колесо. Таким образом, выходит, что оно получает максимальное вращение, в то время как другое, имеющее плотное сцепление с грунтом, попросту остается неподвижным.
Вот именно для решения подобных проблем была придумана блокировка (отключение) дифференциала.
Принцип блокировки и ее виды
Поняв принцип работы дифференциала, можно заключить, что если заблокировать его, то увеличится крутящий момент на том колесе или оси, которое имеет лучшее сцепление. Это можно сделать, если соединить его корпус с одной из двух полуосей или же остановить вращение сателлитов.
Блокировка может быть полной — когда части дифференциала соединяются жестко. Осуществляется, как правило, при помощи кулачковой муфты и управляется водителем через специальный привод из кабины автомобиля. Или же она может быть частичной, в этом случае на колеса передается только ограниченное усилие — так работает самоблокирующийся дифференциал, которому участие человека не требуется.
Как работает самоблокирующийся дифференциал
Самоблокирующийся дифференциал, по сути, представляет собой компромисс между полным блоком и свободным диффом и позволяет снизить пробуксовку колес машины в случае возникновения между ними разницы в коэффициенте сцепления с грунтом. Таким образом, значительно повышается проходимость, управляемость на бездорожье, а также динамика разгона автомобиля, причем независимо от качества дороги.
Самоблок исключает полную блокировку колес, что защищает полуоси от критических нагрузок, которые могут возникнуть на дифференциалах с принудительным выключением.
Блокировка с полуосей снимается автоматически, если при прямолинейном движении скорости вращения колес выравнивается.
Самые распространенные типы самоблоков
Дисковый самоблок — это набор фрикционных (трущихся) дисков, установленных между корпусом диффа и шестерней полуоси.
Понять, как работает дифференциал с таким блоком, несложно: пока машина едет по прямой, корпус диффа и обе полуоси крутятся вместе, как только в скоростях вращения появляется разница (колесо попало на скользкий участок), между дисками возникает трение, снижающее ее. То есть колесо, оставшееся на твердом грунте, продолжит вращаться, а не остановится, как в случае свободного дифференциала.
Вискомуфта, или иначе вязкостная муфта, так же как и предыдущий дифф, содержит два пакета дисков, только на этот раз перфорированных, установленных между собой с небольшим зазором. Одна часть дисков имеет сцепление с корпусом, другая — с валом привода.
Диски, помещены в емкость, заполненную кремнийорганической жидкостью, которая при равномерном их вращении остается в неизменном состоянии. Как только между пакетами появляется отличие в скорости, жидкость начинает быстро и сильно густеть. Между перфорированными поверхностями возникает сопротивление. Чересчур раскрутившийся пакет таким образом притормаживается, и скорость вращения выравнивается.
Зубчатый (винтовой, червячный) самоблок. Его работа базируется на способности червячной пары расклиниваться и тем самым блокировать полуоси при возникновении на них разницы в крутящих моментах.
Кулачковый самоблок. Чтобы понять, как работает дифференциал такого типа, достаточно представить открытый дифф, в котором вместо планетарного шестеренчатого механизма установлены зубчатые (кулачковые) пары. Кулачки проворачиваются (перескакивают), когда скорости вращения колес практически одинаковы, и жестко блокируются (заклиниваются), как только какое-то из них начинает пробуксовывать.
Разницы в том, как работает блокировка межосевого дифференциала и межколесного, нет — принцип действия одинаков, отличия только в конечных точках: в первом случае — два моста, во втором — два колеса, установленных на одной оси.
Отечественная «Нива» и ее дифференциалы
В линейке отечественных ВАЗов «Нива» занимает особенное место: в отличие от своих «родственников» по конвейеру, эта машина оборудована не выключаемым полным приводом.
В трансмиссии ВАЗовского внедорожника установлено три дифференциала: межколесные — в каждом мосту, и межосевой — в раздатке. Несмотря на такое количество, разбираться заново в том, как работают дифференциалы на «Ниве», не придется. Все точно так же, как описывалось выше. То есть, во время прямолинейного движения машины, при условии отсутствия пробуксовок на колесах, тяговое усилие между ними распределено равномерно и имеет одинаковую величину. Когда какое-то из колес начинает буксовать, то вся энергия от двигателя, пройдя через диффы, направляется к этому колесу.
Блокировка дифференциалов «Нивы»
Прежде чем говорить о том, как работает блокировка дифференциалов на «Ниве», следует отметить один момент, а именно уточнить назначение передней (маленькой) ручки раздаточной коробки.
Некоторые водители полагают, что с ее помощью у машины включается передний привод — это не так: и передний, и задний приводы у «Нивы» задействованы всегда, а этой ручкой осуществляется управление дифференциалом раздатки. То есть пока она установлена в положении «вперед», дифф работает в штатном режиме, а когда «назад» — отключается.
А теперь непосредственно о блокировке: при выключении дифференциала валы раздаточной коробки замыкаются между собой муфтой, тем самым принудительно выравнивая скорости их вращения, то есть суммарная скорость колес передней оси приравнивается к суммарной скорости задней. Распределение тяги происходит в сторону большего сопротивления. Допустим, буксует заднее колесо, если включить блокировку, тяговое усилие уйдет на переднюю ось, колеса которой вытянут машину, но если одновременно с задним забуксует и переднее колесо, то самостоятельно «Нива» уже не выберется.
Чтобы такого не случалось, автолюбители в мосты устанавливают самоблоки, которые помогут вытянуть застрявшую машину. На сегодняшний день самым популярным среди владельцев «Нивы» является дифференциал Нестерова.
Самоблок Нестерова
Именно в том, как работает дифференциал Нестерова, и заключен секрет его популярности.
Конструкция дифа позволяет не только оптимально регулировать колес машины при совершении маневров, но и в случае пробуксовок или вывешивании колеса устройство отдает ему минимальное количество энергии от двигателя. Причем реакция самоблока на изменение дорожной ситуации практически мгновенная. Кроме того, дифференциал Нестерова значительно улучшает управляемость машины даже на скользких поворотах, повышает курсовую устойчивость, повышает динамику разгона (особенно в зимний период), снижает расход горючего. А монтаж устройства не требует никаких изменений в конструкции трансмиссии и устанавливается точно так же, как классический дифф.
Дифференциал нашел применение не только в автомобильной технике, он оказался весьма полезен и на мотоблоках, значительно облегчив жизнь его владельцам.
Дифференциал для мотоблока
Мотоблок — агрегат довольно тяжелый, и, чтобы его просто повернуть, требуется немало усилий, а при нерегулируемой угловой скорости вращения колес это становится еще сложнее. Поэтому владельцы этих машин, если диффы не предусматривались изначально конструкцией, приобретают и устанавливают их самостоятельно.
Как работает дифференциал мотоблока? По сути, он лишь обеспечивает легкий разворот машины, останавливая одно из колес.
Другая его функция никак не связанная с перераспределением мощности — это увеличение базы колес. Конструкция дифференциала предусматривает его использование как удлинителя осей, что делает мотоблок более маневренным и устойчивым к опрокидываниям, особенно на поворотах.
Словом, дифференциал — вещь весьма полезная и незаменимая, а его блокировка в разы повышает проходимость автомобиля.
Взгляд динамических систем на ускорение Нестерова
Майкл Мюлебах, Майкл ДжорданМатериалы 36-й Международной конференции по машинному обучению , PMLR 97:4656-4662, 2019.
Аннотация
Мы представляем структуру динамической системы для понимания метода ускоренного градиента Нестерова. В отличие от более ранней работы, наш вывод не опирается на аргумент об исчезающем размере шага. Мы показываем, что нестеровское ускорение возникает в результате дискретизации обыкновенного дифференциального уравнения с помощью полунеявной схемы интегрирования Эйлера. Мы анализируем как основное дифференциальное уравнение, так и дискретизацию, чтобы получить представление о явлении ускорения. Анализ показывает, что в основе этого явления лежит зависящий от кривизны член демпфирования. Далее мы устанавливаем связи между дискретной и непрерывной динамикой.
Процитировать эту статью
БибТекс
@InProceedings{pmlr-v97-muehlebach29a,
title = {Взгляд динамических систем на ускорение {N}esterov},
автор = {Мюлебах, Майкл и Джордан, Майкл},
booktitle = {Материалы 36-й Международной конференции по машинному обучению},
страницы = {4656--4662},
год = {2019},
редактор = {Чаудхури, Камалика и Салахутдинов, Руслан},
громкость = {97},
серия = {Материалы исследования машинного обучения},
месяц = {09--15 июня},
издатель = {PMLR},
pdf = {http://proceedings.mlr.press/v97/muehlebach29a/muehlebach29a.pdf},
URL = {https://proceedings.mlr.press/v97/muehlebach29a.html},
abstract = {Мы представляем структуру динамической системы для понимания метода ускоренного градиента Нестерова. В отличие от более ранней работы, наш вывод не опирается на аргумент об исчезающем размере шага. Мы показываем, что нестеровское ускорение возникает в результате дискретизации обыкновенного дифференциального уравнения с помощью полунеявной схемы интегрирования Эйлера. Мы анализируем как основное дифференциальное уравнение, так и дискретизацию, чтобы получить представление о явлении ускорения. Анализ показывает, что в основе этого явления лежит зависящий от кривизны член демпфирования. Далее мы устанавливаем связи между дискретной и непрерывной динамикой.}
}
Сноска
%0 Документ конференции
%T Взгляд динамических систем на ускорение Нестерова
%A Михаэль Мюлебах
%A Майкл Джордан
%B Материалы 36-й Международной конференции по машинному обучению
%C Материалы исследования машинного обучения
%D 2019
%E Камалика Чаудхури
%E Руслан Салахутдинов
%F pmler-v97-muehlebach29a
%I PMLR
%P 4656--4662
%U https://proceedings.mlr.press/v97/muehlebach29a.html
%V 97
%X Мы представляем структуру динамической системы для понимания метода ускоренного градиента Нестерова. В отличие от более ранней работы, наш вывод не опирается на аргумент об исчезающем размере шага. Мы показываем, что нестеровское ускорение возникает в результате дискретизации обыкновенного дифференциального уравнения с помощью полунеявной схемы интегрирования Эйлера. Мы анализируем как основное дифференциальное уравнение, так и дискретизацию, чтобы получить представление о явлении ускорения. Анализ показывает, что в основе этого явления лежит зависящий от кривизны член демпфирования. Далее мы устанавливаем связи между дискретной и непрерывной динамикой.
АПА
Мюлебах, М. и Джордан, М.. (2019). Взгляд динамических систем на ускорение Нестерова. Proceedings of the 36th International Conference on Machine Learning , in Proceedings of Machine Learning Research 97:4656-4662 Доступно по адресу https://proceedings.mlr.press/v97/muehlebach29a.html.
Сопутствующий материал
Почти сходящийся | где простые идеи и принципиальный подход сходятся с работающими алгоритмами машинного обучения
Что такое Стохастический градиентный спуск по расписанию (SRSGD)?
Стохастический градиентный спуск (SGD) с постоянным импульсом и его варианты, такие как Адам, являются предпочтительными алгоритмами оптимизации для обучения глубоких нейронных сетей (ГНС). Поскольку обучение DNN невероятно затратно в вычислительном отношении, существует большой интерес к ускорению сходимости. Ускоренный градиент Нестерова (NAG) улучшает скорость сходимости градиентного спуска (GD) для выпуклой оптимизации с использованием специально разработанного импульса; однако он накапливает ошибку, когда используется неточный градиент (например, в SGD), замедляя конвергенцию в лучшем случае и расходясь в худшем. В этом посте мы кратко рассмотрим текущие методы оптимизации на основе импульса, а затем представим Scheduled Restart SGD (SRSGD), новую схему в стиле NAG для обучения DNN. SRSGD заменяет постоянный импульс в SGD увеличивающимся импульсом в NAG, но стабилизирует итерации, сбрасывая импульс до нуля в соответствии с графиком. Используя различные модели и тесты для классификации изображений, мы демонстрируем, что при обучении DNN SRSGD значительно улучшает сходимость и обобщение. Кроме того, SRSGD достигает аналогичного или даже лучшего уровня ошибок с меньшим количеством периодов обучения по сравнению с базовым уровнем SGD. (Ознакомьтесь с исследовательской статьей, слайдами и кодом.)
Почему у SRSGD принципиальный подход?
Градиентный спуск (GD) имеет низкую вычислительную сложность, легко распараллеливается и обеспечивает скорость сходимости, не зависящую от размерности основной задачи. Однако он страдает от патологической кривизны, участков поверхности потерь, которые не масштабируются должным образом. В частности, в этих областях поверхность очень крутая в одном направлении и плоская в других направлениях. В результате, как показано на рисунке 1, GD отскакивает от гребней оврага, замедляя сходимость алгоритма.
Рисунок 1: Патологическое искривление. ГД отскакивает от гребней оврага в одном направлении и медленно движется в другом [А. Катурия, 2018].
Проблемы патологической кривизны можно избежать с помощью методов второго порядка, таких как метод Ньютона, который учитывает кривизну поверхности потерь. Однако для этого метода требуется гессиан, вычисление которого требует больших затрат. Метод на основе импульса является альтернативным подходом, который приблизительно фиксирует кривизну, учитывая прошлое поведение градиентов. В методах, основанных на импульсе, предыдущие градиенты добавляются к текущим градиентам в экспоненциальном среднем порядке следующим образом [B. Поляк, 19 лет64]. Следовательно, импульс помогает ускорить локальную сходимость GD.
Рисунок 2: Импульс складывает компоненты вдоль w2 и обнуляет компоненты вдоль w1, тем самым устраняя отскок между двумя гребнями [A. Катурия, 2018].
В то время как тяжелый шар и импульсы вперед улучшают локальную сходимость. Они не дают глобальных гарантий, и скорость сходимости по-прежнему составляет O(1/9).0071 к ). Ускоренный градиентный спуск по Нестерову (NAG) улучшает скорость сходимости до O(1/ k 2 ) за счет увеличения импульса на каждом шаге следующим образом [Y. Е. Нестеров, 1983]:
Можно доказать, что точный предел схемы NAG при малом размере шага s является ОДУ 2-го порядка, таким образом, NAG на самом деле не является методом спуска, но наследует колебательное поведение от его аналог ODE (см. рис. 3 слева) [W. Су, С. Бойд и Э. Кандес, 2014].
Рисунок 3: Сравнение GD, GD + Momentum, NAG, ARNAG и SRNAG в случае точного градиента, градиента с постоянной дисперсией, искаженного гауссовым шумом, и градиента, искаженного гауссовым шумом, с затухающей дисперсией. Целевая функция в данном случае выпуклая.
Адаптивный перезапуск NAG (ARNAG) улучшает NAG, сбрасывая импульс до нуля всякий раз, когда объективная потеря увеличивается, тем самым отменяя колебательное поведение NAG [B. О’Донохью, 2015]. При правильном допущении о резкости ARNAG может достичь экспоненциальной скорости сходимости [V. Руле и др., 2017].
К сожалению, когда градиенты неточны, как в случае стохастического градиентного спуска (SGD), ни NAG, ни ARNAG не могут обеспечить быструю сходимость. В то время как NAG накапливает ошибку и медленно сходится или даже расходится, ARNAG перезапускается слишком часто и почти вырождается в SGD без импульса. При неточной настройке градиента перезапуск Nesterov Momentum в NAG по фиксированному расписанию помогает преодолеть накопление ошибок и проблемы с частыми перезапусками (см. рис. 3 в середине справа). Этот подход приводит к запланированному перезапуску NAG (SRNAG) [V. Руле и др., 2017]. Обновление SRNAG дано
Наш запланированный перезапуск SGD (SRSGD) является стохастической версией SRNAG для обучения с мини-пакетами
Интересная интерпретация SRSGD заключается в том, что это интерполяция между SGD без импульса (когда частота перезапуска мала) и SGD с импульсом Нестерова (NASGD) (когда частота перезапуска велика) (см. рис. 4).
Рис. 4: Потеря обучения и ошибка теста ResNet-101, обученного на ImageNet с разными начальными частотами перезапуска F1. Мы используем линейный график и линейно уменьшаем частоту перезапуска до 1 на последней скорости обучения. SRSGD с малым F1 приближается к SGD без импульса, тогда как SRSGD с большим F1 приближается к NASGD.
Почему SRSGD прост?
SRSGD не требует дополнительных вычислений или памяти. Кроме того, для реализации SRSGD требуется изменить всего несколько строк кода SGD. Таким образом, SRSGD наследует все вычислительные преимущества SGD: низкую вычислительную сложность и простоту распараллеливания.
Работает ли SRSGD?
1. DNN, обученные SRSGD, обобщают значительно лучше, чем обученные SGD с постоянным импульсом. Улучшение становится более значительным по мере того, как сеть становится глубже (см. рис. 5).
Рис. 5. Ошибка в зависимости от глубины моделей ResNet, обученных с помощью SRSGD и базового SGD с постоянным импульсом. Преимущество SRSGD продолжает расти с глубиной.
2. SRSGD уменьшает переоснащение в очень глубоких сетях, таких как ResNet-200, для классификации ImageNet.
3. SRSGD может значительно ускорить обучение DNN. Для классификации изображений SRSGD может значительно сократить количество эпох обучения, сохраняя или даже улучшая точность сети. В частности, на CIFAR10/100 количество эпох обучения можно уменьшить вдвое с помощью SRSGD, в то время как в ImageNet сокращение эпох обучения колеблется от 10 до 30 и увеличивается с глубиной сети (см. рис. 6).
Рис. 6: Ошибка теста в зависимости от уменьшения количества эпох в CIFAR10 и обучении ImageNet. Пунктирные линии — ошибки теста базовой линии SGD. Для CIFAR обучение SRSGD с меньшим количеством эпох может дать сравнимые результаты с обучением SRSGD с полными 200 эпохами. Для ImageNet обучение с меньшим количеством эпох немного снижает производительность SRSGD, но все же дает результаты, сравнимые с базовым обучением SGD.
Ссылки
Kathuria, A. Введение в оптимизацию в глубоком обучении: Momentum, RMSProp и Adam. https://blog.paperspace.com/intro-to-optimization-momentum-rmsprop-adam/.
Нестеров Ю. Е. Метод решения задачи выпуклого программирования со скоростью сходимости o (1/kˆ 2). В Докл. акад. наук СССР, том 269, с. 543–547, 1983.
О’Донохью Б. и Кандес Э. Адаптивный перезапуск для ускоренных градиентных схем. Основы вычислительной математики, 15(3):715–732, 2015.
Поляк Б.Т. Некоторые способы ускорения сходимости итерационных методов.