
Подкрепление действий собаки,как элемент дрессировки
Что такое подкрепление с точки зрения дрессировки?Это воздействие на собаку, которым мы стараемся объяснить собаке,что действия ее для нас правильны или неправильны.
В школе классических условных рефлексов (теория Павлова) подкреплением считается безусловное воздействие на собаку, связанное во времени с условным сигналом. Причем подкреплением может быть любая вызванная деятельность организма.
В случае наличия подкрепления условный рефлекс называют положительным (подкрепляемым), а в случае отсутствия безусловного воздействия — отрицательным или тормозным (неподкрепляемым).
Любое поведение определяется своими последствиями. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, животное проявит себя по-разному: повторит свое поведение, не придаст ему никакого значения, постарается избегать его повторения в дальнейшем. В любом случае животное стремится к получению положительного подкрепления, поскольку момент его получения всегда положительно эмоционален. Отрицательного подкрепления животное старается избежать, поскольку оно вызывает негативные эмоции.
С точки зрения мотивированного поведения подкреплением считается любое событие, увеличивающее, уменьшающее или исключающее вероятность удовлетворения имеющейся на данный момент потребности. Событие, связанное с ее удовлетворением, и сам факт удовлетворения — это положительное подкрепление, факт неудовлетворения — отрицательное.
Различают положительное и отрицательное условное подкрепление (известные всем «Хорошо!» и «Фу!»).
Чтобы условное подкрепление не потеряло своего сигнального значения, время от времени необходимо его подтверждать непосредственным воздействием на животное — так называемым натуральным подкреплением.
Особое значение имеет время подкрепления: закрепляется только поведение, непосредственно предшествующее подкреплению. В оперантном научении считается, что разрыв между нужной формой поведения и фактом подкрепления не должен составлять более 10 с. Если этот разрыв больше, научение может не состояться.
Частичное подкрепление условных сигналов (до 50%, а по некоторым данным — до 33—25% случаев), не затрудняет выработку условного рефлекса, но значительно замедляет его угашение при последующей отмене подкрепления. Но при свободном выборе режима положительного подкрепления животные выбирают ускоренный. Вариационный (вариабельный) режим подкрепления значительно закрепляет отработанный навык.
Значимость подкрепления, определяется его величиной, и при условии свободы выбора животные выбирают большую величину. Величина подкрепления должна быть такой, чтобы вызвать безусловную реакцию животного.
Следует всегда помнить об относительности биологической значимости подкрепления. Для сытого животного вряд ли значимым будет пищевое подкрепление. Некоторые собаки безразличны к ласковым словам или поглаживаниям, следовательно, такие действия хозяина не воспринимаются ими как подкрепление. Для одних животных сильный подкрепляющий фактор — игра, а для других — возможность свободы и физической активности. Одни собаки воспринимают рывок поводком средней силы как значимое отрицательное подкрепление, а другие не обращают на это внимание и продолжают тянуть.
Относительность подкрепления связана и с потребностью, испытываемой организмом. Если ваша собака очень хочет погнаться за кошкой, то ваш кусочек сыра вряд ли будет подкреплением команде подхода.
Значимость подкрепления определяется и значимостью связанной с ним потребности.
Говоря о значимости подкрепления, следует еще иметь в виду индивидуальные особенности животного и его ранний опыт.
Как при реактивном (классическом), так и при оперантном научении приобретенная реакция сохраняется лишь до тех пор, пока ее поддерживают безусловным раздражителем (в первом случае) или специальным подкреплением (во втором случае). Если же эти подкрепляющие факторы перестают действовать, то выработанное на их основе поведение быстро угасает и после нескольких попыток прекращается вовсе. Важно отметить, что речь здесь идет именно об угасании, а не об исчезновении или «стирании следов». Дело в том, что если снова начать использовать безусловный раздражитель или подкрепляющий фактор, то прежнее поведение почти сразу же восстанавливается.


