Главная » Блог » Научпоп » Сила стимулов: скрытые силы, формирующие поведение
Научпоп

Сила стимулов: скрытые силы, формирующие поведение

Стимулы – вот что движет человеческим поведением. Понимание стимулов – ключ к пониманию людей. И наоборот, непонимание важности стимулов часто приводит к серьезным ошибкам.

***

«Никогда и никогда не думайте о чем-то другом, когда вам следует думать о силе стимулов».

– Чарли Мангер

По словам Чарли Мангера, есть лишь несколько сил, более могущественных, чем стимулы. В своей речи «Психология человеческих неверных суждений» он размышляет о том, как сила стимулов никогда его не разочаровывает:

Что ж, я думаю, что всю свою жизнь я был в топ-5% своей возрастной когорты в понимании силы стимулов, и всю свою жизнь я недооценивал ее. И никогда не проходит год, но я получаю сюрприз, который немного раздвигает мой предел.

Иногда решение проблемы поведения состоит в том, чтобы просто пересмотреть стимулы и убедиться, что они соответствуют желаемой цели. Мангер говорит о Federal Express, который является одним из его любимых примеров силы стимулов:

Суть целостности системы заключается в том, что все упаковки необходимо быстро перемещать в одном центральном месте каждую ночь. И система не будет целостной, если всю смену нельзя сделать быстро. И у Federal Express было чертовски много времени, чтобы заставить эту вещь работать.
И они пытались уговорить их, они испробовали все на свете, и, наконец, кому-то пришла в голову радостная мысль, что они оплачивают ночную смену почасово, и что, возможно, если они будут платить им посменно, система будет работать лучше. И о чудо, это решение сработало.

Если вы пытаетесь изменить поведение, разум уведет вас далеко. Размышляя о другом примере, когда несогласованные стимулы препятствовали продажам превосходного продукта, Мангер сказал:

В начале истории Xerox Джо Уилсон, который тогда был в правительстве, был вынужден вернуться в Xerox, потому что он не мог понять, почему их лучшая, новая машина так плохо продавалась по сравнению с их более старой и худшей машиной. Конечно, когда он пришел туда, он обнаружил, что договоренность о комиссионных с продавцами дает огромный стимул для низкокачественной машины.

Игнорирование стимулов почти никогда не помогает. Чтобы создать взаимовыгодные отношения, необходимо думать о мотивах других.

Мы можем обратиться к психологии, чтобы получить более структурированное и полное понимание того, как стимулы формируют наши действия.

Наука армирования

Науку подкрепления поддерживал Бурхус Фредерик Скиннер (обычно его звали Б.Ф. Скиннер), профессор психологии в Гарварде с 1958 по 1974 год.

Скиннер, в отличие от своих современников, отказывался выдвигать гипотезы о том, что происходило изнутри (что думали и чувствовали люди или животные), и предпочитал сосредоточиться на том, что мы можем наблюдать. Для него сосредоточение внимания на том, сколько люди съели, значило больше, чем сосредоточение внимания на субъективных показателях, например, насколько голодны люди или какое удовольствие они получают от еды. Он хотел выяснить, как переменные среды влияют на поведение, и считал, что поведение формируется его последствиями.

Если нам не нравятся последствия предпринятого действия, мы с меньшей вероятностью сделаем это снова; если нам действительно нравятся последствия, у нас больше шансов повторить это снова. Это предположение является основой оперантного обусловливания, «типа обучения, при котором сила поведения изменяется [его] последствиями, такими как награда или наказание». 1

Одним из наиболее важных изобретений Скиннера была камера оперантного кондиционирования, также известная как «ящик Скиннера», которая использовалась для изучения воздействия подкрепляющих веществ на лабораторных животных. Крысы в ящике должны были понять, как выполнить задание (например, нажать на рычаг), чтобы вознаградить их едой. Такая автоматизированная система позволила Скиннеру и тысячам его последователей изучать обусловленное поведение в контролируемых условиях.

Годы исследований подкрепления показали, что последовательность и выбор времени играют важную роль в формировании нового поведения. Психологи утверждают, что лучший способ научиться сложному поведению – это постоянное подкрепление , при котором желаемое поведение подкрепляется каждый раз, когда оно выполняется.

Например, если вы хотите научить собаку новому трюку, разумно вознаградить ее за каждый правильный ответ. В самом начале процесса обучения ваша неспособность немедленно отреагировать на положительное поведение может быть неверно истолкована как признак неправильного поведения с точки зрения собаки.

Прерывистое подкрепление – это подкрепление, которое дается только в некоторых случаях, когда возникает желаемое поведение, и оно может быть выполнено в соответствии с различными графиками, некоторые из которых предсказуемы, а некоторые нет (см. «Планирование подкрепления» ниже). Периодическое подкрепление считается наиболее эффективным способом поддерживать уже усвоенное поведение. Это связано с тремя причинами.

Во-первых, вознаграждение за поведение отнимает время от продолжения поведения. Платить рабочему после того, как каждая деталь собрана на конвейере, просто не имеет смысла.

Во-вторых, периодическое подкрепление лучше с экономической точки зрения. Не только дешевле не вознаграждать каждый случай желаемого поведения, но и, делая вознаграждение непредсказуемым, вы вызываете волнение и, таким образом, получаете усиление реакции без увеличения количества подкрепления. Прерывистое подкрепление – вот как работают казино; они хотят, чтобы люди играли в азартные игры, но они не могут позволить, чтобы люди очень часто выигрывали крупные суммы.

Наконец, прерывистое подкрепление может вызвать сопротивление исчезновению (прекращение поведения при удалении подкрепления). Рассмотрим пример сопротивления, изложенный в учебнике Психология: основные концепции:

Представьте себе двух игроков и два игровых автомата. Одна машина необъяснимо окупается при каждом испытании, а другая, более обычная машина, платит по непредсказуемому, прерывистому графику. Теперь предположим, что оба устройства внезапно перестают платить. Какой игрок поймает первым?

Большинство из нас, вероятно, догадается правильно:

Тот, кто был вознагражден за каждое нажатие на рычаг (непрерывное подкрепление), быстро заметит изменение, в то время как игрок, выигравший лишь изредка (при частичном подкреплении), может продолжать играть без вознаграждения в течение длительного времени.

Планирование армирования

Прерывистое подкрепление можно использовать по разным расписаниям, каждый со своей степенью эффективности и ситуациями, к которым его можно соответствующим образом применить. Графики соотношения основаны на количестве ответов (объеме проделанной работы), тогда как графики интервалов основаны на количестве затраченного времени.

  • Графики с фиксированным соотношением используются, когда вы платите своим сотрудникам в зависимости от объема работы, которую они выполняют. График с фиксированным соотношением обычен для фрилансеров, когда подрядчики получают сдельную оплату. Менеджеры любят графики с фиксированным соотношением, потому что реакция на подкрепление обычно очень высока (если вы хотите, чтобы вам платили, вы делаете работу).
  • График с переменным соотношением непредсказуем, потому что количество ответов между подкрепителями варьируется. Телемаркетологи, продавцы и игроки в игровые автоматы находятся в этом графике, потому что они никогда не знают, когда произойдет следующая распродажа или следующий крупный выигрыш. Сам Скиннер продемонстрировал силу этого расписания, показав, что голодный голубь будет клевать диск 12000 раз в час, получая вознаграждение в среднем только за каждые 110 клеваний. Неудивительно, что это тот тип подкрепления, который обычно вызывает больше откликов, чем любой другой график. (Изменение интервалов между подкреплениями – еще один способ сделать подкрепление непредсказуемым, но если вы хотите, чтобы люди чувствовали себя оцененными, такой график, вероятно, не подходит.)
  • График с фиксированным интервалом является наиболее распространенным типом оплаты – он вознаграждает людей за время, потраченное на конкретную задачу. Вы, наверное, уже догадались, что количество откликов в этом расписании очень низкое. Даже крыса в ящике Скиннера, запрограммированном на график с фиксированными интервалами, узнает, что нажатие на рычаг сверх необходимого минимума – просто трата энергии. По иронии судьбы, работа с 9 до 5 – предпочтительный способ вознаграждения сотрудников в бизнесе.

Хотя составление расписания может быть мощной техникой для продолжения или усиления определенного поведения, мы все же можем не осознавать важный аспект подкрепления – индивидуальные предпочтения конкретных наград.

Опыт показывает, что выживание зависит от нашей потребности в пище и воде. Однако большинство из нас не живет в условиях крайней нехватки, поэтому типы подкрепления, которые нам нравятся, будут разными.

Культура играет важную роль в определении эффективных подкреплений. А то, что укреплено, формирует культуру. Предложение билетов на матч по крикету могло бы стать мощной наградой для кого-то в стране, где крикет имеет большое значение, но было бы бессмысленным для большинства американцев. Точно так же офис с кондиционером может быть мощным стимулом для сотрудников в Индонезии, но не будет иметь такого значения для сотрудников в более умеренных регионах.

А как насчет наказания?

До сих пор мы говорили о положительном подкреплении – о прянике, если хотите. Однако есть и палка.

Нет сомнений в том, что наше общество в значительной степени полагается на угрозы и наказания как способ держать себя в узде. Тем не менее, мы продолжаем опаздывать, забываем дни рождения и получаем штрафы за парковку, хотя мы знаем, что есть вероятность, что нас могут наказать.

Есть несколько причин, по которым наказание может быть не лучшим способом изменить чье-то поведение.

Во-первых, Скиннер заметил, что способность наказания подавлять поведение обычно исчезает, когда угроза наказания устраняется . Действительно, мы все воздерживаемся от использования социальных сетей в рабочее время, когда мы знаем, что наш босс рядом, и мы точно так же соблюдаем ограничение скорости, когда знаем, что за нами наблюдает полицейский патруль.

Во-вторых, наказание часто вызывает реакцию «бей или беги» и делает нас агрессивными . Когда нас наказывают, мы стремимся избежать дальнейшего наказания, а когда побег заблокирован, мы можем стать агрессивными. Эта связь между наказанием и агрессией также может объяснить, почему жестокое обращение с родителями происходит из-за жестокого обращения с семьей.

В-третьих, наказание подавляет способность учиться новым и лучшим ответам . Наказание приводит к различным реакциям, таким как побег, агрессия и приобретенная беспомощность, – ни одна из которых не способствует процессу обучения субъекта. Наказание также не показывает испытуемым, что именно они должны делать, и вместо этого сосредотачивается на том, чего не следует делать. Вот почему среда, прощающая неудачи, так важна в процессе обучения.

Наконец, наказание часто применяется неравномерно . Мы руководствуемся предвзятостью в оценке того, кто заслуживает наказания. Мы ругаем мальчиков чаще, чем девочек, физически наказываем школьников чаще, чем взрослых, и контролируем представителей расовых меньшинств чаще (и жестче), чем белых.

Что мне делать вместо этого?

Есть три альтернативы, которые вы можете попробовать в следующий раз, когда почувствуете искушение кого-то наказать.

Первое, о чем мы уже говорили, – вымирание . Ответ обычно уменьшается или исчезает, если он перестает приносить те награды, которые он когда-то приносил. Однако важно, чтобы все возможные подкрепления были задержаны. В реальной жизни это сделать намного сложнее, чем в лабораторных условиях.

Это особенно затрудняет то, что в процессе вымирания организмы стремятся искать новые методы для получения подкрепления. Это означает, что скулящий ребенок либо удвоит свои усилия, либо изменит тактику, чтобы вернуть внимание родителей, прежде чем прекратить свое поведение. В этом случае лучшая стратегия вымирания состоит в том, чтобы комбинировать методы, удерживая внимание после того, как появляется нытье, и награждая более желательное поведение вниманием до того, как оно появится.

Вторая альтернатива – это позитивное усиление предпочтительных занятий . Например, люди, которые регулярно тренируются (и получают от них удовольствие), могут использовать ежедневную пробежку в качестве награды за выполнение других задач. Точно так же маленькие дети учатся сидеть спокойно, получая время от времени возможность бегать и шуметь. Главный принцип этой идеи состоит в том, что предпочтительное занятие, такое как бег, можно использовать для усиления менее предпочтительного занятия. Эта идея также называется принципом Премака.

Наконец, подсказки и формирование – это два действия, которые мы можем использовать вместе для итеративного изменения поведения. Подсказка – это сигнал или стимул, побуждающий к желаемому поведению. Когда начинается формирование, любое приближение к целевому отклику усиливается. Как только вы увидите, что приближение происходит регулярно, вы можете сделать критерий для цели более строгим (фактическое поведение должно более точно соответствовать желаемому поведению) и продолжать сужать критерии до тех пор, пока не будет выполнено конкретное целевое поведение. Эта тактика часто является предпочтительным методом постепенного развития привычки и обучения животных определенному поведению.

***

Я надеюсь, что теперь вы лучше подготовлены к тому, чтобы признать стимулы как мощные силы, формирующие наше поведение и поведение других людей. В следующий раз, когда вы захотите, чтобы кто-то изменил свое поведение, подумайте об изменении его стимулов.

Как и любой родитель, я все время экспериментирую со своими детьми. Одна из самых эффективных вещей, которые я делаю, когда один из них плохо себя ведет, – это признавать чувства моего ребенка и спрашивать его, чего он пытается достичь.

Например, когда один ребенок бьет другого, я спрашиваю его, чего он пытался достичь. Обычно ответ такой: «Он меня ударил. (Так что я ударил его в ответ.) «Я знаю, что это касается автоматической реакции человека, которую многие взрослые не могут контролировать. Это заставляет меня задуматься, как я могу изменить поведение своих детей, чтобы сделать его более эффективным.

«Итак, ты был зол и хотел, чтобы он знал?»

“Да.”

«Люди не для того, чтобы бить. Если хочешь, я помогу тебе рассказать ему, почему ты злишься.

Напряжение рассеивается. И я (надеюсь) начинаю заставлять своих детей думать об эффективных и неэффективных способах достижения их целей.

Наказание лучше всего предотвращает действия, тогда как стимулы лучше всего их поощряют.

Давайте закончим отличным советом относительно стимулов. Вот Чарли Мангер, выступающий на церемонии открытия Университета Южной Калифорнии:

Вы не хотите попадать в извращенную систему стимулов, которая заставляет вас вести себя все более и более глупо или все хуже и хуже – стимулы являются слишком мощным средством контроля над человеческим познанием или человеческим поведением. Если вы работаете в одной [из этих систем], у меня нет для вас решения. Вам придется разобраться в этом самостоятельно, но это серьезная проблема.

Добавить комментарий

Нажмите здесь, чтобы оставить комментарий