a2 absolute
position
Besucher
Counter

Konditionierung

Tiere lernen anhand der Erfahrungen, die sie machen, ihr Verhalten entsprechend anzupassen.

Dabei muss man zwei prinzipiell verschiedene Lernvorgänge unterscheiden:

die Reizbedingte (Klassische) Konditionierung:

Durch diese Lernform wird keine neues Verhalten, sondern ein neues Reizmuster gelernt,

welches dann ein bereits vorhandenes Verhalten auslöst.

die Verhaltensbedingte (Operante) Konditionierung:

Hierbei wird eine neue Verhaltensweise gelernt,

die vorher bei diesem Tier nicht beobachtet werden konnte.

Reizbedingte (Klassische) Konditionierung

Diese Lernform wurde von Iwan Pawlow beschrieben.

Er war Mediziner (Nobelpreis in Medizin 1904) und beobachtete eher beiläufig,

dass seine Versuchshunde bereits beim Anblick ihres Tierpflegers Speichel absonderten,

egal ob sie Futter sehen konnten oder nicht. Sie hatten offenbar gelernt,

dass der Anblick des Pflegers Futter erwarten lässt.

Pawlow führte daraufhin Experimente durch, bei denen er die Versuchsbedingungen standardisierte, so dass sie wissenschaftlich reproduzierbare Ergebnisse erbrachten.

Ausgangssituation

Er isolierte und fixierte die Hunde und maß den Speichelfuss quantitativ, als Maß der Reaktion der Hunde auf angebotene Reize. Der Anblick von Futter bewirkte eine sofortige Speichelabsonderung. Dies ließ sich durch einen reflexartigen Reiz-Reaktionszusammenhang erklären.

Das Futter wirkt als ein unbedingter Reiz

Die Speichelabsonderung ist ein unbedingter Reflex

Hier wirkt also lediglich ein bekanntes Reizmuster als Schlüsselreiz für einen angeborenen Reflex (Angeborener Auslösemechanismus).

Lernphase

Nun wird in unmittelbarer zeitlicher Nachbarschaft (in Kontiguität) zum unbedingten Reiz (Futter) ein zweiter, neutraler Reiz (ein Glockensignal) dargeboten. Optimale Lernerfolge werden erzielt, wenn der neutrale Reiz 0,5 Sekunden vor dem unbedingten Reiz erscheint.

Das Glockensignal in diesem Versuch kann dabei mit dem Erscheinen des Tierpflegers aus der oben beschriebenen Zufallsbeobachtung Pawlows verglichen werden. In beiden Fällen passiert nun folgendes:

Der Hund assoziiert den unbedingten Reiz (Futter) mit dem bis dahin neutralen Reiz (Glocke oder Tierpfleger). Diese Assoziation ist dem Tier nicht bewusst! Es lernt so ein neues Reizmuster (die Glocke/den Tierpfleger) für ein schon vorhandenes Verhalten (die Speichelabsonderung).

Kannphase

Wird dem Hund nach der Lernphase nun der vormals neutrale Reiz angeboten, so reagiert der Hund darauf mit Speichelabsonderung. Der ehemals neutrale Reiz wurde nun zum bedingten Reiz, der unbedingte Reflex zum bedingten Reflex.

 

 

 

 

 

Generalisierung und Erweiterung des Erlernten

Das erlernte Reizmuster (Glockensignal), welches nun den bedingten Reflex auslöst, kann auch in leicht abgewandelter Form dargeboten werden (z.B. eine Oktave höher oder tiefer). Je ähnlicher der Reiz dem konditionierten Reizmuster ist, desto stärker fällt die Reaktion darauf aus. Man nennt dieses Phänomen "Generalisierung".

Unter "Erweiterung" versteht man das Phänomen, einen konditionierten Reiz wiederum mit einem neutralen Reiz zu assoziieren. So kann man z.B. vor dem Glockensignal eine farbige Tafel zeigen. Nach einigen Wiederholungen löst nun auch die farbige Tafel den bedingten Reflex aus. Man spricht dann von einem bedingten Reflex 2. Ordnung. Beim Mensch können Reflexe bis zur 7. Ordnung konditioniert werden.

 

Bedingte Appetenz / Bedingte Aversion

Lernt ein Reh, dass es an einer Futterkrippe im Wald Heu erhält, so wird es bei Hunger diese Futterkrippe aufsuchen. Auch hierbei wird kein neues Verhalten gelernt, da ja die Futtersuche bei Hunger (Vorliegen der inneren Handlungsbereitschaft) genetisch bedingt abläuft. Es wird aber ein neues Reizmuster gelernt. Der vormals neutrale Reiz "Futterkrippe" wird durch die angenehme Erfahrung "Fütterung mit Heu" zum bedingten Reiz. Das gezielte Aufsuchen der Futterkrippe wird nun als "Bedingte Appetenz" bezeichnet.

 

 

 

Genau so wie angenehme Erfahrungen mit einem bestimmten Reizmuster assoziiert werden, können auch unangenehme Erfahrungen das Verhalten verändern. Wird z.B. ein Hund beim Gassigehen an einer Garagenausfahrt (=neutraler Reiz) von einem schnell herausfahrenden Auto erschreckt, so wird der Hund beim nächsten Spaziergang an der selben Stelle u.U. zurückschrecken oder sich weigern weiterzugehen, auch wenn kein Auto zu sehen ist. Solche unangenehmen Erfahrungen werden häufig sehr schnell gelernt, was ja auch Sinn macht, denn manche unangenehmen Erfahrungen überlebt ein Tier nur mit Glück ein einziges mal (z.B. Erfahrungen mit Fressfeinden). Das Zurückschrecken vor oder Meiden eines bestimmten Reizmusters (in unserem Beispiel die Garagenausfahrt als nun bedingten Reiz) wird als "Bedingte Aversion" bezeichnet.

 

Extinktion und Habituation

Im Gegensatz zu Prägungsvorgängen sind Konditionierungen reversibel. Dieses "Verlernen" macht Konditionierungsvorgänge flexibel. Man kann zwei Arten von "Verlernen" unterscheiden:

Extinktion: Ein durch angenehme Erfahrung gelerntes Appetenzverhalten oder ein bedingter Reflex kann verlernt werden, wenn der bedingte Reiz wiederholt ohne den ursprünglich notwendigen unbedingten Reiz dargeboten wird. Am Beispiel des Hundes würde dies heißen, dass das Glockensignal wiederholt ohne Futtergabe ertönt. Nach einigen Wiederholungen bleibt der Speichelfluss aus. Das Erlernte wurde aber nur unterdrückt, nicht passiv vergessen. Wenn man nämlich nach einer Erholungspause das Glockensignal erneut ertönen lässt, so zeigt der Hund wieder die bedingte Reaktion.

Habituation: Eine bedingte Aversion kann abgebaut werden, wenn auf den bedingten Reiz (im obigen Beispiel die Garagenausfahrt) wiederholt keine unangenehme Erfahrung folgt. Der Hund gewöhnt sich daran, dass die Garagenausfahrt keine Gefahr bedeutet und reagiert schließlich nicht mehr mit Aversionsverhalten.
 

 

Verhaltensbedingte (Operante) Konditionierung

Im Gegensatz zur Klassischen Konditionierung wird bei der Operanten Konditionierung nicht ein neues Reizmuster für die Auslösung eines bekannten Verhaltens gelernt, sondern es wird eine völlig neue Verhaltensweise gelernt, wie man sie vor dem Lernvorgang beim entsprechenden Tier nicht beobachten konnte.

Dieser Lerntyp wurde vom amerikanischen Verhaltensforscher Burrhus F. Skinner an Ratten und Tauben erforscht. Er setzte diese in Versuchskäfige ("Skinner-Box"), in denen sie durch zunächst zufällige Betätigung eines Hebels eine Belohnung (in Form eines Futterkorns) oder eine Bestrafung (durch einen Stromschlag) erhielten. Diese Erfahrungen wirkten als positive oder negative Verstärkung für das jeweilige Verhalten. Die Versuchstiere lernten so, ein Verhalten zielgerichtet zu zeigen (Bedingte Aktion) oder zu unterlassen (Bedingte Hemmung).

Bedingte Aktion:

  • Das Betätigen des Hebels B (neutraler Reiz) ist eine neuartige, zufällig auftretende Verhaltensweise. Sie ist auf das Neugierverhalten (Erkundungsverhalten) der Ratte zurückzuführen.
  • Bei Drücken von Hebel B erhält die Ratte ein Futterkorn. Nach einigen Wiederholungen und bei Vorliegen von Hunger (innere Handlungsbereitschaft) wird die Ratte dies als Belohnung (positive Verstärkung) für die neue Verhaltensweise erleben.
  • Sie wird dieses Verhalten bei erneutem Hunger sofort wieder zeigen. Die Motivation wird in den Dienst einer neuen Verhaltensweise gestellt. Sie hat gelernt, dass das Drücken auf den grünen Knopf zur Futtergabe führt. Der Hebel wure zum bedingten Reiz, das Drücken des Hebels zur Bedingten Aktion

Bedingte Hemmung:

  • Bei zufälligem Betätigen von Hebel D (neutraler Reiz) erhält die Ratte einen Stromschlag. Dieser wirkt als Bestrafung.
  • Der neutrale Reiz (roter Hebel) wird dadurch zum bedingten Reiz. Die Ratte lernt, das Drücken des roten Hebels zu unterlassen (Bedingte Hemmung).