Allgemeine Psychologie (Fach) / Lernen (Lektion)

In dieser Lektion befinden sich 35 Karteikarten

Lernen

Diese Lektion wurde von Voigtcornelia erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Lernen Definition Lernen ist die relativ überdauernde Veränderung des Verhaltenspotenzials auf Grundlage von Erfahrung. Damit ist das Verhalten hinsichtlich reflexartiger Reaktionen, instinktive Reaktion, willkürliches Verhalten und physiologische Reaktionen gemeint. Nicht das Verhalten an sich ist interessant, sondern dessen Wahrscheinlichkeit und Häufigkeit. Kompetenz ist nicht gleich Performanz, erlerntes Verhalten wird nicht immer gleich gezeigt. Abzugrenzen von Verhaltensänderungen durch biologische Reifung, Evolution, Hirnschädigung etc. zudem ist assoziatives Lernen gemeint, also die Verknüpfung zwischen zwei Elementen, nicht bspw. Habituation oder Dishabituation.
  • Klassisches konditionieren Lernvorgang, bei dem 2 Reize US / CS zusammen dargeboten werden, als folge ändert sich die Reaktion auf den CS, die CR. es wird ein unkonditionieter Stimulus US, welcher zuverlässig und automatisch eine unkonditionierte Reaktion auslöst UR, gemeinsam mit einem konditionierten Stimukus CS dargeboten, welcher ursprünglich keine Reaktion UR hervorrief - als folge löst auch der CS die CR aus
  • Experimentelle Paradigmen des klassischen konditionierens Lidschlussreaktion - US= Luftstoß, UR= Lidstoß; CS=einfacher physikalischer Reiz wie Licht oder Ton; benötigt viele Lerndurchgänge, CS wird unmittelbar mit US dargeboten EDR (electrodermal response) - US = Elektroschock oder lautes Geräusch, UR= Veränderung der elektrischen Hautleitfähigkeit durch Änderung der Schweißdrüsenaktivität; CS= einfache physikalische als auch komplexe Reize wie gesichternoder Wörter möglich, Reaktion erst 1-2 sek nach Stimulus,  konditionierte emotionale Reaktion - US = Schmerzreiz, idR Elektroschock, UR= Furcht, CS = beliebiger Reiz; relativ lange Präsentation nötig, aber nur einige Wiederholungen, bsp Angst vorm Zahnarzt  Geschmacksaversion - US= Agens der zu Übelkeit führt, UR = Übelkeit, CS = Geschmacksreiz; es können sogar Stunden zwischen CS und US liegen, oft reicht ein Lerndurchgang, bsp Übelkeit nach Meeresfrüchten 
  • Prinzipien des klassischen konditionierens Stärke der CR wird in unterschiedlichen Einheiten gemessen, oft auch erst in der Löschungsphase asymptotischer lernverlauf, am ende des Trainings sind die lernzuwächse geringer als zu Beginn, negativ beschleunigt Anzahl der Durchgänge bis zum erlernen sehr unterschiedlich  zeitlich unterschiedlicher zeitlicher Vorsprung des CS vor dem US optimal (200-500ms LS, Speichel 5-10 sek, EDR 1-2 mehrere sek, emotionale Reaktion 1-3 min, geschmacksaversion sogar Stunden 
  • Klassische Konditionierung: Akquisitionsphase CS und US werden gemeinsam dargeboten Darstellung Versuchsverlauf Trials auf x Achse, Stäre der CR auf y Achse Simultankonditionierung (zeitgleiche Darbietung) führt nur zu kleiner oder schwacher CR verzögerte Konditionierung (zunächst nur CS dargeboten, US später hinzugefügt mit kurzzeitiger Überlappung, idR erfolgreicher als Spurenkonditionierung, indifferent bei konditionierter emotionaler Reaktion) Spurenkonditionierung (erst CS und später US, dazwischen kurze Pause, funktioniert zum Beispiel bei Geschmacksaversion) Rückwärtskonditionierung (erst US dann CS) bringt sogar Hemmung der Konditionierung (inhibitorische Konditionierung) daher kann der Grund für den Vorteil von Verzögerter und Spurenkonditionierung gegenüber Simultankonditionierung nicht an der getrennten Verarbeitungsmöglichkeit liegen Größe des optimalen Zeitabstandes unterschiedlich, mglw. funktional begründet
  • Löschung der klassischen Konditionierung erfolgt nicht mit Zeit, sondern mit alleiniger Präsentation CS ohne US, CR nimmt dann mit zunhemender Wiederholung ab = Löschung / Extinktion dass nur die CR gelöscht wird, nicht aber die Assoziation, belegen Spontane Erholung (CR ist nach Pause während der Löschungsphase wieder stärker), Disinhibition (wenn anderer Reiz vor CS präsentiert wird kommt es zur Erholung / Ablenkung) und schneller Wiedererwerb (weniger Wiederholungen bis zum Wiedererlernen) mögliche Erklärung: konditionierte Hemmung, die aber weniger stark ist 
  • Generalisierung der klassischen Kondition je mehr sich Testreiz vom Trainingsreiz unterscheidet, desto geringer fällt CR aus
  • Klassische Konditionierung: Assoziationen CS/US bzw. CS/UR häufigste These: Assoziationen CS/US (Signallernen)Aber: auch CS/UR naheliegend (Stimulussubstitution)praktisch wichtige Differezierung für Veränderungen ungewünschter Assoziatioen im Falle einer Phobieeine Reihe von Argumenten sprechen gegen Theorie der Stimulussubstitution: CR ist nicht gleich URCR ist meist schwächer, langsamer, unvollständig, und kann sogar entgegengesetzt sein (Konditionierung der Effekte von Drogen)auch für Theorie des Signallernens problematisch CR tritt auch auf, wenn UR unterdrückt wirdWird die Lernsituation so manipuliert, dass während der Akquisitionsphase der UR peripher unterdrückt wird (beim Speichelfluss z.B. durch Gabe von Atropin), zeigt die CS Präsentation später trotzdem CR Reaktion, obwohl diese beim Konditionieren nie auftrat; beobachtbare UR nicht notwendig für Konditionierung Sensorische Präkonditionierung zeigt CS-CS AssoziationenVorkonditionierung wird erreicht, indem vor der klassischen Konditionierung zwei unterschiedliche CS gemeinsam dargeboten werden (z.B. Licht und Ton); anschließend Konditionierung nur auf eine der CS; schließlich bewirkt die Darbietung des anderen CS trotzdem die Auslösung der CR, obwohl diese CS nie mit dem US gepaart wurde es gibt jedoch auch Belege für S-R Assoziationen z.B. sekundäre Konditionierung:CS2 wird mit US gepaart und eine CR wird etabliert. Anschließend wird CS2 als US verwendet, und mit einer CS1 gepaart, bis diese die CR auslöst. Selbst wenn jetzt die CS2 wieder gelöscht wird, löst die CS1 noch die CR aus - obwohl ja keine Verbindung CS-CS mehr vorhanden ist., daher muss es auch S-R Verknüpfung gebenwerden offenbar aber nur unter besonderen Bedingungen gebildet, aersiven Stiumuli, z.B. konditionierte Furcht auf traumatische Reize, die nur schwer zu löschen ist neuere Studien in der Amygdala zeigen multiple assoziaitionen, die sich als S-R und S-S interpretieren lassenS-S Verknüpfungen werden im baso-lateralen Kern der Amygdala vermittelt, der centrale Kern bestimmt die autonomen ReaktionenKonditionierung funktioniert auch ohne baso-laterale Kern, Hinweise deuten aber auf S-R Verknüpfungen hin
  • Funktionen klassische Konditionierung Theorie, dass Verhaltensmuster biologische Funktion haben, d.h. dem Organismus bei Selbsterhaltung und Fortpflanzung helfen Theorie, dass erwartete Reize weniger unangenehm sind als erwartete, wurde widerlegt (Miller, 1983; Ratten wurden trainiert, schwachen bzw. starken Schock über drücken eines entsprechenden Hebels zu berichten; bekamen anschließend mittleren Schock, der entweder angekündigt wurde oder nicht; angekündigter Schock wurde seltener als schwach berichtet als der unangekündigte) ermöglicht also vielmehr proaktives Verhalten zur Verringerung von Gefahr, wenn Hinweise bereits die Reaktion auslösen; wichtiger Überlebensvorteil gegenüber reaktivem Verhalten bei bestehender Gefahr Anwendungsgebietez.B. Krebstherapie: Medikamente lösen schwere Übelkeit aus, Geschmacksaversionen treten auf gegen Speisen am Tag der Behandlung; Aversionstherapie gegen Alkoholismus (gepaart mit Übelkeit erregendem Agens / Emetikum)
  • Inhibitorische klassische Konditionierung exzitatorischer CS (CS+) kündigt Anwesenheit des US an (Prädikator), 1,0 als zuverlässige Ankündigung der Anwesenheit (US nur wenn vorher CS) inhibitorischer CS (CS-) kündigt Abwesenheit des US an (Prädikator), -1,0 als zuverlässige Ankündigung der Abwesenheit (US niemals wenn vorher CS) Bsp. Leher mit Mappe (CS+) als Ankündigung eines Tests; Mikroskop (CS-) als Abkündigung eines Tests Korrelation zwischen -1,0 und 1,0 - Konditionierung ist langsamer und die  CR ist schwächer, z.B. erreicht, wenn CS oder US in einigen Durchgängen allein präsentiert werden; ist Wahrscheinlichkeit für CS oder keine CS bei einem US ausgewoge (50/50), findet keine Konditionierung statt Nachweise der inhibitorischen Konditionierung:Retardationstest (erst CS- etabliert, wird zu CS+ umtrainiert; CR sollte verzögert (=retardiert) sein, wenn CS- inhibitorisch wirkt)Summationstest (CS+ und CS- werden unabhängig voneinander konditioniert; bei erfolgreicher inhiitorsicher Konditionierung sollte bei gemeinsamer Präsentation (=Summation) die CR verringert auftreten (Summation von CS+ und CS-) Vorgehensweise zur inhibitorischen KonditionierungCS-Präexposition (wiederholte alleinige Präsentation CS vor Paarung mit US, CR wird verzögert; tatsähclich kene echte inhibitorische Konditionierung, sondern nur Habituation der Orientierungsreaktion, weil: keie Wirkung im Summationstest, zeigt nicht Abwesenheit an sondern hat gar keien Informationsgehalt; CS Präexposition führt zur Nichtbeachtung des CS, was dem Aufbau der Konditionierung zunächst entgegensteht)Zusatzreizparadigma (CS- tritt gemeinsam mit CS+ auf, dann Abwesenheit des US; CS+ allein, dann Anwesenheit des US)Differentielle Konditionierung (Zufällige Abfolge CS+ mit US und CS- ohne US)
  • Klassische Konditionierung: Blocking ursprünglich Annahme, dass allein die gemeinsame Darbietung von US und CS hinreichend und notwendig für erfolgreiche Konditionierung ist = Kontiguitätsannahme, Assoziation aufgrund räumlicher oder zeitlicher Nähe in Frage gestellt durch Experiment von Kamin (1969) zum Blocking Effekt:Ratten erhalten in beiden Gruppen (kontroll und Experimental) Konditionierung einer emotionalen Reaktion auf einen Verbundreiz Licht-Ton in 8 Trials, der von Elektroschock gefolgt ist; CR = Furcht, die auch durch alleinige Präsentation von L ausgelöst wurde(Kontrollgruppe); die Experimentalgruppe bekam jeodoch vorher eine Knoditionierung Ton-Elektroschock (16 Trials), erst anschließend Verbundreiz (LT 8 Trials), zeigte anschließend auf L kaum Furcht Interpretation: Kontrollgruppe assoziiert LT mit Schock, L ähnelt LT, kündigt Schock an, daher FurchtExperimentalgruppe: T kündigt Schock zuverlässig an/Schock kann durch T vorhergesagt werden, LT kein zusätzlicher Informationswert;T Konditionierung Blockiert LT Konditionierung CS muss also einen Informationswert bezüglich es Auftretens von US haben, bloße Kontiguität nicht ausreichend für Konditionierung
  • Klassische Konditionierung: Equipotentialität und Preparedness Ursprüngliche Annahme der Equipotentialität, d.h. Modalität des CS (visuell, auditiv, gustatorisch, taktil, interozeptiv, ...) frei wählbar Experiment von Garcia und Kölling (1966) widerlegt diesRatten bekam helles (Licht), lautes (Ton), leckeres (mit Salz oder Saccarin versetztes) Wasser und 1/2 Schock / Stromstoß, 1/2 Übelkeit erzeugendes Argens (Röntgenstrahlen oder Lithiumchlorid) jeweils solang, bis Wasser vermieden wirdBei anschließenden Tests mieden Ratten mit Schock-Konditionierung nur lautes und helles Wasser, Ratten mit Übelkeit-Konditionierung nur leckeres Wasser SchlussfolgerungenUS und CS müssen zueinander passeLernen sind biologische Grenzen gesetzt Preparedness Hypothese Seligman (1970)Preparedness = Vorbereitet sein, bezeichnet angeborene spezifische Lernbereitschafft für bestimmte AssoziationenFällt leichter, von einem Gefahrenreiz zurückzuweichen als auf ihn zuzugehenHängt mit der biologischen NIsche zusammenZ.B. Nachtaktive Ratten verlassen sich stark auf Geschmacks- und Geruchssinn, daher wird Übelkeit eher auf Geschmacksreiz bezogenz.B: Tagaktive Vögel visuell orientiert, assoziieren eher visuellen Reiz mit Übelkeit
  • Rescorla-Wagner-Modell der klassischen Konditionierung (1972) Zusammenhänge beim klassischen Konditionieren:Anzal der Trials erhöht Assoziationsstärke CS/USZuwaches an Assoziationsstörke wird mit jedem Lerndurchgang geringer, Lernkurve negativ beschleunigt lernen = Zunahme der Assoziationsstörke zwischen CS/US, nähert sich mit jedem Trial an maximale AS anist die Assoziationsstärke maximal, wird nichts mehr dazu gelerntCS muss Informaitonswert fürs Auftreten des US haben (Blocking Effekt) formales Modell des assoziativen LernensFormel beschreibt den Zuwachs an Assoziationsstärke je Lerndurchgang als mit Lernrate gewichtete Differenz aus maximal möglicher und aktueller Assoziaitonsstärke ΔV = a (λ-V) λ = maximal mögliche Assoziationsstörke CS/US (max. 1,0)V = aktuelle Assoziationsstärke zwischen CS/US (beim 1. Durchgang 0)a = Lernrate des CS zwischen 0 und 1; je geringer, desto länger dauert es bis zum asymptotischen Lernniveau, ist abhängig von Salienz (Auffälligkeit) des CSΔV = Veränderung der Assoziationsstärke zwischen CS und US nach einem Lerndurchgang V(n) = V(n-1) + ΔV (aktuelle Assoziationsstärke = summe der bisherigen AS) BlockingV hat nach mehreren Trials bereits hohen Wertmaximale Assoziationsstärke ist begrenztAktueller Lernzuwachs durch λ-V beschränkt ÜbererwartungseffektV1(n) = 0,8, V2(n) = 0,7, V(n) = 1,5λ = 1,0Phase II: ΔV = a (λ-V) = 0,2 (1,0-1,5) = 0,2*(-0,5) = -0,1 Problematisch 1) erklärt Löschung formal (US abwesend, λ-V=0-1=-1, daher auch ΔV negativ), Spontanerholung, Disinhibition etc. werden nicht erklärt2) Stimuluspräexposition (Habituation der OrientierungsreaktionI nicht erklärt3) Assoziative Präferenzen nicht erklärbar AnwendungNeuroinformation, künstichen neuronalen Netzen soll etwas gelernt werden, äquivalent zur Delta-Regel, mit der einsichtige neuronale Netzwerke trainiert werden
  • Übererwartungseffekt klassische Konditionierung ÜbererwartungseffektEin Versuchstier erwartet bei zwei voneinander unabhängigen und einzeln präsentierten CS eine Belohnung. Werden nun beide CS zusammen präsentiert, findet eine Schwächung der CS-US-Paarung statt, weil das Versuchstier nun eigentlich 2 Belohnungen (für jeden CS eine) erwartet. Bekommt es wie bisher jedoch nur eine Belohnung, ist dies eine inhibitorische Konditionierung.
  • Klassische Konditionierung drogeninduzierter physiologischer Reaktionen Orthodoxe Konditionierung: CR höher (als UR), umso höher die USParadoxe Konditionierung: CR ist das Gegenteil der UR für gleiche USReaktion des Körpers auf Wirkstoffe, die das Gegenteil des gewünschten Effektes bewirktBsp. Morphium (US und CS) löst Speicherproduktio (UR und CR) aus (Orthodox)Bsp. Morphium (US und CS) löst Hyperthermie aus (UR und CR) (Orthodox)Bsp. Atropin (US) hemmt die Speichelprodution, die CR ist aber eine erhöhte Speichelproduktion (paradox)Bsp. Ethanol (US) senkt die Körpertemperatur / Hypothermie (UR), als CS wird jedoch erhöhte Körpertemperatur bewirkt (CR) (paradox) Eikelboom und Steward (1982) argumentieren, dass CR immer der UR ähnelt, scheinbar paradoxe Wirkungen resultieren aus oberflächlicher Bestimmung von US und UR;als US wird oft die experimentelle Manipulation selbst bezeichnet, obwohl diese nicht direkt auf das NS einwirkt (obwohl klass. Konditionierung eine Leistung des NS ist)für unmittelbare Effekt des Pharmakons ist die Wirkung Orthodox, für mittelbare Effekte paradox; zu einer paradoxen Konditierung kommt es daher, wenn das Pharmakon periphere körperliche Vorgänge beeinflusst, die durch das NS über eine Feedbackschleife reguliert werden (das nehmen wir dann nur wahr)z.B. Körpertemperatur und Morphium (US): Senkung durch direkte wirkung im NS (UR)z.B: Körpertemperatur und Alkohol: periphere körperliche Reaktionen zur Temperaturwiederherstellung versagen, Temperatur fällt also in kühlerer Umgebung, was wiederum über afferenten Regelkreis Aktionen mit Ziel der Erhöhung der Körpertemperatur bewirkt; Alkohol ist also nicht US, sondern die gesunkene Körpertemperatur, UR ist über ein negatives Feedback die kompensatorische Erhöhung der Körpertemperatur DrogentoleranzAbnehmende Empfindlichkeit eines Körpers gegenüber einer Drogez.B. Übelkeit, Schweißausbruch, Herzrasen nimmt ab mit wiederholtem Rauchenteilweise rein physiologische Phänomeneteils aber auch über klassische Konditionierung vermitteltmit der Drogeneinnahme verbundene Handlungen und Wahrnehmungen (CS) lösen kompensatorische Körperreaktionen (UR) auf die Droge (US) ausz.B. Siegel (1984) stellte zusammenhang zwischen Heroinvergiftungen und Einnahmeorten her, oft wurde die tödliche Dosis an ungewöhnlichen Orten injiziert, die die kompensatorische Körperreaktion nicht hervorruft (da nicht konditioniert), Heroin wurde zu stark wirksam da keine Abschwächung erfolgteauch nachlassende analgetische (schmerzstillende) Wirkung von Morphium konnte in neuem Labor aufgehoben werden 
  • Klassisch konditionierte Immunreaktion Experiment zu erwrobenen Geschmacksaversion bei Ratten bringt ungewöhnliches Ergebnis (Ader / Cohen 1981)gepaart wurde süßes Wasser (CS) mit Cyclophsphamid-Injektion (US), was die Geschmacksaversion (CR) hervorruftanschließende Extinktion sollte langsamer verlaufen, je mehr Wasser die Ratten erhalten hatten (Stärkerer CS), tatsächlich starben aber einige dieser Tiere mit starker CS, Zusammenhang mit Stärke des CS wurde vermutet, Reaktion auf gelernte Reaktion auf CSNebenwirkung Cyclophosphamid = Immunsuppression, offebar wurde auch diese Wirkung auf CS übertragenGeprüft 1975, nach oben beschriebener Konditionierung wird Fremdeiweiß verabreicht, das Immunantwort hervorrufen sollte3 Gruppen: Experimentalgruppe erhält CS (Wasser), Kontrollgruppe erhält US (Cyclophosphamid), dritte Gruppe keinen weiteren Reiz (hier sollte tatsächliche Immunantwort trotz Cyclophosphamid gemessen werden)1. Gruppe schwache Immunantwort, 2. Gruppe noch schwächere Immunantwort, 3. Gruppe stärkere ImmunantwortErgebnisse belegten eine konditioniert Immunsuppression Anwendungsgebiete: Krebstherapie - auch hier Immunsuppressiva verarbreicht, die sich über CS und US summieren und so die Gesundungschancen verringern, daher Durchführung in unterschiedlichn Umgebungen;Allergien - Berichte über künstliche Rose, die allergische Reaktion hervorruft
  • Evaluative Konditionierung paarung von neutralen CS und positiv bzw. negativ bewerteten/evaluierten US ruft eine Bewertung als CR hervorMenschen neigen zu automatischen wertenden Urteilen gegenüber Objekten, Personen oder Situationen, die so erklärt werden könnenValenz eines sehr positiven bzw. negativen Bildes wird auf ein neutrales Bild übertragen erstmals Levey und Martin (1974)PV bildeten aus 50 Postkarten Stapel von like, dislike, neutralanschließend 2 positivsten und 2 negativsten aus L und D Stapel herausgesuchtVersuchsleiter entnahm dem N Stapel diesen Bildern ähnliche Darstellungen sowie zwei neutrale KartenPostkartenpaare werden gebildet : N-L, N-D, N-N, D-N, L-Nanschließend Präsentation der genannten Paare je 20 mal hintereinanderBewertung der Karten einzeln auf Skale -100 bis +100Ergebnisse:Valenzverschiebung von N-L und N-D zu L und D,auch N-N positiver bewertet (wahrscheilnich durch Vertrautheitseffekte "mere exposure effect")bei Rückwährskonditionierung keine Valenzverschiebung, obwohl bei D-N zumindest Tendent zu beobachten warsehr stabil über die Zeit, zeigt erneute Befragung nach 18 Monaten (insbes. N-D, bei N-Lnur noch deskriptiv) = LöschungsresistenzKritik: auswahl von Bildern, daher später zufällige wahl der neutralen Stiumuli und variation zwischen Versuchspersonen auch für andere Modalitäten von Reizen belegt, z.B. Geschmacksreize (Tee mit Wasser bzw. Zuckerwasser gepaart, Zellner 1983)auch für Crossmodale Reize (z.B. Musik als US und CR auf visuellen CS); Glaubhabfte passung aber wieder nötig Kritik allgemein: Urteilsverzerrung durch Aufforderungscharakter (demand charakteristic), leicht für VP durchschaubar, welche Antwort erwartet wird, daher später auch affektives Priming verwendet Unterschiede zum klassichen Konditionieren:Löschungsresistenz, wahrscheinlich da wenig Kosten für den Organismus im vlg. zum KK, körperliche Reaktionen hier aufwändig für den Organismus (Bayens 1992), Löschung nur möglich durch aktive Gegenkonditionierung mit einem Reiz gegenteiliger ValenzKontingenz, Vorhersagekraft spielt bei KK große Rolle, bei EK unerheblich; zeigt auch, dass man sich der EK kaum entziehen kann Anwendung z.B. in der Werbung, bei der Produkteinführung, etc. affektives Priming: Wörter werden positiv oder negativ beurteilt, eigetntlich zu beurteilendes Wort wird aber nur als nicht sichtbarer Prime dargestellt, Zielreiz kann schneller evaluiert werden, wenn Prime gleiche Valenz zeigt (positiv/negativ)
  • Instrumentelles Lernen vs. Operantes Konditionieren instrumentelles Lernen betont die Autonomie des LernensMenschen oder Tiere erlernen in relativ natürlichen Umwelten eine neue Problemlösung durch Versuch und Irrtum, wobei erfolgreiche Verhaltensweisen verstärkt werde operantes Konditionieren betont die Kontrolle durch einen Versuchsleiter, Trainer, TherapeutenKontext von Lernexperimenten oder Trainingsunter Einfluss von Verstörkung und Bestrafung
  • Instrumentell: Throndikes Experimente und Ergebnisse Thorndike befasste sich im Gegensatz zum klassischen Konditionieren nicht mit reflexiven, relativ stereotypen Reationen auf einfache Reize, stattdessen freie, relativ variable Verhaltensweisen auf komplexere ReizeDissertation: Animal Intelligence. an experimental study of the associative processes in animals konstruierte Problemkäfige mit mehreren Mechanismen (z.B. Rigel schieben, Pedal treten, an einem Zug ziehen, drehen von Riegeln,...), aus denen sich z.B. Katzen befreien mussten Beobachtung: quantitativ: Zeit zur Befreiung anfangs sehr lang, nach mehreren erfolgreichen Befreiungen zunehmend kürzerqualitativ: zunchst verschiedene Aktionen gezeigt,  Erfolg wurde eher zufällgi generiert, nach mehreren erfolgreichen Versuchen verringerte sich die Häufigkeit von erfolglosen Handlungen Versuch und IrrtumAls Ergebnis postitulierte er ein Lernen auf Versuch (Probehalbe Ausführung, Trial) und Irrtum (feststellung der jeweiligen Konsequenzen, error Gesetz des Effektesvon verschiedenen Reaktoin (R1 bis Rn) in der gleichen Situation S werden diejenigen stärker mit der Situation verknüpft, denen ein befriedigender Zustand folgtanschließend treten diese mit höherer Wahrscheinlichkeit aufwird Reaktion von aversivem Zustand efolgt, werden Verknüfungen R und S geschwächt,anschließend treten deise mit gerigerer Wahrscheinlichkeit aufbefriedigend = wenn kein Verhalten zum Vermeiden oder Verhalten zum Erreichen gezeigt wirdaversiv = wenn Verhalten zum vermeiden oder beenden gezeigt wird Bewertungklingt banal und wenig innovativenorm wirkungsvolles mechanistisches Lernprinzip, das Problemlösen ohne nennenswerte Intelligenz ermöglichtkeine Plaung oder Einsicht nötig, man muss nicht wissen, was man tutGesetz des Effektes sorgt für die Auswahl erfolgreicher Verhaltensweisen und Aussortieren erfolgloser Verhaltensweisenfindet in der Robotik und beim maschinellen Lernen AnwendunKombination von Versuch / Irrtum und Selektion erfolgreicher Varianten entspricht Darwin'schen Evolutionsmechanismen - biologische Anpassung - Finden nützlicher MerkmaleLernen stellt adaptiven Menschnismus dar, der es ermöglicht, innerhalb einer Generation nützliche von unnützen Hanldungen zu unterscheiden
  • Instrumentell: Aberglauben bei Tauben Tauben entwicken eigentümliche Ticks (Kopf-Pendeln, drehen, Kopf stoßen), wenn sie in konstantem Zeitintervall eine Futterpille bekamenTiere verhalten sich also, als ob eine kausale Beziehung zwischen ihren Verhaltensweisen und den Futterpillen bestündevergleichbar mit vielen abergläubischen Ritualen der MenschenSkinner erkärte mechanistisch mit dem Gesetz des Effektes: Tauben zeigen entweder gar kein Verhalten oder eine spezielle Verhaltensweise, kurz bevor sie eine Futtepille erhaltenDie verhaltensweise, die (natürlich rein zufällig) vor der Futtergabe gezeigt wird, wird nach dem Gesetz des Effektes durch die Futtergabe verstärkt und damit häufiger gezeigtdamit erhöht sich die Wahrscheinlichkeit, dass das Verhalten auch vor der nächsten Futtergabe wieder gezeigt wird, damit wird es weiter verstärktes erhöht sich die Auftretenswahrscheinlichkeit weiter, und damit tritt es auch wieder etwas wahrscheinlicher vor der nächsten Futtergabe auf, etc.der Effekt verstärkt sich weiter selbst es sind hierfür keine mentalen prozesse nötig, Verhalten kann rein mechanistisch erklärt werden
  • Instrumentelles Lernen: Definition beim instrumentellen Lernen verändert sich die Latenz, Geschwindigkeit, Wahrscheinlichkeit oder Häufigkeit eines bestimmten Verhaltens, nachdem eine Verstärkung (Reinforcement) kontingent zu diesem Verhalten gemacht wird klassisches Konditionieren reagierend, respondentoperantes Verhalten vielseitiger und wird direkt auf die Umwelt ein (operates on environment)Skinner bevorzugt operant, weil instrumentell Absichten und Ziele nahelegtdie Verwendung solcher mentalistischer Konzepte lehnte Skinner ab instrumentell betont autonomie des Lernens, relativ natürliche Umwelt in der die Problemlösung erlernt wird operant betont die Kontrolle durch den Versuchsleiter, passt besser in Kontext von Lernexperimenten oder Trainings
  • Positive Verstärkung (instrumentelles Lernen) - Verstärkungspläne Verstärkungsplan = regel die festlegt, nach welchen Kriterien eine Verstärkung gegeben wirdauch jede weitere Festlegung kann Bestandteil eines Verstärkungsplans Qualität - nur bestimmtes Verhalten wird verstärktkontinuierliche Verstärkung (CRF = continuous reinforcement) - jedes korrekte Verhalten wird versäkt (FR-1)Wird nicht jedes korrekte Verhalten verstärkt - intermittierende VerstärkungspläneQuantität - Verstärkung je Häufigkeit des korrekten Verhaltens (Quotenpläne)Feste Quote / Fixed Ratio - jedes n-te richtige Verhalten wird verstärktz.B. FR-10Bsp. Akkrodarbeit, Lohn abhängig von StückzahlVariable Quote / Varibale ratio - Angabe der Quote gilt über gesamtes Training hinweg als Durchschnittswertz.B. FR-18Bsp. legale Spielautomaten, fixe mittlere Quote (Spieleinsatz), für die Gewinne ausgeschüttet werden, LotterieZeit -Intervallpläne - unabhängig von Häufigkeit des korrekten VerhaltensFixes Intervall (fixed interval) - die erste richtige Reaktion wird nach Ablauf eines Intervalls verstärkt, idealerweise wird nur 1x nach Ablauf des Intervalls reagiert, Häufigkeit der Reaktion hat keinen Einflussz.B. FI-30Bsp E-Mails können nur bei Abruf nach 15 Minuten erhalten werdenBsp Stream der täglichen Tagesschau steht immer erst 20 Uhr zur Verfügung, vorher lohnt sich der Abruf nchtvariables Intervall (variable interval) - die durchschnittliche Dauer des Intervalls wird angegebenz:b. VI-30Bsp. Öffnen des Mailfachs, in das gelegentlich Werbung kommt, d.h. Verstärkung ist sicher, aber Abstand unbekanntLöschungVerstärkungsplan, bei dem kein Verhalten von einem Verstärker gefolgt wirdÜbergang von intermittierendem Plan mit hoher Quote oder langem Intervall zur Löschung ist fließend, daher sinnvollLöschung = Plan mit sehr hoher Quote / IntervallDHRdifferential reinforcement of a high rate of respondingz.B. innterhalb von 10 sek. 5 Antoworten als VoraussetzungDLR differential Reinforcement of a low rate of respondigz.B. eine Pause muss zwischen den Reaktionen eingehalten werden, damit Verstärkung folgt Weitere Pläne denkbar und möglich Ziet - Intervallpläne
  • Analyse von Verstärkungsplänen Ferster und Skinner (1957)Tauben, mehr als 70.000 Stunden aufzeichnungen, 250 Mio. ReaktionenPläne reversiebel - zunächst stark vom vorherigen Verstärkungsplan beeinflusst, letztlich passt es sein Verahlten aber dem aktuellen Verstärkungsplan anAblaufAdaptation an den Apparat (Zeit darin verbringen, emotionale Reatkionen abbauen)Magazintraining (Futtererhalt nach Geräusch des Magazinöffnens erlert, während auch Öffnung Beleuchtet ist)Zielreaktion erlernt - auf beleuchtete Scheibe picken, z.B. Korn aufgeklebt oder Punch-Poard mit Vertiefung und Korn drinzwischen 2 Plänen immer CRF Plan, es sei den die Umsetllung der Pläne selbst wurde untersucht, erst bei Stabilität Umstellung auf intermitttierenden PlanVerhaltenskurven zeigen kumulierte Häufigkeiten (y) in abhängigkeit von Zeit (x)FR - Stufenmusterkonstante Reaktionsrate bis Quote erfüllt und Verstärkung, dann PausePause umso höher, je höher die Quote (mehr Reationen für nächsten verstärker zu erbringen sind)Verhaltensrate bliebt bei Veränderung der Quote recht konstantVR - stetiges VerhaltenRate beim VR Plan sehr konstant, Nachverstärkungspausen viel kürzer, da unsicherheit über die Quote für Erhalt des nächsten VerstörkersStetiges Verhalten, kurze PausenFI - bogenförmiges MusterRate zu beginn niedrig, zum Ende des Intervalls hochLerntheoretiker: Verhalten direkt nach Gabe wird nie verstärkt, geringe Auftretenswahrscheinlichkeitkognitive Erklärung: Zeiträume können nicht exakt abgeschätzt werden, mit zunehmender Dauer des Intervalls immer schwieriger einzuschätzenVI - sehr regelmäßig, allerdings Verhaltensfrequenz bei gleicher Verstärkermenge geringer als bei VRinsbesondere bei langen durchschnittlichen IntervallenLöschungVerhaltenshäufgkeit nimmt ab, wird irgendwann gar nicht mehr gezeitTritt bei CRF früher auf als bei intermittierendenbei CRF ist ausbleiben sehr offensichtlich, bei intermittierendem Plan bleiben viele Reaktion ohne Verstörkung
  • Verhaltensaufbau negative Verstärkung: Flucht und Vermeidung (instrumentell) Flucht = aversiver Reiz wird durch Verhalten beendetVermeidung = Kontakt mit negativem Reiz wird durch Verhalten verhindertähnelt Lernen durch positive Verstärkung, da Häufigkeit eines Verhaltens (Flucht oder Vermeidung) zunimmtnegativie Verstärkung: Reaktoin wird verstärkt, die den negativen Reiz eliminiertKritiker: Flucht vor aversivem Reiz = angeborener Instinkt, muss nicht erlernt werdenaber: welche von möglichen Fluchtreaktionen auf Dauer gezeigt werden, hängt von Erfolg der Beendigung des Reizes ab, kann daher mit operantem Konditionieren erklär werdenVermeidungsparadoxnegativer Reiz durch Hinweis angekündigt, Flucht bereits kurz nach Hinweisreiz, vor Einsetzen des negativen ReizesFlucht wird zur Vermeidungerfolgreiche Vermeidung verhindert den negativen VerstärkerZweifaktentheoriezur Erklärungerlernen der Vermeidung in 2 Schritten: (1) klassische Konditionierung auf negativen Reiz (US) folgt Furcht (UR), die auf den Hinweisreiz (CS) übertragen wird(2) Vermeidungsreaktion CR reduziert UR (Furch), wobei Furchtreduktion als negative Verstärkung wirkt (Wirkung wie Flucht - Umdeutung Vermeidung in Flucht)Löschungsresistenzwird beibehalten, obwohl negative Reiz (US) immer wieder entkommtnach klass. Konditionierung eigentlich Löschung der Furcht, wenn CS konsistent ohne USvermeidungsverhalten sollte weniger zuverlässig auftretenbeim Mensch extrem z.B. bei Phobienzu erklären damit, dass zwar US nicht mehr folgt, aber auch Erkenntnis, dass US nicht mehr folgt, wird verhindert - Vermeidungsreaktion verschwindet, wenn Individuum zum Erkennen des verschwundenen US gezwungen wird
  • Premack-Prinzip (instrumentell) jede Aktivität, die realtiv häufig ausgeführt wird, kann zum Verstärker für ene selten ausgeführte Handlung dienenkeine Unterscheidung mehr zwischen Verstärker und VerhaltenHergang: oft nicht vorhersagbar, welcher genau der Verstärker ist z.B. Futterpille an sich Verstärker, oder nur das Fressen?z.B. worin liegt Verstärker bei Belohnungen wie Shoppen und Kindo? ExperimentPrimaten führten 4 Aktivitäten aus: Ziehen, Drücken, Schieben, Öffneneiner hatte klare Präferenz A<B<Caktiitäten nun so kombiniert, dass erst andere Tätigkiet als C ausgeführt werden musstemusste erst A ausgeführt werden, um B auszuführen, wurde A anschließend häufiger gezeigtmusste erst C ausgeführt werden, um B asuzuführen, keine Veränderte Häufigkeit von C z
  • Beobachtungslernen klassisches Konditionieren: Vergrößert Anzahl von Reizen, die eine bestimmte Reaktion auslösen; erklärt nicht neues Verhalteninstrumentelles Konditionieren: erklärt Veränderung der relativen Häufigkeit einzelner Verhaltensweisen, und wie neues Verhalten durch zufällige Variation im Verhalten erworben werden kann (Trial and Error, Shaping)im alltag häufig nicht explorieren, sondern NachahmungFormen der Nachahmungsoziale Erleichterung - zunahme der Häufigkeit oder Intensität von dominantem Verhalten durch Anwesenheit andererStiumulus-Enhancement - Aufmerksamkeit  durch Licht, Geräusche, Geruch  bringt verstärkungMimikry - motorisches Muster wird nachgeahmt, ohne dass das natürliche Ziel verfolgt wird (bsp. Papageien) - spiel von KindernEchte Imitation - verhalten wird um des gleichen Zieles willen nachgeahmtEmulationslernen - exakte Kopie des beobachteten Verhaltens rückt in den Hintergrund, es wird eher etwas über ein Objekt und seine Funktion gelerntModell - Modellverhalten - Lernen - NachahmungKorrespondenzproblem wie kann Korrespondenz zwischen wahrgenommener und auszuführender Bewegung festgestellt werden?bereits Säuglinge kurz nach Geburt zu Nachahmung fähignicht alle Tiere sind zu Imitation fähig, können aber konditioneirt werden- Instinkt als Theorie- Wahrnehmung und Handlung in gemeinsamen Code repräsentiert (common coding)- Spiegelneurone - sowohl be Beobachtung als auch Handlung aktiv, Zellen i Gehirn auf Wahrnehmung und Eigenbewegung spezialisiert, "wissen", was passtWas wird gelernt?- komplexe Verhaltensmuster- Verhalten-Verstärker-Kontingenzen (Handlung- Effekt-Zusammenhänge)
  • Beobachtungslernen unter lerntheoretischer Analyse Operantes Konditionieren (Pseudoerklärung)immer dann, wenn imitiertes Verhalten zu Verstärkung führt gezeigt wird damit aber eigentlich nur, dass verstärkte Verhaltensweisen zunehmen - was nicht fraglich ist, sondern fraglich ist, wieso dieses Verhalten erstmals auftritt Max läuft hinter Moritz her, der eine Belohnung bekommt, dann bekommt auch Max eineTheorie der generalisierten ImitationKinder werden allgemein häufig für Imitation verstärkt, Verstörkung ist kontingent zur Güte der NachahmungÄhnlichkeit zwischen Modellverhalten und modelliertem Verhalten wird zum Verstärker (konditioniert, sekundär, Prozesse der klassischen konditionierung)imitatives Verhalten tritt häufiger auf, weil Verstärker immer auftritt, wenn vom Lerner gezeigtes Verhalten dem Verhalten des Modells ähneltBewertung der Einschätzung als KOnditionierung- ist es noch sinnvoll, einen solchen Effekt durch Konditionoierung zu erklären? wo ist die grenze? Speziestypische Verhaltensweise- Imitation auch sehr abstrakt (im vgl. zu Hebeldrücken oder Scheibenpicken)- Verstärker ist auch kein Reiz, sondern eine Kognition (bewertete Ähnlichkeit im Verhalten)
  • Beobachtungslernen: Stellvertretende Verstärkung Modell wird belohnt oder bestraftselbst keine Belohnung oder Bestrafung erhaltenExperiment mit Film, der aggresives Verhalten zeigt, und Kindern(1) Erwachsener wird für Verhalten verstärkt (Lob)(2) Tadel(3) keine KonsequenzKinder zeigten weniger aggresives Verhalten, wenn Erwachsener bestraft wurdeWurden kinder im Anschluss belohnt, zeigten alle Aggressives Verhalten, hatten dieses also durchaus gelernt Unterscheidung zwischen Kompetenz (Lernen) und Performanz!
  • kognitive Theorie des sozialen Lernens (Bandura, 1976) Kritik an bisherigen Lerntheorien: - oft keine direkte Verstärkung, nur stellvertretende / indirekte Verstärkung- oft nicht unmittelbar vor einer Situation entsprechender Hinweisreiz, selten solche Modellhaften Situationen in der Praxis, verspätete Reaktion- Verstärker sind oft kognitionen statt einfache Reize- Vernachlässigung sozialer Komponenten- abstrakte statt nur konkrete Verhaltenskategorienbeim Beobachtungslernen 4 Prozesse beteiligt:Aufmerksamkeit, begünstigt durch- Merkmale der Modellperson oder dessen Verhalten, z.b. Gleiches Alter & Geschlecht (Ähnlichkeit), - Macht des Modells, - auffälliges Verhalten (Salienz), - positive Konsequenzen (Valenz), - erfolgreich erwiesen (funktionaler Wert)Gedächtnisprozesse - bildliche /analoge Kodierung ähnlich wie Wahrnehmung als komplexes raum-zeitliches Bewegugsmuster, geeignet für unmittelbare Imitation kurzer Verhaltenssequenzen- symbolische Kodierung inkl. sprachlicher Instruktion, , abfolge komplexer Handlungen besser repräsentiertMotorische Reproduktionsprozesse- körperliche Fähigkeiten- Verfügbarkeit der Teilreaktionen (sonst Übung nötig)- FeedbackAnreiz- und Motivationsprozesse- Wissen über Verhalten-Verstörker-Kontingenzen, es muss eine entsprechende Erwartung bestehen (extern, selbst, stellvertretend)
  • Erlernte Hilflosigkeit normalerweise erlernen Hunde Vermeidungsverhalten bei Elektroschocks im Zweikammerkäfigwurden Sie aber vorher unkontrollierbaren Schocks ausgesetzt, kauerten Sie sich auf de Boden und erduldeten die Schocks, lernten Weder Flucht noch VermeidungDefizite bei der erlernten Hilflosigkeit ähneln der reaktiven Depression:- motivationales Defizit (tue nichts gegen Situation)- kognitives Defizit (erkenne nicht, dass die Situation beherrschbar ist- emotionales Defizit (depressive Stimmung, Niedergeschlagenheit und Mutlosigkeit
  • Experimentelle Paradigmen des instrumentellen Konditionierens grundsätzlich kommen alle Verhltensweisen in Frage,"Verhalten" ist breite, unscharf definierte Kategorie unterschiedicher KomplexitätGang- ud LabyrinthlernenStartbox & Zielbox, Zeit bis zum Erreichen der Zielbox gemessenwenn mehrere Wege und Sackgassen (Z.B. T-Box) kann auch Anzahl von Fehlern/besuchten Sackgassen gemessen werdendiskretes Lernen: in jedem Durchgang kann Verhalten (Zielbox erreichen) nur einmal gezeigt werdenHebeldrücken / Scheibenpickenfreie Operanten, Verhalten kann häufig gezeigt werdenRatten = Hebel drückenTauben = Scheiben pickenjeweils für FutterArten von Verstärkung und Bestrafungerwünschtes Verhalten verstärkt, unerwünschtes bestraftpositive Verstärkung - es steigt die Verhalteshäufigkiet nach gabe eines Versträrkers (US)Belohnung wie Futter bei Tieren, soziale Verstärker bei Menschen (Lob)negative Verstärkung - es steigt die Verhaltenshäufigkeit nach Entfernen eines unangenehmen ReizesLärm/Kälte oder Schimpfen als soziale Verstärkung (wenn Entschuldigung, dann wird Schimpfen entfernt)Flucht- oder VermeidungstrainingTyp-I- Bestrafung - es sinkt die Verhaltenshäufigkeit nach gabe eines Bestrafungsreizesz.B. Schimpfen (gleiche Reize wie negative Verstärkung)Typ-II-Bestrafung - es sinkt die Verhaltenshäufigkeit nach Entfernen eines Bestrafungsreizesz.B. Auszeit beim Spiel, damit aggressives Verhalten nachlässt (wie positive Verstärkung)Shaping (Verhaltensformung)Verhalten wird gar nicht gezeigtVerstärkung zunächst für ein Verhalten, das in die gewünschte Richtung gehtmit fortschreitendem Training zunehmend strengere Kriterien für die VerstärkungKritik: Erinnert an Dressur, heiligt der Zweck die Mittel? (klinische Anwendungsfälle, z.B. Kaugummi für Sprechen
  • Instrumentelles Lernen: Verhaltensreduktion (1) LöschungWelcher Verstärker kontrolliert das unerwünschte Verhalten?Kontingenz zwischen Verstärker und Verhalten beseitigen, Löschung des Verhaltens herbeiführenz.B. Kind das an der Kasse Süßigkeiten verlangt(2) Differentielle Verstärkung alternativen VerhaltensLöschung nicht immer möglich, da Kontrolle über den Verstärker nicht immer möglichVerhaltensreduktion durch Verstärkung eines Alternativverhaltenses kann nur ein Verhalten zu 1 Zeit gezeigt werdenz.B. draußen Spielen reduziert Fernsehenteilweise kann Alternativverhalten auch durch gleichen Verstärker erzielt werden, z.B. unerwünschtes Verhalten für Anerkennung gezeigt, stattdessen Anerkennung für weniger störendes Verhalten im Unterricht(3) Sättigungeffektiver Wert des Verstärkers wird herabgesetzt, wenn Sättigung erreichtVerstärker wird überhäuft gegeben, sodass dieser uninteressant wird oder sogar vermieden wirdz.B. zu viel Essen führt zu Übelkeit, dann weniger gegessen(4) Bestrafung(Typ I und II gemäß experimentellen Paradigmen)durch Reizveränderung hervorgerufene Reduktion des Auftretens einer Reaktionwird oft kritisch gesehen und nur als ultima ratio anerkanntgezielt aversiver Zustand, Grenzen zu Gewalt und Missbrauch sind fließendoft wurde durch Thorndike und Skinner postituliert, Bestrafung würde nicht fuktionieren, ist aber eher durch moralische Überlegungen beeinflusst, nicht zutreffendHinweise, dass es unerwünschtes Verhalten lediglich vorübergehend unterdrücktVerhalten wird sofort wieder gezeigt, wenn keine Bestrafung folgtBestrafung auch natürlich, wenn auf Verhalten negative Konsequenzen folgt (Herdplatte, Alk)Kinder verhalten sich auch oft so, dass sie sich oder anderen Schaden  / in Gefahr bringen, gewähren lassen wäre Verantwortungslosklinische PSychologie an Reduktion von Problemverhalten interessiertim Alltag schimpfen, Androhen von Entzug z.B. FernsehenWirksamkeit beeinflusst von- intensität des Bestrafungsreizes- unmittelbare Bestrafung statt zeitverzögert- Intensität von Beginn an hinreichend stark, sonst Toleranz und Eskalation der Bestrafung- kontinuität (jedes Verhalten) oder bei Quotenplan geringe Quote- bei geringer motivatin aussichtsreicher / effektiver als bei hoher- effektiver, wenn gleichzeitig Alternativverhalten in AussichtProblematisch- unerwünschtes Verhalten verheimlicht, während auf erwünschtes für positiven Verstärker hingewiesen wird- Furcht als Folge, kann zu allgemeiner Verringerung von Verhalten führen (konditionierte emotionale Reaktion); Verhaltensvariation aber notwendig für Lernen (Lernfortschritt gefährdet)- Gefahr der erlernten Hilflosigkeit, wenn negative Reize nicht kontrolliert werden könnenIdealfallMischung von Methoden (Verstärkung alternativverhlaten und Androhung von Bestrafung)Verstärkermenge bleibt gleich und Bestrafung wird nie erfahren, weil vermieden
  • Instrumentelles Lernen: Latentes Lernen Bsp. Experiment mit Ratten in 3 gruppen (Labyrinthlernen):- Verstärkung bei Erreichen der Zielbox (Futter) - verstärkte Kontrollgruppe- Verstärkung erst ab 11. Tag bei Erreichen der Zielbox (Futter) - Experimentalgruppe- keine Verstärkung - KontrollgruppeErwartung: gleiche Lernkurve bei Experimentalgruppe wie verstärkte Kontrollgruppe, um 10 Tage versetztErgebnisse:- Fehlerrate der Experimentalgruppe sank ab 11. Tag viel schneller als bei verstärkter Kontrollgruppe- Wege im Labyrinth durchaus auch ohne Verstärker gelernt, aber nicht gezeigt (Kompetenz)- Verhalten erst mit Verstärker gezeigt (Performanz)- für Erwerb der Kompetenz ist Verstärker nicht nötig, für Performanz schonlatentes (Verborgenes) Lernen
  • Instrumentelles Lernen: Verstärkererwartungen neben S-R AssoziaitonenAuch Hinweise für R-S Assoziaitonen - Erwartung, dass ein bestimmtes Verhalten einen bestimmten Verstärker folgen lässtExperiment von Crespi (1942)Laufgeschwindigkeit der Ratten im Gang höher, je mehr Verstärker (1-16-256 Pillen)hohe Futtermenge, mehr Verstärkung, schnellere Zunahme der S-R Assoziationbei bislang hoher Futtermenge und nun Reduzierung, wurde Laufgeschwindigkeit drastisch reduziert, sogar unter die Gruppe, die diese Futtermenge von Anfang an bekam (16 Pillen)Nach gesetz des Effektes nicht zu erwarten, da Verstärkung nach wie vor vorhandenExperiment von St. Claire-Smith (1979)Ratten mit Futter für Hebeldrücken KonditioniertRatten auf Schock mit Licht Konditioniertfür Hebeldrücken Schock, teils durch Licht angekündigt, teils nichtohne Hinweisreiz: Hebeldrücken bald unterlassen (Bestrafung)mit Hinweisreiz: unverändertes Verhalten, Licht kündigt Schock an und wird ncht mit Hebeldrücken assoziiert (Blocking)
  • Instrumentelles Lernen: S-S Assoziationen lernen, dass bestimmte Stimuli, die von Situationen ausgehen, anzeichen für Verstärker sind (S)nicht das Verhalten (R) diese Stimulil auslöstVerhalten gezeigt, dass in Besitzt des Verstärkers bringtLernen ohne Verhaltenin der box gibt es futter, nicht das Hinlaufen ist wichtig, erst nur hineingesetzt, Futter, später hineingelaufen, obwohl hineinlaufen, obwohl dies nie verstärktVerhaltensäquivalenzauch vorher laufen, später schwimmen notwendig funktioniertAutoshapinggabe einer Pille bei Beleuchtung einer scheibe, Tauben picken, obwohl picken für Futter nicht notwendig; erklärung mglw: konsumatorisches Verhalten auf Licht, da Licht mit Futter assoziiertBeobachtungslernenbeim Beobachtungslernen wird das Verhalten ebenfalls nicht verstärkt, und trotzdem hinterher gezeigtz.B. Makakenaffen lernen Kartoffeln zu waschen und Sand von Weizenkörnern zu trennen, nachdem ein Weibchen das vormachte