PSYKOLOGI
“Om indlæringsprincipper”
“Hvordan kan jeg lære min hund det”? “Hvad skal jeg gøre for at gøre min hund forståelig, hvad den skal”? “Hvorfor skal jeg gøre sådan?” eller “Hvorfor må jeg ikke gøre sådan”? Alle hundeførere har sikkert på et eller andet tidspunkt stillet sig selv eller sin træner lignende spørgsmål. Nogle vil måske mene, at det vil være tilstrækkeligt at vide hvordan man rent metodisk skal få lært hunden de enkelte øvelser. Personligt har jeg altid følt det lige så, om ikke mere, vigtigt at vide hvorfor!. Sagt på en anden måde: Vide hvordan en hund lærer, og vide noget om nogle af de psykologiske principper og lovmæssigheder der gælder for indlæring. Dermed ikke sagt at “teori” alene er “saliggørende”, for hvis teorien ikke kan omsættes til praksis, er den intet værd. Men det er alligevel min overbevisning, at en fyldestgørende psykologisk/ teoretisk indsigt, d.v.s. en bred almen psykologisk viden – specielt inden for adfærdspsykologi og indlæringspsykologi, og i særdeleshed en viden inden for dyrepsykologien (etologien), kan gøre det meget lettere at finde de “rigtige” svar på “hundeejerens mange spørgsmål”.
I denne artikel vil der forsøges at gøre rede for nogle vigtige indlæringsprincipper – belyst gennem nogle eksempler/eksperimenter fra den psykologiske forskning, og der vil i videst mulig omfang relatere “teorien” til “praktisk hundearbejde”.
En russisk adfærdsforsker ved navn Pavlov lavede i slutningen af forrige århundrede følgende forsøg: En hund fik indopereret et glasrør således, at man kunne iagttage dens produktion af spyt ved fodring. I nogen tid lod Pavlov en klokke ringe nogle sekunder før hunden fik foder. Hvor spytproduktionen førhen begyndte når hunden fik foderet, så observerede han, at spytproduktionen nu startede så snart klokken lød. Betingelsen for, at hunden udskilte spyt var altså blevet ændret fra den faktiske tilsynekomst af foderet, til lyden af klokken. Pavlov kaldte derfor denne form for indlæring for en betinget refleks (senere psykologer har ofte foretrukket den mere sigende betegnelse signalindlæring, eller, eftersom Pavlovs forsøg var noget af det allerførste indenfor området, er det blevet almindeligt at omtale denne form for indlæring som klassisk betingning). Hvilken praktisk betydning har dette forsøgsresultat så? Det, at hunden starter sin spytproduktion er jo et udtryk for, at den igangsætter det første trin i fordøjelsesprocessen og dermed er det en del af den “adfærd” der er forbundet med tilfredsstillelsen af det fundamentale behov – mad. Indtagelsen af mad indbærer altså en speciel “sindsstemning” der hører sammen med spytproduktionen. Man kan altså betragte spytudskillelsen som et resultat af den “stemning”, der for hunden er forbundet med det behagelige at tilfredsstille sit behov for mad. I Pavlovs eksperiment har hunden altså lært at udløse en bestemt sindstilstand eller stemning på et forudgående signal (klokken). I vores daglige omgang med vores hunde støder vi på talrige eksempler på tilsvarende “stemnings-indlæring”. Her er et par eksempler: Den gode hundefører der forstår at arbejde med sin hund således at arbejdsglæden bliver den altdominerende stemning når den “er ude sammen med føreren”, vil hurtigt opleve, at hunden allerede “kommer i stemning” når han/hun begynder at finde liner og andre træningsrekvisitter frem. Desværre kan man også nogle gange se det direkte modsatte: En hund der værger sig ved at få halsbånd og line på og meget nødigt forlader bilen, eller hvis den under arbejdet slippes – så søger den straks tilbage til bilen. Halsbånd og line er her “klokken” (signalet), der udløser den negative stemning, der i dette tilfælde er forbundet med arbejdet.
Der kan gives mange eksempler på hvorledes hundeførere, ved sine signaler (bevidst – men også ofte ubevidst) sætter sin hund i “stemning” til et bestemt arbejde. Her er et par stykker til: En hundefører har, måske på grund af for lidt kontrol over sin hund, fået for vane at hæve stemmen når han/hun fører sin hund frem til beskyttelsesarbejdet. Hunden forbinder så hundeførerens hårdere kommandoer med det meget lystbetonede beskyttelsesarbejde og sættes allerede før synet af figuranten og ronderingsbanen, ved hundeførerens kommandoer, i “stemning” til beskyttelsesarbejdet. Ofte behøver det ikke en gang at være så tydelige signaler, der igangsætter “stemningen”. Tit kan en eller anden ubevidst anderledes måde at “føre” hunden på forberede til “det sjove”. Nogle hundeførere udnytter helt bevidst dette princip ved f.eks. før beskyttelsesarbejdet at komme med kommandoer som “pas på manden” eller lignende. Som et sidste eksempel på “klassisk betinget” indlæring, kan jeg nævne følgende: som forberedelse til at gå ud at træne spor med hunden, samler man sammen på de ting man skal bruge til træningen – genstande, sporflag, sporline, godbidderne o.s.v. og straks sidder hunden ude ved døren parat til “at tage på arbejde”.
Inden jeg går videre i beskrivelsen af Pavlov’s forsøgsresultater, vil jeg lige kort gøre rede for hvad indlæring egentlig er – altså hvad der rent faktisk sker i hjernen (central-nervesystemet), når noget indlæres. I den forbindelse kommer jeg i det følgende ind på begreberne hukommelse og glemsel.
Nyere tids forskning har vist, at der under indlæringsprocessen sker nogle ganske små ændringer i hjernens neuroelektriske/kemiske strukturer. Der foregår altså nogle processer, der så at sige indprogrammerer det indlærte ind i hjernen via nogle meget små ændringer i de kemiske strukturer i hjernen. Disse ændringer kaldes traditionelt for “hukommelsesspor” eller “hjernespor”. Disse “spor” udgør altså hukommelsen. Nu er det imidlertid sådan, at der i hjernen og i centralnervesystemet hele tiden foregår en masse elektrokemiske processer som, hvis hukommelsessporet ikke holdes ved lige, gradvis “udvisker”, men aldrig helt sletter hukommelsessporet. På den måde “glemmes” det indlærte. At hukommelsessporet ikke helt slettes ses af, at hvis man blot én gang genoptager indlæringen af en ellers “glemt” ting, så genopfriskes hukommelsen meget hurtigt. En vigtig konsekvens af denne viden er, at hvis en øvelse er fejlindlært, så er det så godt som umuligt at “viske tavlen helt rent” og starte på en frisk. Hvis man blot én gang under forsøget på at ændre indlæringen kommer til at lave den samme fejl igen, så trækkes “fejlhukommelsessporet” op igen. Et eksempel herpå: En hundefører har under indlæringen af flugtspringet tilladt, at hunden sætter af på springbrættet, fordi han syntes, at det vigtigste i første omgang måtte være, at hunden lærte at komme over og tilbage. Senere er afsættet så blevet en del af indlæringen og har sat sit hukommel-sesspor. Måske lykkes det så alligevel ved en ihærdig indsats, at få hunden til at springe rent frem og tilbage – i hvert fald under træningen. Men ikke alle situationer er som bekendt træningssituationer, og derfor vil der uværgeligt før eller siden opstå en situation, hvor hundeføreren ikke kan forhindre, at hunden “ustraffet” sætter af – typisk i en prøvesituation. Problemet er så vendt tilbage – eller snarere bevaret.
Henholdsvis at generalisere og at skelne med hensyn til indlærte signaler. Han fandt, at hvis han f.eks. lod signalindlæringen ske med en metronom, der slog 100 slag i minuttet, så ville hunden uden ekstra indlæring også reagere på en metronom , der slog i et andet tempo, f.eks. 70 slag/min. eller 130 slag/min. I et tilsvarende forsøg lod han et lyssignal af form som en cirkel være signalet. Herefter reagerede hunden på alle andre runde figurer (ellipser). Hunden er altså uden videre i stand til at generalisere. Dette fænomen er af stor betydning for alle “højere udviklede dyrearter” – også mennesket, da det sparer hjernen for en masse indlæring. Hjernen slipper for at foretage en nyindlæring hver eneste gang situationen bare er en anelse forskellig fra tidligere lignende situationer. I praksis kan denne medfødte evne til at generalisere godt nogle gange give os problemer: Hvis f.eks. to forskellige kommandoer lydligt kommer til at ligne hinanden for meget: “sæt” “dæk”. Det er jo en kendt sag at en tydelig betoning af vokalen i kommandoen (“siit”, “dæk”, “stå“) gør det lettere for hunden at opfatte forskellen mellem de enkelte kommandoer. Omvendt skulle små variationer af den enkelte kommando altså heller ikke volde hunden problemer (“stå” eller “stååe”) blot ligheden fremstår som tydelig for hunden.
Det omvendte fænomen, drejer sig om hundens evne til at skelne (i psykologisk sprogbrug kaldet diskrimination). Hvor generalisering kan foregå uden ny indlæring (altså en medfødt egenskab), så kræves der ny indlæring, når hunden skal skelne mellem signaler, der ligner hinanden. Pavlov lavede et forsøg, hvor han som tidligere anvendte en metronom med 100 slag/min. ved indlæringen af den betingede refleks (her spytudskillelsen). Herefter ville hunden som før generalisere over for metronomer med flere eller færre slag/min. Men Pavlov sørgede så for kun at forstærke (belønne) i de tilfælde, hvor metronomen slog præcis 100 slag/min. Alle andre frekvenser blev ikke forstærket (belønnet). Det viste sig, at han kunne få hundene til at skelne (diskriminere) så fint, at de kunne skelne metronomen på de 100 slag/min fra metronomer med frekvenser på 96 og 104 slag/min. Her vil jeg kun nævne et enkelt eksempel på fænomenet diskrimination, og så i øvrigt overlade det til læseren at gennemtænke betydningen af dette fænomen. Eksemplet er taget fra vores brugsprøveprogram – fra SPH-prøven (sporhundeprøven), hvor det som bekendt kræves at hunden skal kunne skelne mellem ansatssporet (3 timer gammelt) og det krydsende afledningsspor (2½ time gammelt). Den øvede sporhundemand vil sikkert også kunne bekræfte at denne tidsforskel forholdsvis let kan gøre meget mindre. Jeg har
selv prøvet at lave krydsspor med en tidsforskel på kun ½-1 min og hunden har forholdsvis let kunnet lære at løse opgaven.
Hovedparten af de forsøg Pavlov lavede, drejede sig om en form for indlæring, hvor der ikke krævedes en egentlig handling fra hundens side – altså hvor hunden skulle
indlære en bestemt færdighed. Alligevel er der bred enighed blandt forskere om, at Pavlov’s teorier belyser noget alment og fundamentalt vedrørende indlæring. For fuldstændighedens skyld vil jeg dog her medtage nogle forsøg, der mere konkret behandler indlæring af færdigheder.
Omtrent samtidig med Pavlov, var der en amerikaner ved navn Thorndike, der lavede følgende forsøg: Han anbragte en meget sulten kat i et bur, der var indrette således, at døren kunne åbnes indefra af katten, hvis den aktiverede en åbningsmekanisme der var placeret i et hjørne af buret. Uden for buret lagde Thorndike en “lækker” fisk. Han iagttog herefter, hvorledes katten kradsede og bed i døren og i øvrigt bevægede sig meget uroligt rundt i buret for at komme ud til fisken. Den kom derfor før eller siden tilfældigt til at aktivere åbningsmekanismen, og katten fik således adgang til fisken (belønningen). Ved første gentagelse af forsøget opførte katten sig på samme måde, men var kortere tid om at aktivere åbningsmekanismen. Efterhånden som forsøget blev gentaget tog det kortere og kortere tid for katten at åbne døren. Til sidst gik katten, straks når den blev sat ind i buret direkte hen og aktiverede døråbneren for at få fisken og dermed tilfredsstille sin sult. På baggrund af dette forsøg opstillede Thorndike en “lov” der i to dele kort kan formuleres sådan: 1. Reaktioner, der har en tilfreds-stillende virkning, indlæres. 2. Reaktioner, der ikke tilfredsstilles (eller ledsages af ubehag) vil gradvis svækkes og til sidst helt forsvinde. Denne form for indlæring er senere blevet kaldt for instrumentel betingning.
Lad mig belyse dette ved et par eksempler: Her i familien havde vi en overgang det problem, at den gamle hanhund, der dengang kun var en hvalp, sprang op ad bagdøren når han ville ind ude fra haven. Uden at tænke over det lærte vi ham således at springe op ad døren, idet vi hver gang gik hen og åbnede den, når han gjorde det. Ikke særlig smart!! Ved en kort analyse af problemet blev det klart, at vi selv havde skabt det. Vi var altså nødt til at foretage en “omindlæring”. Vi blev enige om, at vi kun ville belønne hunden ved at åbne døren, hvis han udenfor afleverede et lille bjæf (jvf 1. del af Thorndike’s lov); men samtidig skulle vi ikke tolerere, at hunden sprang op ad døren. Derfor skulle der falde et kraftigt “FØJ” (2. del af Thorndike’s lov), når han sprang op ad døren, efterfulgt af en opfordring til at “halse”. Når bjæffet så kom, blev døren åbnet. På mindre end 14 dage lykkedes det os at foretage både en afvænning og en nyindlæring efter disse principper, således at hunden lige til sin død udelukkende bjæffede for at komme ind udefra.
Det andet eksempel jeg vil nævne er taget fra træningspladsen: indlæring af standhals. Forløbet kunne (bl.a.) foregå på følgende måde: hunden stimuleres ved figurantens hetz til at aktivere sin forsvarsdrift. Når hunden svarer på figurantens signaler “skræmmer” den figuranten ind i et skjul (op i en krog). Hunden følger efter (jager figuranten) i line og stoppes gennem hundeførerens vejledning i linen og forhindres herved i at nå helt ind til figuranten. Hunden er således stærkt motiveret for at komme ind “og ordne
figuranten”, men hundeførerens blokkering skaber en høj indre spænding, som hunden på en eller anden måde skal have udløsning for. Nogle hunde vil de første gange udvise adfærd som springen frem i linen, hoppen op ad/mod figuranten, løben rundt om sig selv, trippen på stedet o.l. Disse reaktioner må under ingen omstændigheder belønnes (jvf. 2. del af Thorndike’s lov). Kun hvis hunden giver hals, belønnes den – byttet/ærmet “springer” frem, hunden vinder det og får lov til at bære det væk, hvorved hunden oplever en tilfredsstillelse og den indre spænding forsvinder (1. del af Thorndike’s lov).
I et andet forsøg undersøgte Thorndike hvilken virkning gentagelse (øvelse) havde på indlærin
gen. Ved at lave en del gentagelser af forsøgene med og uden belønning/forstærkning kom han frem til formuleringen af følgende lov (kaldet for “øvelsesloven”): Øvelse af adfærd styrker hukommelsessporet, mens manglende øvelse svækker hukommelsessporet. Det er jo i og for sig ikke overraskende, for som bekendt – “øvelse gør mester”. Men Thorndike gjorde en tilføjelse til “øvelsesloven”, hvori han anførte, at øvelse kun styrker hukommelsessporet hvis det hver gang resulterer i en belønning. Det vil i praksis sige, at vi får den bedste indlæringseffekt, hvis vi under indlæringen altid belønner (når indlæringen er sket, gælder der andre principper for belønning – herom senere). Dette er også blevet kaldt princippet om 100% forstærkning. I forbindelse med øvelsesloven skal det lige nævnes, at øvelse (mange gentagelser) også kan have en negativ virkning. Ethvert arbejde, også indlæring, bevirker en vis træthed. Denne psykiske og/eller fysiske træthed svinder ind ved hvilepauser, men hvis disse pauser ikke er lange nok, ophobes der træthed, som kan virke negativt på indlæringen. Vi kender det måske selv fra tidligere tiders “terpeundervisning”, der oftest skabte modvilje/lede ved undervisningen. Pauser og variationer er derfor af største vigtighed, hvis man vil højne indlæringen og forbygge/mindske glemsel. Træn derfor altid varieret og indlæg pauser i arbejdet – især hvis man arbejder med hvalpe og unghunde.
Den sidste af de “store” psykologer jeg i denne omgang vil omtale er amerikaneren Skinner. Han hævdede, at de meste fundamentale former for indlæring er de før omtalte: 1. Den klassiske betingning (Pavlov) og 2. Den instrumentelle betingning (Thorndike) – hvoraf han tillagde den sidstnævnte den største betydning. Skinner’s forsøg lignede derfor meget de forsøg Thorndike lavede. Et af Skinners forsøg gik ud på at lære en due at dreje 360o om sig selv. Duen var stærkt motiveret p.g.a. sult. Ved den mindste tilfældige antydning af bevægelse i den retning duen skulle dreje, belønnede han duen med korn. Den ville derfor hurtigt gentage bevægelsen, men Skinner krævede for hver gang en større og større drejning, indtil duen drejede helt rundt. Dette princip, hvor duen gradvis tilnærmer sig mere og mere til det ønskede, kaldes for approximationsprincippet (approximation=tilnærmelses).
Ved indlæring af f.eks. halsgivning på kommando kommer princippet i anvendelse efter følgende fremgangsmåde: Hunden skal være stærkt motiveret. Hvis man anvender godbidder, er sult hundens motivation. Man vækker hundens lyst til at få godbidden og giver kommandoen “halse”, men forhindrer den i at få fat i godbidden. Den “utålmodighed” (driftspænding), der herved opstemmes, skal så udløses på en eller anden måde. I mange tilfælde vil hunden springe op ad hundeføreren, men dette forhindres ved f.eks. at holde den nede med en finger i halsbåndet. Hvis der så kommer bare en lille lyd fra hunden (piben eller en antydning af et bjæf), belønnes den omgående med godbidden. Ved gentagelserne kræver hundeføreren så gradvis mere og mere “lyd” før belønningen. På den måde tager det som regel kun ganske kort tid, før hunden halser på kommando. Indlæring af øvelsen “standhals & bevogtning” foregår i princippet ganske analog hertil. De første gange belønnes på ganske få bjæf og gradvis øges kravet, så hunden til sidst præsterer en “vedvarende og effektiv” halsgivning under øvelsen.
Approximationsprincippet er sammen med den klassiske betingning senere blevet til det indlæringsprincip der af Skinnner er blevet kaldt for “shaping”. Ved dette indlæringsprincip dannes først en klassisk betingning med f.eks. en fløjte som det udløsende signal til stemningen mad. Dernæst kan fløjtelyden i en indlæringsproces så at sige midlertidigt erstatte belønningen. Princippet blev videreudviklet i forbindelse med træning af delfiner (i USA). Først lærte delfinerne at forbinde fløjtelyden med fisk (klassisk betingning). Dernæst blev fløjtelyden brugt til at belønne ethvert “skridt i den ønskede retning” (approximationsprincippet). Skulle delfinen f.eks. lære at hente en bold der blev kastet ud i bassinet til den, blev der i første omgang fløjtet når delfinen svømmede i retning af bolden, dernæst fløjtet når den nærmede sig bolden, senere når den rørte bolden o.s.v., indtil den til sidst ved hjælp af fløjtene var blevet “vejledt” til at hente bolden tilbage til træneren. På den måde formede træneren delfinens adfærd frem til det ønskede (approximationsprincippet er i den danske hundelitteratur også blevet kaldt for formningsprincippet – ordet “shaping” kommer af det engelske ord “shape” der betyder “form”).
Til slut vil jeg omtale nogle principper for vedligeholdelse af indlært adfærd. Jeg har i det foregående omtalt princippet om 100% forstærkning i forbindelsen med dannelsen af hukommelsessporet – selve indlæringsprocessen. Når det drejer sig om at bevare hukommelsessporene, altså vedligeholde det indlærte, så tegner der sig nogle andre principper. Skinner opstillede en forsøgsrække, der skulle belyse vedligeholdelses-
princippers indflydelse på duernes adfærd. Forud for forsøgene havde duerne lært at hakke på en plade.
I ét forsøg prøvede han så at give duerne belønning i bestemte tidsintervaller (f.eks. hvert tredje eller hvert femte minut), uden at tage hensyn til hvor mange gange duerne hakkede på pladen. Duerne fandt ret hurtigt ud af, at det var lige meget om de hakkede 1 eller 10 gange inden for tidsintervallet – belønningen kom uanset hvad. De lærte derfor hurtigt at økonomisere med kræfterne og hakkede til sidst kun én gang pr. tidsinterval. Resultatet var altså en svækkelse af det indlærte (eller måske snarere en nedsat effektivitet).
I et andet forsøg tildelte han belønningen i forhold til antal hak. Nogle skulle f.eks. hakke 3, 9 eller flere hundrede gange før belønningen kom. Skinner kunne således lære duerne at hakke i timevis med et tempo på op til flere hak i sekundet. I modsætning til det første forsøg fik han her højnet effektiviteten af det indlærte. Overført til situationer fra træningspladsen kan dette princip f.eks. bruges på følgende måde: En hund der har lært sin “sit-øvelse”, men ikke er specielt hurtig, belønnes nu kun fremover hvis den laver sin øvelse hurtigere end før. Øvelser med samme tempo (eller dårligere) belønnes ikke. Eller hunden, der i sin halsgivning af figuranten holder en langsom kadence og mangler effektiviteten i øvelsen, bringes gennem figurantens stimuli til at halse hurtigere og mere effektiv, hvorefter den kan belønnes for at lave en bedre øvelse end før. “Status quo” belønnes ikke – kun forbedringer i forhold til “status quo” belønnes. Derved højnes “effektiviteten” i det indlærte.
I det tredje forsøg blev duerne belønnet efter tilfældige, varierede tidsintervaller (f.eks. efter 3 sek., 20 sek., 6 sek., 15 sek., 130 sek.,….. o.s.v.). Duerne vidste således aldrig hvornår belønningen faldt og vedblev derfor at hakke på pladen ganske som det var blevet indlært – altså et godt princip til vedligeholdelse af indlært adfærd. Når vi f.eks. har fået gjort hunden nogenlunde forståeligt hvad øvelsen “lineføring” (eller fri v. fod) går ud på, så skal de fremtidige belønninger komme efter et “tilfældighedsprincip” – hunden skal aldrig vide hvornår belønningen kommer (den skal komme som en overraskelse hver gang). Mange hundeførere forfalder let til kun at belønne for øvelsen når den er “færdig” f.eks. ved et stop, hvilket bevirker at hunden til sidst kun gider at være opmærksom når hundeføreren stopper op. Dette forhindres forholdsvist let ved “tilfældighedsprincippet”. Nogle gange belønnes efter ganske få skridt, andre gange efter flere – nogle gange belønnes i en vending, andre gange ikke o.s.v.
Dette var så, hvad jeg havde valgt at medtage i denne gennemgang af “Indlæringspsykologien”. Jeg håber, at det med denne artikel er lykkedes at besvare bare nogle af de mange “hvorfor-spørgsmål” som jeg indledte med, og på den måde være med til at gøre det lettere for hundeførerne at arbejde med “problemerne” . Det er i hvert fald min erfaring at hundeførere der kender til “teorierne” bliver bedre til selv at finde svarene når der indtræder problemer – de bliver gode problemløsere!