ASLA-Information nr 33:1, 2007

Partitur med karta

En modell för transkription av skriftanvändning

Karin Milles, Institutionen för nordiska språk, Stockholms universitet
Karin.Milles@nordiska.su.se


Syftet med följande artikel är att föreslå en modell för transkription av skriftanvändning. Med skriftanvändning syftar jag på när man på något sätt hanterar skrift (skriver, läser, pekar på text) i en social verksamhet. Transkriptionsmodellen som presenteras i artikeln är speciellt utarbetad för att användas inom projektet Text och arbete i den nya ekonomin (läs projektbeskrivning via länken: http://www.amkarlsson.se/textocharbete/).

Alla exempel i artikeln kommer från en transkription av ett möte, ett så kallat riskanalysmöte, som spelats in inom projektet. Mötet har 8 deltagare. En person, som här kallas Rolf, leder mötet och diskussionen rör ett antal lappar som sitter uppsatta på en whiteboard. I exemplet inskränker sig skriftanvändningen till att Rolf med viftningar och pekningar hänvisar till lapparna. Mötet beskrivs mer ingående i Karlsson (2007a).

Jag har velat finna en modell som utgår från de klassiska transkriptionsmodeller som används inom samtalsforskningen men som samtidigt är modifierad för att dessutom fånga hanterandet av skrift i ett samtal. Modellen ska också gärna ge möjlighet att referera till det skrivna. (Detta kan jämföras med andra modeller som utarbetats för multimodal interaktion där det främst handlar om att notera rörelse, blickar och gester, exempelvis Heath 1984, 1986, Goodwin 2000 och Mondada 2006). För detta speciella syfte behövs en transkriptionsmodell som på ett systematiskt sätt möjliggör notation av icke-verbal kommunikation, utan att tynga transkriptionen med för många detaljer som gör den svårtydbar.

För att fånga social interaktion använder många forskare, i synnerhet samtalsforskare, videokameran. Med videokamerans hjälp kan man samla in och bevara interaktionen, för att sedan kunna analysera den i detalj på ett sätt som inte annars varit möjligt. Inom samtalsforskningen är det sedan vanligt att transkribera interaktionen enligt ett särskilt system, som särskilt fokuserat samtalandet. Det system som vanligtvis används, i sin helhet eller något modifierat, finns presenterat i Atkinson & Heritage 1984. Andra modeller diskuteras och presenteras bland annat i Ochs (1979), Heath (1984) och Milles (2003). Transkriptionen är ett medel att frysa de blixtsnabba ögonblicken av interaktion och göra dem överskådliga för analys (Londen 1995:19). Genom noggrann transkription har samtalsforskare upptäckt mönster i samtal som vanligtvis går för snabbt för oss att uppfatta när vi själva deltar eller lyssnar på en interaktion i realtid – sådant som turtagning, uppbackningars placering och pausers interaktionella funktion.

Men transkriptionen är också ett sätt att för analysens skull fokusera det viktiga (Ochs 1979:168) och skala bort det oviktiga. För att kunna transkribera ett samtal har man alltså gjort ett slags grundläggande analys där man bestämt vad som är viktigt och oviktigt, vilket gör att transkriptionen alltid är en del av analysen. Att man genom en noggrann transkription skulle kunna notera allt som försiggår när människors möts och interagerar är en teoretisk omöjlighet – och det skulle också bli en helt oläslig transkription! Häri ligger också utmaningen för forskaren, att finna en balans mellan den noggrannhet som upptäcker den tidigare förbisedda detaljen, och det fokus som skalar bort den oviktiga informationen. Slutsatsen blir dock att en viss analys av materialet alltid måste föregå transkriptionsarbetet.

1 Transkription av icke-verbal information

Då icke-verbal kommunikation ofta är en relevant del av vanliga samtal innehåller traditionella transkriptioner av samtal i de flesta fall viss icke-verbal information. Vanligtvis noteras den inom dubbla parentestecken som metakommentarer, se exempel 1.Ett problem med detta är att den icke-verbala händelsen eller handlingen ofta uppträder samtidigt med verbala aktiviteter. Transkriptionssystemet har visserligen viss flexibilitet för att hantera samtidighet, då sådan information som röstläge, tonhöjd, betoning etc. kan noteras genom att man manipulerar skriftbilden. Antingen kan man använda sig av olika bokstavseffekter – hög röst kan noteras med versaler och emfas med understrykning. Man kan också använda symboler som placeras runt omkring ett ord – när man noterar att något sägs skrattande kan man exempelvis ringa in orden med asterisker. Men om man ska notera icke-verbala handlingar som utförs parallellt med de verbala går inte detta, och det gör att det blir svårt att veta exakt tidpunkt för den ickeverbala händelsen. När är det Rolf i exemplet ovan pekar svepande? Är det efter han sagt göra de men innan han säger utan nu eller gör han det samtidigt som han talar? Det är helt enkelt svårt att se dels den ickeverbala aktivitetens utsträckning i tiden, dels vad som sker, eller eventuellt sägs, samtidigt.

Men det här kan man hantera. För att visuellt kunna skilja ut och ge plats åt icke-verbal kommunikation har barnspråksforskare ofta använt sig av en kolumnmodell. Kolumnmodellen försöker renodla tidsrepresentationen vertikalt – det som sker på samma nivå sker samtidigt. Ochs (1979) föreslår en modell med en kolumn för det talade och en kolumn för det icke-berbala. Också Milles (2003) använde en kolumnmodell för att visuellt kunna notera både samtidigt tal och tystnader i flerpartssamtal.

Skulle det fungera att använda en kolumnmodell för att transkribera skriftanvändning? Nedan har jag transkriberat en sekvens ur riskanalysmötet, se exempel 2. Transkriptionen har fått tre kolumner. Ochs modell för barnspråk (1979) gav varje talare två kolumner – en för deras verbala och en för deras icke-verbala handlingar. Att ge varje talare två kolumner skulle här ta för mycket utrymme i anspråk – med åtta deltagare skulle det ge 16 mycket smala kolumner om de ska få plats på en sida! Då vi primärt är intresserade av skriftanvändningen som kommunikation och detta innebär att det oftast är den pågående talaren som använder skriften kommunikativt, har jag endast skapat en kolumn för detta.Samtidigt tal är dock ganska vanligt förekommande, se exempelvis rad 19 där Olof säger samtidigt som Rolf talar. I de fall då samtidigt tal sammanfaller med skriftanvändning visar transkriptionen alltså inte vem av de pågående talarna som notationen hör till.

Men det största problemet med den här modellen är att den, även om den visuellt skapar en vertikal tidslinje som i sig kan ange samtidighet, med kolumnernas hjälp ändå presenterar denna samtidighet på olika ställen, i olika kolumner. Och då utgångspunkten för analysen var att särskilt fånga in sådan skriftlig användning som används kommunikativt, och detta ofta innebär både en samtidighet och ett samspel med det sagda, är det olyckligt att det i transkriptionen uppstår ett visuellt avstånd dem emellan. Därför passar inte kolumnmodellen för det aktuella syftet.

Nästa modell som ska prövas är den så kallade partiturmodellen, som många som arbetar med icke-verbal kommunikation brukar använda. I partiturmodellen utgår man från den dramadialogiska modellen men noterar handlingar som sker samtidigt under varandra, precis som man noterar olika stämmor och instrument under varandra i ett musikaliskt partitur. Exempel finns i bl.a. Heath 1984, 1986, Broth 2003, Mondada 2006). Vi prövar det på transkriptionen, se exempel 3.Det här fungerar bra. Nu kan vi tydligt se när den icke-verbala kommunikationen inträffar och vem det är som kommunicerar. Detta är dock inte nog för en transkription som ska ligga till grund för en analys av skrifthanteringen. I det föreliggande transkriptionsexemplet ovan får vi bara veta att Rolf pekar och viftar, men inte vad han pekar på eller viftar med. Ser man på filmen är det uppenbart att han använder en penna för att peka på post it-lappar som är uppsatta på en whiteboard i ett konferensrum under ett möte. Och då det är skrifthanteringen vi är ute efter ska detta naturligtvis in i transkriptionen på något sätt. Hur ska man då kunna notera detta på ett någorlunda platsekonomiskt sätt?

Mitt förslag är att man först utifrån videofilmen identifierar de centrala skriftresurser som används i mötet samt kategoriserar de olika typer av skrifthändelser som sker.

2 Analys av skriftresurser

Låt oss alltså först identifiera skriftresurserna. Det transkriberade samtalet är som sagt ett så kallat riskanalysmöte, där en projektgrupp med hjälp av en riskanalytiker tar upp och värderar de risker man ser med ett visst projekt. Mycket av samtalet rör sig kring en whiteboard där man satt upp ett antal post it-lappar, var och en med en risk, och grupperade efter vilken typ av risk man menar att det är.

Whiteboarden är indelad i sex stycken namngivna kolumner, varav de två sista är uppdelade i två celler, se figur 1. Sammanlagt blir det åtta fält. I fälten finns sammanlagt 58 stycken post it-lappar uppsatta, var och en representerande en risk. Hur många lappar som sitter inom varje fält syns också i figuren.Jag menar att vi kan se whiteboarden som en text med deltexter, som utgörs av de namngivna kolumnerna och de enskilda post it-lapparna. Detta kan kodas med hjälp av siffror och bokstäver, som tydliggör dess organisation, och som i sin tur möjliggör en systematisk och utrymmessnål notation i transkriptionen. Sålunda kallas whiteboarden som helhet text 1. De åtta fälten får en siffra som anger vilken kolumn de utgör och eventuellt om den är uppdelad på två celler. Fältet ”drift/förvaltning” kallas då text 1: 6A. Post it-lapparna får siffror utifrån vilken plats de har i fältet. Den fjärde lappen i fältet ”drift/förvaltning” kallas alltså 1: 6A:4. Denna figur med texterna kan ses som en komplettering till transkriptionen, som används av den analytiker som är intresserad av skriftanvändningen, men kan bortses från av andra.

I transkriptionen ska inte endast anges vilken text som används i kommunikationen, utan också vad man gör med texten, vad det är för typ av skrifthändelse. Det här kan ju variera väldigt mycket från situation till situation, det finns antagligen ett oändligt antal olika typer av skrifthändelser. Vilka typer man väljer att fokusera beror ju också på vad man är intresserad av att analysera. I det aktuella mötet tycker jag att man kan skilja ut några typer som kan vara relevanta att skilja på. I detta möte läser man högt, man skriver, man hänvisar genom att peka eller vifta och man flyttar på lappar. Jag har därför valt att här urskilja fyra handlingar: läsa (högt), skriva, peka, flytta.

Att läsa en text innebär här att läsa den högt. Naturligtvis förekommer det en hel del tystläsning också under mötet – om inte annat så läser ju mötesdeltagarna på lapparna på whiteboarden. Att läsa tyst har dock inte noterats som en skrifthändelse här eftersom det i normalfallet inte innebär någon kommunikativ handling.

Vid ett tillfälle skriver Rolf ny text på en av lapparna. Att skriva innebär naturligtvis att man skapar en ny text. Hur ska man då hantera det, när vi redan på förhand har skapat ett system med de existerande texterna i figur 1? Då det skrivande som förekommer innebär att man kompletterar en redan existerande deltext, en post it-lapp, kan man fortfarande använda kodningssystemet. I andra sammanhang måste man antagligen komplettera kodningssystemet för texterna med något slags tidsmarkering, så att man kan notera om en text tillkommer eller tas bort under tiden.

Det här gör det tydligt att det är skrifthändelserna och inte det skrivna som fokuseras i analysen. Vi kan alltså inte använda transkriptionen för att i detalj analysera innehållet i de texter som finns, hanteras och skapas i interaktionen, endast hur de hanteras. Men vi får med vilken text det handlar om, och därmed också textens innehåll på ett intertextuellt plan. Att flytta en text, dvs. i det här fallet en post it-lapp, innebär att den får en ny beteckning, och detta noteras då i transkriptionen genom att den gamla noteringen följs av en pil och den nya koden.

Kompletteras transkriptionen med allt detta så ser den ut som i exempel 4. Där har tre kommentarer ersatts av två. De två första icke-verbala noteringarna som fanns på rad 7: [pekar och [pekar, viftar har slagits ihop till en skrifthändelse: [pekar på och viftar mot 1, och den på rad 12: [pekar, slår mot tavlan har ersatts av: [pekar på 1:1:1.Transkriptionen ger nu alltså mer specifik information om just vilken text som aktualiseras, men har också grupperat den icke-verbala informationen i de kategorier som valts i just detta sammanhang. I andra sammanhang kan andra kategorier vara relevanta. Genom att sedan kombinera denna transkription med transkriptionsprogram där videon kan länkas till delar av transkriptionen och sedan sortera de olika länkarna i kategorier, har man basen för en systematisering av skrifthändelserna i interaktionen. Videolänkning möjliggör också ett noggrannare studium av enskilda skrifthändelser som verkar intressanta.

Transkriptionsmodellen är nu modifierad med ett kodningssystem för de texter som hanteras i samtalet. Modellen bygger alltså på den traditionella transkriptionsmodellen men har utökats med ett systematiskt och någorlunda platsekonomiskt sätt att koda skrifthändelser. Den kan användas framförallt för att analysera skrifthändelser där det finns en eller några centrala texter som hanteras på ett ganska likartat sätt genom hela interaktionen. Om den kan vara fruktbar på interaktion med mer komplicerad skriftanvändning är en öppen fråga.

Modellen visar på hur den visuella sidan av en text kan vara betydelsebärande, dvs. att texter är multimodala. I det riskanalysmöte som använts som exempel i artikeln flyttar man ibland på post it-lapparna på whiteboarden, så att de hamnar i ett nytt fält och därmed får en delvis annan betydelse. Detta kan man visualisera i transkriptionen genom notationen där kodningen ger information om betydelseförändringen.

Något annat transkriptionen visualiserar är skriftens och texternas roll i samtalet. Genom att i transkriptionen ger skriftbruket en egen rad, liksom alla talare har det, visas hur texten kan fungera som en röst i samtalet.

Litteratur

Atkinson, J. Maxwell & Heritage, John, 1984: Structures of Social Action. Studies in Conversation Analysis. Cambridge.

Broth, Mattias, 2003: Analyse de l’interaction à la télévision. Moderna Språk, 2(2), 193–202.

Goodwin Charles, 2000: Action and Embodiment within Situated Human Interaction. Journal of Pragmatics, 32, 1489-1522.

Heath, Christian, 1984: Talk and recipiency: sequential organization in speech and body movement. I: Structures of social action. Studies in conversation analysis. Red. Atkinson, J.M. & J. Heritage. Cambridge. S. 247–265.

Heath, Christian, 1986: Body movement and speech in medical interaction. Cambridge.

Karlsson, Anna-Malin, 2007a: Deixis och kontextualisering i tal om skrift. I: Språkets roll och räckvidd. Festskrift till Staffan Hellberg den 18 februari 2007. Red. Milles, K & A. Vogel. Stockholm. S. 159–168.

Karlsson, Anna-Malin, 2007b: Text, situation, praktik: Om ramar och resurser för tolkning av texter i arbetsrelaterade skrifthändelser. I: Ett vidgat textbegrepp. Red. Gunnarsson, Britt-Louise & Anna-Malin Karlsson. Uppsala.

Londen, Anne-Marie, 1995: Samtalsforskning: en introduktion. I: Folkmålsstudier. 36. S. 11–52.

Milles, Karin, 2003: Kvinnor och män i möte. En samtalsanalytisk studie av interna arbetsmöten. Stockholm.

Mondada Lorenza, 2006: Video Recording as the Reflexive Preservation and Configuration of Phenomenal Features for Analysis. In: Video Analysis: Methodology and Methods. Red. Knoblauch, Hubert, Schnettler, Bernt, Raab, Jürgen & Soeffner, Hans-Georg. Oxford: Peter Lang.

Ochs, Elinor, 1979: Transcription as Theory. I: Developmental Pragmatics. Red. Ochs, Elinor & Bambi B. Schieffelin, New York. S. 43–72
Åter till ASLA-Information