猴~草芋桑游雞

出自KMU Wiki

跳轉到: 導航, 搜索

指導語對測驗結果的影響

摘要

探討指導語應用在受試者和試卷之間的關係。首先,實驗研究者先隨機挑選60位大學學生參與我們的測驗,此測驗內容包含兩大部分:1. 第一部分為魏氏成人智力量表(WAIS)矩陣推理分測驗,目的是篩選合適的受試者,受試者必須在推理邏輯方面的能力較為相近,以免產生受試者間差異之變項影響結果。2. 第二部分為實驗研究者改編自德國IQtest.dk網站,其題目類型與第一部分類型相同,為本實驗研究之核心,操弄此部份的指導語以達到預期效應。實驗研究者預期:被告知題目較為困難的指導語之受試者成績,將會比接收到題目較為簡單的]指導語之受 試者成績來得差。


一、緒論

你是否曾經因為老師考試前的一句話,而影響你的考試心情與表現?每當老師說這一次的考試比較簡單時,通常我們都會抱持著較輕鬆的心情去面對考試;反之,當老師說這次考試比較困難時,我們則會對這次測驗感到十分緊張。所以我們想要知道大家會不會因為別人的一句話而影響一個人的表現。 因此在本次實驗中我們想要探討人們會不會因為外在而影響自己的行為表現。而普通心理學課本指出:大量研究顯示,人們對某些情境所持的信念和預期可能會實質改變這些情境的本質,即為「自證預言(self-fulfilling prophecy)」。 首先我們要先探討何為自證預言,Merton在1984年提出了一個的假設:知覺者的期望可以真正的導致該期望的實現,也就是自證預言(self-fulfilling prophecy)。自證預言是一個強而有力的現象,這個現象是一個三階段的歷程:第一,知覺者對某一對象形成印象,也許是基於與該對象互動或其他資訊而形成的印象;第二,知覺者的行為與該初始印象一致;第三,對象不經意地調整其行為而與知覺者的行動一致。最後的結果是:行為驗證了第一印象。


再來我們根據Steele的理論預測,因為社會普遍對女性在高等數學技能的負向刻板印象(stereotype),女性可能時常在與此技能有關的情境中經驗到刻板印象威脅,於是減少這些情境中的刻板印象威脅,應該可以減少女性在這個領域上的不良表現。 為了測試這點Steven Spencer 等人(1999)招募男性學生與女性學生,他們的數學都很好,也感覺數學對他們的自我認同是很重要的。研究者給這些學生做一個相當困難,且大家都會考的很糟的標準數學考試。在考之前對照組的學生被告知這個考試並無性別差異,也就是女性在數學的負向刻板印象與該考試無關;實驗組的學生則被告知考試真的顯示出性別差異。結果如同Steele的理論所預測的,當實驗組的女性被告知這個考試可以顯現性別差異時,他們表現的比男性糟;但是當對照組的女性被告知考試結果不會有性別差異時,他們的表現就跟男性一樣好。 而在Gresky, Dana Prestwood, Texas Christian U., US所發表的That was hard ! examining the effects of test instructions and content on women's mathematics performance under stereotype threat.當中,也證實了女性在性別刻板印象之下,表現真的如預期中的較不理想。 而此二份文獻皆以操弄指導語的方法來影響受試者,使其達到預期之結果。所以我們也想要以這種方式操弄受試者的測驗分數,達到我們預期的效果。


二、實驗方法

1、受試者 共60位受試者並隨機分為兩組,年齡在18~22之間,教育程度皆為大學。

2、實驗材料 本次實驗隨機將受試者分為兩組,分為簡易組與困難組,而實驗的內容以題本方式呈現,除了指導語之外,這兩組測驗的內容皆相同。 我們將題本分為兩部份,第一部份為魏氏成人智力測驗其中之矩陣推理分測驗:共26題、為彩色圖樣、題目多為2X2圖形、答案選項為5個(如附件一),是我們用來篩選受試者,以避免受試者間差異過大;第二部份改編自德國IQtest.dk(題型也為矩陣推理測驗):共26題、題目為3X3圖形、答案選項為8個(如附件二),是我們所觀察的依變項。 此外,在第一部份與第二部份結束後皆會發放一份問卷請受試者填寫,以便知道受試者對指導語的感受程度。


三、實驗程序

在這個實驗當中,受試者被隨機分為兩組,受試者必須先完成第一部份測驗,接著發放一份問卷,填寫完畢後,主試者會依據不同的組別給予不同的指導語,而在聽完不同的指導語後,接下來受試者將完成第二部份測驗,結束後須再填答另一份問卷。 此次實驗受試者將會看到缺少了一個部份的圖樣,受試者需要盡快的判斷,並在下列選項中選出最適當的答案。 在本次的實驗中獨變項為指導語的不同,而依變項為受試者的測驗分數。


四、實驗步驟

1.在本實驗中需要受試者兩組(簡易組及困難組),一組30個共60人。

2.先使用魏氏成人量表中的矩陣推理分測驗,對受試者群進行篩選,並根據此部份前測中大多數人的結果來當作篩選依據,刪除某些極端的受試者,避免極端值所造成的誤差,在這段分數中的受試者所做出來的數據即為本實驗所採用。

3.兩組的差異在於第二部份指導語的不同,簡易組的指導語為:此部份的作答方式與第一部份相同,題目難度比第一部份簡易許多,但還是請同學小心謹慎作答;困難組的指導語為:此部份…題目難度比第一部份困難許多,請同學小心謹慎作答。

4.作答期間請將答案填於答案紙上的第一與第二部份,且題本上不得標記任何符號或文字。

5.第一部份與第二部份的題目作答時間皆為十分鐘,受試者必須逐題作答,不可跳題。

6.第一部份與第二部份題目作答完畢後,皆須填寫一份問卷。

7.我們蒐集篩選過後之受試者的第二部份測驗分數,接著使用獨立樣本t檢定來推算實驗結果是否達到顯著。

五、實驗結果

以下折線圖為簡單與困難兩組,第二部分的答錯題數之人數統計。

簡單組平均答錯題數:4.87         困難組平均答錯題數:5.2

因為|tcrit|=|-0.243|<|tobt|=1.699,所以不顯著。


六、問題討論

本實驗利用獨立樣本t檢定計算所得的結果並不顯著,因此我們結論出以下幾點錯誤:

1.第一部分的題目難度與第二部分的題目難度:在前測時,我們採用問卷的方式詢問受試者,而受試者普遍反應出兩部分的題目難度相差不多。但在正式實驗過後,受試者普遍反應出第二部分題目較難,因此我們經老師建議,改成計算答題正確率及兩部分正確變化率,發現兩部分題目難度不同,這可能是造成實驗不顯著的原因。

簡單變化率的平均-2.59% 困難變化率的平均-2.70%

2.受試者態度:我們預先設定為受試者將以嚴謹的態度來面對這次的測驗,但是這畢竟不是考試,所以我們無法要求每一位受試者以謹慎的態度去面對,因此可能是造成實驗不顯著的原因。

3.指導語不夠強烈:這次實驗的指導語差別只在於「簡單許多」和「困難許多」。而當關鍵的指導語不夠強烈時,對受試者所造成的影響自然就會降低,因此可能是造成這次實驗不顯著的原因。

4.練習效果:在受試者填寫完第一部分題目時,對於矩陣推理的題目類型及作答方式越來越熟悉,可能對第二部分作答的分數造成影響,所以推論可能是練習效果造成實驗的不顯著。

5.疲憊效應:因為一、二部分的題目都有26題,受試者皆需動腦推理才能解出大部分的題目,所以做到後來可能因為疲憊的關係,而造成第二部分的分數相對於第一部分來得低,使得實驗結果未達到顯著。

6.理論用錯:在本實驗中,目前我們只知道這是預期的一種,無法跟自證預言做連結,因此我們將會繼續搜尋與其相關的文獻,進行下一步的探討。


七、參考文獻

Mac Lin, M. Kimberly. Experimental Psychology: a case approach.

Rosenthal, R., & Fode, K. (1963). The effects of experimenter bias on the performance of the albino rat. Behavioral Science, 8.

Saul Kassin & Steven Fein & Hazel Rose Markus. Social Psychology.

Merton, R. (1984). The self-fulfilling prophecy. Antioch Review, 8,

Rosenthal, R., &Jacobson, L.(1968). Pygmalion in the classroom: Teacher expectation and pupils’ intellectual development. New York: Holt, Rinehart and Winston.

Gresky, Dana Prestwood, Texas Christian U.(2007). That was hard! examining the effects of test instructions and content on women's mathematics performance under stereotype threat. US: ProQuest Information & Learning.