心理實驗法下學期同學上台順序

出自KMU Wiki

在2008年6月26日 (四) 15:41由Sinki (對話 | 貢獻)所做的修訂版本
跳轉到: 導航, 搜索

以下各組名單依上台前後順序排列,上課實況記錄A班由(zzadjin)負責,B班由(sinki)負責。

目錄

刻苦耐勞組

2008年3月21日

A班實況:

【同學提問部分】
  • 實驗相關:

1. 巴南效應評分解釋的來源?
Ans:由仿間心測與星座特質等類似常用語構成十八個不同的解釋。
2. 整體實驗時間長短?
Ans:第一階段約三十分鐘,第二階段在一星期左右完成結果。
3. 兩種不同結果的敘述正負向比例是否影響了巴南解釋大於真實解釋這樣的結果?
Ans:這是我們目前仍需要討論的部分。
4: 在第二階段的實驗材料中,並沒有提供真實效應的短文,是否會因此造成實驗結果的偏差?
Ans:因提示作用效應不大。
5: 在第二階段中,是否確定受試者了解巴南效應?
Ans:在閱讀完短文後會詢問受試者,若有不清楚的地方則會重新解釋。
6. 實驗對象均為大學部學生,是否能夠將此結論推論至涵蓋更大的母群?
Ans:由於使用的 16PF 為大專版本,因此實驗對象有其侷限性。
7. 測驗工具的選擇為何使用卡氏十六種人格因素測驗?
Ans:取得比較容易,且測驗難度適中。
8. 實驗對象是否曾經施測過 16PF?是否會影響實驗結果?
Ans:受試者的部分,採隨機處理以平衡這方面誤差。
9. 自評量表為何使用六點量表?而不使用其他量表?
Ans:前測時曾使用五點量表,但因統計上結果使得測驗有效性判斷不易,故改用六點量表避免此狀況,期望有較明顯的結果。
10. 測驗題數是否可能影響實驗結果?
Ans:並無差異。

  • 文獻探討與實驗目的和假設:

1. 在文獻回顧的部分,已經有巴南效應大於提示作用的實驗結果,可是卻又提出提示作用會降低受試者對巴南解釋所評定的有效性分數?兩者好像已經有衝突了?
Ans:這是我們該檢討的部分。

【老師回饋部分】

1. 在回答台下同學的問題時,除了主答的同學外,其餘同組的同學也可以盡量補充回答。
2. 台上表現的部分,除了解釋清楚,例如條列式的方式外,投影片的字體大小也要注意。若有統計圖片需要呈現也需要注意呈現的方式對於實驗中材料的使用,也可將實際的內容放上投影片,但需要注意呈現出來的比例大小。
3. 注意報告的時間以及投影片的數量控制。避免過多過少的情況。
4. 台下的同學在發問的時候,或者聆聽報告的時候,可以注意投影片的編號,在發問時若有需要可以直接從投影片中討論,可使得問題內容更明顯。

B班實況:

【同學提問部分】

  • 提示作用效果不顯著的原因:

1. 是否確認受試者之前有無接觸過巴南效應,因為巴南效應來自星座專欄,是否受試者之前已接觸過?
Ans:沒有做確認,因為受試者的部分我們採隨機處理以平衡這方面的誤差。
2. 前面有提到巴南效應偏正向受試者比較容易接受,有沒有可能是因為受試者16PF的測驗偏負向,而巴南效應偏中性而使結果不顯著。
Ans:真實結果偏負向而影響到巴南效應的關係可能需要更進一步的實驗探討。
3. 在提示效果不成功的原因裡,有一項操弄不成功是指?
Ans:是指我們有效性的操作型定義下的不夠好,我們期望有提示作用後受試者能夠察覺巴南的描述有效性低,若為真實描述有效性較高,但無法確定受試者確定是否受試者瞭解此定義,可能受試者還是以符不符合來評定描述。
4. 實驗結果受試者者的真實結果偏負向,而真實結果偏正向,而根據文獻受試者傾向選正向的特質,若將巴南效果編制傾向負向,是否會改變不顯著的結果?
Ans:我們對受試者下的操作型定義是有效性,是請他們判斷句子是否是來自他們測驗結果而得,而不是判斷符不符合的程度。


  • 對實驗的澄清:

1.為何採用16PF做為工具,而不使用其他心理測驗?
Ans:這是目前我們得到比較方便,且小樺老師願意借我們的測驗。
2.在第二階段會寫出他們的個人特質,七到十個特質和巴南效應,是針對每個人設計不同的題目嗎?還是每個人都一樣?
Ans:在真實部分針對個人實際測驗的結果,而巴南效應是所有人都相同但排序隨機。
3. 前測時採五點量表,為什麼測驗的時候改為六點量表。
Ans:因為前測時發現測驗結果都傾向於3分,為了要瞭解受試者對測驗的有效性高或低,故改為六點量表。
4. 怎麼確定實驗中自己編制的巴南效應題目有效果?
Ans:因為最早的巴南文獻提到是根據星座專欄改編的巴南特質,而我們上網去找星座專欄改編成巴南特質,而根據前測結果發現受試者普遍相信我們所編制的巴南特質。
5. 文獻的部分有提到,受試者即使知道巴南效應的效果也會去相信,那為什麼你們會認為給提示效過之後會有差異?
Ans:因為文獻上提到的是正向的巴南特質,而我們實驗不是採用純正向,也有一些是非正向,我們想探討是不是非正向的部分也會有影響。
6.實驗請受試者針對真實結果和巴南效應進行有效性評分,請問有效評分是指這個敘述是不是符合自己得個性嗎?指導語這樣子說的話,會不會只是單純請受試者判斷那個句子是巴南那個不是,而不是針對他的有效性來評分?而受試者做了16PF,重點應放在判斷敘述句符不符合自己的描述,而不是告訴受試者結果,再來讓受試者判斷那個是巴南那個不是。
Ans:指導語-你若認為該敘述是根據妳所進行的測驗分析而得的結果。我們所操弄的是提示作用的變項,我們想探討受試者有無看巴南解釋。而判斷是否為巴南是我們所要操弄的變項,而這樣的實驗程序也有可能影響到實驗結果,對於那些模糊的句子是否還是會傾向於相信是自己測驗所得的結果,對此來做有效性的評分。至於這樣的實驗程序是否影響可能需更進一步討論。
7. 請問你們所編制的巴南測驗中,是有正向也有負向,還是同一題包含正向和負向?
Ans:因為文獻有提到受試者傾向會去相信正向的巴南特質,所以我們在一個句子中有正有負,沒有特別的偏向。


  • 對實驗的建議

1.一般人會認為女生較男生會去看星座,此次的實驗性別也是一半一半,當初有沒有考慮把性別當作事變項來操弄呢?
Ans:當初沒有規劃分性別來操弄,所以此次測驗目前沒辦法探討。
2.若僅是探討提示作用對受試者判別是否為巴南,而要排除符不符合,則不應在前面採16PF,因為根據16PF的結果來判別很難排除符不符合的因素。若探討的不是符合性話,建議採用巴南句子和非巴南的句子,讓受試者勾選是否即可。

 

【老師回饋部分】

  1. 投影片的量可以在稍稍增加一點。
  2. 希望各組可以在報告之前先預演,多加練習。
  3. 投影片可以提供同學問一些「好問題」的線索,例如:統計結果的部分,有些是顯著、有些是接近顯著。
  4. 台上的動態示範不錯,但希望如問卷、指導語部分能夠打在投影片上,用掃描的話字太小。


幸福佳婷裡有灰色糖...

2008年3月28日

A班實況:


A 班紀錄者(zzadjin)公假。

B班實況:

【同學提問部分】

  • 實驗設計相關問題

1. 證人記憶之前已經做過很多的研究,男女的區別之前也是有很多研究證實女生比較容易受干擾,報告也說你們和之前研究的實驗結果是相同的,我 想請問你們和之前研究有沒有不一樣或更進一步的操弄?
Ans:在文獻中提到男女在不同性別會有不一樣的回應,我們針對這一點來做改進,將兩性別的比例各分配一半,去掉性別的變項只看誘導關係。
2. 在實驗組中有沒有辦法避免受試者是重複觀看文章的,如果受試者再閱讀完文章後重複觀看次數越多,是否對他們的誘導會有影響?
Ans:這部分我們沒有辦法確認實驗組是有重複觀看或是沒有。認真觀看,但是我們大概檢測一下實驗者答題的情形以及錯誤率,大致上都還分配的滿平均的。
3. 請問受試者的來源是從哪裡來的?是否受試者對環境有一定的瞭解程度會影響到實驗的結果?
Ans:雖然高醫學生對環境比較瞭解,但是實驗和對照組都是看相同的影片,所以應該不會有太大的問題。
4. 因為最後採選擇的方式來檢視,選擇題的選項是否對他們的回答產生影響?會造成是題目選項去誘導它,而不是誘導操弄去誘導,譬如在警衛室那邊可能會選取比較有可能出現的東西?
Ans:如果不知道是題目選項和實驗操弄那個誘導力比較強的話,對照組應該可以解決這個問題,如果題目選項有較強的誘導關係,實驗組應和對照組的誘導關係差不多,但結果有顯著的差別。
5. 在實驗組的部分有無告知受試者哪一個才是真實的情境,會不會有受試者認為後面誘導的文章才是真實的情境?
Ans:我們有在指導語的部分提醒他們作答是根據影片內容的情境。
6. 我覺得他們在回憶的程序上看起來是不太一樣的,這樣看起來似乎是三個階段,在第二個階段一個是誘導文一個是數學題目,會不會受誘導文這組多一次去回憶情境,而另一組可能是空白的直接去做那些題目?
7. 在中間的過程中有一部份的人是看誘導文,另外一部份的人則是做數學題目,想請問為什麼是採用數學題目呢?因為女生不是對文字記憶比較深刻,所以為什麼在無誘導組不同樣採用文字,而是選用數學題目?
Ans:(詳見老師回饋部分2)
8. 請問實驗對象男女生的性別比例是都各半嗎?
Ans:是的,每一組人數皆相同。
9. 你們有引述到的文獻中提到女性對於行動的細節回憶較正確,男性對於整體周圍的細節較正確,那你們照片強調的細節部分是比較偏向於哪方面?
Ans:對於環境人物的身上我們都會放一些。
10. 剛剛頭影片上面有提到「誘導力」,這部分可以麻煩在解釋一次嗎?
Ans:誘導力指的是該題選到要誘導那個選項的人數。如果誘導的是圓形,他選倒圓形,表示該題他有被誘導到;假如十人當中有五人選到圓形的選項,那麼表示該題的誘導力是五成。
11. 在分析結果之前就知道文字對於女生的影響,我是覺得在誘導文部分是以文字呈現,在問卷的部分也是以文字呈現,情境很相像,我想請問是否有考慮用口頭回答的方式,而且比較接近一般法庭在詢問的情況?
Ans:因為我們每個程序盡量都標準化作業,用口頭回答可能產生差異,強調的動詞、語氣、表情都可能會影響到受試者。
12. 如果受試者在信心程度填答0的時候,該題目是否可排除掉,因為受試者很可能是猜的而不是受誘導。
Ans:我們在前測篩選題目的時候,若大多數人都圈選信心程度是0的時候,代表該題目問的問題太細節,我們會把他排除掉。
13. 你們24個圖片呈現刺激的時間是5s,加起來才兩分鐘,而且圖片是比較片段的;而你們去誘導的東西,是一整個比較完整的文章,刺激的時間是五分鐘。那麼你們會不會覺得誘導的情況那麼顯著,是因為兩個刺激的差異太大?
Ans:可能會有這樣的情況。
14. 如果受試者有被誘導的時候你們還會看他的信心程度嗎?若受試者的信心程度為0,你們還會採用嗎?
Ans:我們前測之後就沒有再採用信心程度,前測是因為怕題目出得太細,之後若是用猜的話,會用統計的方法把他排除。
15. 關於妳們拍的頭影片部分,因為是在高醫校園,會不會受試者(高醫學生)是憑著他的記憶去選擇,而不是因為影片?
Ans:因為我們選擇的都是高醫的學生,這樣可以平均調那些剛好有經過或印象比較深的人憑記憶選擇所導致的誤差。
16. 因為你們是在教室放投影片,會不會因為視角的關係大家看到的不一樣?
Ans:我們有告訴受試者,請他選擇能看清楚的位置來坐,我們是控制受試者坐到大概中間的位置。


  • 誘導力的問題

1. 誘導力的部分是以選中誘導的題目當分子,那你們有22題的題目,為什麼不以22 題當作分母,猜錯誘導的題目當作分子?因為被猜錯的題數不一樣,被誘導的題數一樣。像是兩個人,一個人猜錯3題,只有一個人被誘導;一個人猜錯兩題,只有一個人被誘導。相較之下猜錯兩題的那個人誘導力就高出很多。
Ans:但是我們是採統計去檢定它的差異,那如果妳只是因為機率的因素讓它選到誘導的選項,這樣在跑統計的時候就會排除兩個比率不同的情況,如果顯著就可能表示這兩個分數機率的不同。
2. 你們的誘導力是指在題目中選到誘導選項,若假設有兩個人選到誘導的題數都一樣,但每個人可能達題的正確率並不一樣,可是卻只看誘導力?
Ans:因為我們主要的是想看誘導的效果,所以我們才會把依變項設為誘導率,正確力可能是因為每個人記憶的能力可能不太一樣,所以我們並沒有探討這個部分。

3. 如果在22 題中,那個人只錯了1題,那一題剛好是你們的誘導題目,那誘導率就是百分之百。另一個人如果答錯12題,誘導率還是答錯1 題的人較高。那麼為什麼不考慮以總題數下去做誘導力的估算呢?
Ans:因為我們做這項設計的用意是要排除個人因回憶能力的不同而導致的差異,在實驗的過程中我們並沒有只錯一題的情況出現。

4. 對照組(無誘導)的誘導力不是歸到0的地方,那這樣算是有誘導力嗎?

Ans:因為我們並沒有操弄對照組的變項,如果有這種情況出現的話,很可能是機率導致選到誘導的選項。


  • 對實驗的建議

1. 報告一開始有提到文獻指出女性受誘導的程度比男性高,且女性對於婦女出現和行動細節回憶較正確,那為什麼一開始沒有想到實驗設計把主角換成男生,然後引導文的部分是用男生的口吻去回應,這樣是不是比較能夠看出男性和女性受誘導的程度差異?因為你們focus就已經徧落在文獻提的女性比容易受誘導。

【老師回餽部分】

  1. 一組三個人,希望一個的報告時間至少十分鐘左右,是希望各位能夠把事情講清楚,這樣台下發問的會更好,不會問出實驗是怎麼操弄的問題。
  2. 剛才有人問短期記憶的影響,中間隔十分鐘做數學題目是要避免短期記憶的影響,因為怕在十分鐘內若沒有限制他的活動,受試者可能透過複誦來加強他的記憶,所以中間夾雜數學題目來避免受試者複誦。
  3. 誘導力是希望去校正個人記性好壞的問題,但是這有一個先決條件,就是總錯誤率到底是多少,因為總錯誤率裡面極端的話,這樣的校正誘導率會出問題,就像有人提到記性很好,只錯一題剛好是誘導的題目,這樣會有極端直出現影響會很大。
  4. 有些問題可能是出現在預料之外,一些low data要準備好,像是統計數據來回答平均錯誤來回答有疑慮的問題。
  5. 有些問題台上報告講過,或是台下互動中已經被提到很多次,同樣的問題不要繼續問,可能要在想想其他東西。
  6. 像是總錯誤率等等的問題,報告組在寫到告的時候需注意,四選一中的誘導率機率是多少,跟妳資料的差距大不大,稍微算一下會更好。


心實活動組

2008年4月11日

A班實況:

【同學提問部分】

1. 形狀階段部分,使用正方形、圓形、三角形,這樣會不會造成在形狀判斷時,需要多判斷一個步驟而造成時間上較顏色階段來得長?
Ans:依據文獻設計。在顏色部分使用相同形狀而改變底色,而在形狀部分使用相同底色而改變形狀。
2. 在顏色階段的部分,所選擇的顏色為紅色及綠色,選擇這兩個顏色的原因為?
Ans:依據文獻設計。因此使用紅色及綠色這兩個相對比的顏色。
3. 在形狀階段的部分,所使用的圖形順序依序為正方形、圓形至三角形,使用這個順序的原因?
Ans:形狀上的相異,例如圓形與正方形及三角形相比為無角的形狀,較容易辨識。為了讓兩種形狀的差異達到最大。
4. 在顏色階段部分,使用紅色這種視覺上較容易被注意到的顏色,是否會因為這樣降低錯誤率?
Ans:這是有可能的,未來可以的話會嘗試使用不同的對比色組來探討。
5. 為什麼要做反應時間的限制,會不會因為這樣影響了受試者作答時的錯誤率?
Ans:因為主要探討的是對刺激的反應,如果不限制反應時間可能受試者在較長的反應時間可能已經受到其他干擾,例如思考。
6. 在兩階段的實驗過程中,是否有給予受試者足夠的休息時間?
Ans:在實驗程序中,若受試者在十字凝視點並未按下反應鍵則實驗並不會繼續,此時受試者可以有休息的時間;而在兩階段間,閱讀指導語時也可以有休息的時間。
7. 是否能修改材料設計,例如顏色部分將灰色佔位方塊呈現之後,省去原本第二張刺激投影片,直接呈現三綠一紅方塊讓受試者反應;形狀階段也用類似的方式修改。
Ans:這樣會沒辦法呈現突現與刺激。
8. 顏色階段使用紅色作為刺激顏色,可是在很多研究中紅色在大多數情況中較易被人注意,會不會因此當刺激呈現時,更容易辨識出紅色這個刺激而導致錯誤率下降?
Ans:顏色的部分主要是沿用文獻的設計,而我們的實驗主要討論的部分是反應時間,所以會希望錯誤率較低會比較好。
9. 為什麼在最後一個需要受試者判斷刺激的部分需要限制受試者的反應時間呢?因為實驗的主要目的不是要探討反應時間的差異,如果僅平均有效的反應時間數據,不用理會錯誤率的問題,只要統計反應正確的部分,也可以達到實驗目的?
Ans:因為實驗探討的主要是關於對突現刺激的反應時間,如果反應時間過長有可能是因為受試者已經經過思考而干擾了刺激的影響,因此為了確定反應是因為突現刺激的影響,所以必須限制反應時間。
10. 在形狀階段的部分,有沒有考慮使用類似星形之類的多邊圖形,這樣會比使用三角形還來的更容易辨識?
Ans:主要還是使用正型圖形,例如正三角、正方、正圓圖形。
11. 指導語的部分,將實驗情境敘述的如此清楚,會不會有受試者因為指導語造成被過度指導或暗示而影響了實驗結果?或者修改內容將一些比較不需要的部分移除?
Ans:因為如果沒有敘述清楚,在實驗操作上可能會使得受試者誤會突現刺激而造成錯誤時有額外的干擾因素,所以會將實驗情境作較清楚的描述。
12. 有沒有考慮將兩個實驗階段合併為一,利用隨機編排將形狀與顏色的題目都混合進行實驗?
Ans:這樣可能會造成兩者處理歷程上的混淆而造成錯誤率過高的情況,而為了避免練習效果因此分為兩個階段進行交錯實驗。

【老師回饋部分】

1. 只注意到練習效果,卻忽略了疲勞效果以及順序效果,此實驗設計應該是要平衡順序效果。
2. 注意名詞使用上的問題,例如:嘗試 (trial) 以及測試 (test) 的不同。
3. 還是需要注意時間的控制。
4. 台下同學發問及台上同學回答時不必要用很對立的方式,課程主要是互相討論。
5. 在回答同學問題時,可盡量先單獨回答問題,除非真的不知道該如何回答在與其他同組同學討論。因為小組會議多會影響到時間控制。

B班實況:

【同學提問部分】

1. 人對顏色的注意力本來就是會有差異,像紅綠燈,我們人對紅色本來就比較敏感,對綠色本來就比較不敏感,那麼為什麼你們做顏色的時候還是選擇紅色、綠色來做?為什麼不選擇敏感程度差不多的顏色?
Ans:實驗選擇紅色、綠色的部分我們是引用文獻,而我們做的是突現刺激,而不是要檢驗顏色的敏感度,基本上顏色只要是對比色就可以了。
2. 開始出現顏色或形狀之前不是會有四個灰色的小框框,可是當你們出現顏色的變項時時,他的框框同時是沒有改變的,可是當你出現形狀的時候,另外三個的形狀不是會變成圓形嗎?為什麼他不要繼續用正方形呢?
Ans:我們第一階段主要是控制形狀,大家都是要用方塊正方形,所以他會有顏色的改變(灰色紅色);第二階段我們要控制的是顏色,所以他只在占位方塊會呈現正方形,皆下來個方塊就會改變成不同的形狀(正方形三角形)。
3. 之前在做實驗的時候,發現在圖形與圖形間的交替會有視覺暫留的現象,因為受試者也想很快地完成,在按下中央圓形鍵切換到下一張時,然會有上一張的圖片殘留的感覺,不知是否會對實驗結果造成影響。
Ans:視覺暫留的現象是從0.1s-0.5s,我們題目切換的時間已經超過1s,所以應該不會有視覺暫留的現象;而在中間十字鍵的位置其實可以稍作停留,不用立刻按下去。
4. 請問剛剛報告錯誤率的地方有提到「首誤」,請問「首誤」指的是什麼意思?
Ans:首誤第一是從反應時間來看,可能他在100毫秒就做出反應,但是人的反應時間沒有辦法這麼快,可能是不小心按到的:第二,他可能是按到圓形鍵就直接跳到下一題,也會判斷它是首誤。
5. 在獨變項中只有突現和非突現的刺激,這樣是單因子實驗設計;可是後來又比較顏色和形狀,這樣還是單因子嗎?是不是在統計檢定要採用其她的統計。
Ans:我們分作兩階段來進行,顏色階段只會出現顏色的改變,並不會出現形狀改變:同樣形狀階段只會出現形狀的改變,不會有顏色改變。形狀和顏色是分開進行的,不會有同時改變形狀和顏色的情況,只是單純想比較兩組反應時間的差異。
6. 為什麼在實驗中採用和反應目標的形狀和顏色,紅色和正方形,而不採用其他的呢?
Ans:因為在文獻中其實有探討相似和非相似,文獻中的非相似效果並不顯著,所以我們打算直接用相似的來作實驗。
7. 實驗中每個圖片呈現的時間,其實和視覺暫留有很大的關係,請問實驗中的600毫秒,跟後面讓他們作決定的1000毫秒是怎麼作決定的?
Ans:是參考文獻方面的設計也是600毫秒和1000毫秒。
8. 最後討論部分,關於「辨識形狀的歷程比辨識顏色的歷程來的複雜」,你們有找到相關的厭來佐證?
Ans:我們並沒有找到相關的文獻來佐證,但我們是依據顏色的反應時間比形狀來的快,所以我們才推論可能是形狀辨識歷程較為複雜。
9. 在實驗中形狀部分用三角形和圓形,顏色部分用紅色和綠色,有沒有考慮加入不同地形狀或顏色組合?
Ans:再進一步實驗時,會考慮加進其他組合搭配的。
10. 實驗組主要是作突現刺激的影響,但是為什麼參考文獻中提到不相似的是不顯著,相似的是顯著,你們還是要選顯著壓?已經確定會造成影響,在實驗中為什麼還要作呢?
Ans:因為我們還有作形狀的部分,所以先作顏色部分和形狀來作對比。
11. 實驗中提到的「新物件假說」,與突現刺激和非突現刺激反應時間達顯著的關係為何?
Ans:從「新物件假說」來看是指一開始從無到有的刺激,從一開始占位方塊就沒有告訴受試者等等刺激會出現的位置,等到下一個畫面出現時,它就突然在外側周圍出現一個干擾,這就是「新物件假說」的意思。而突現和非突現的差別在於,有無提示受試者等等干擾出現的位置,所以可能是因為突現和非突現的關係,影響到受試者做出的反應時間差別。
12. 紅色和綠色在名度上是有差異的,這樣會影響到反應時間的差異嗎?
Ans:因為我們選用的顏色是正紅色或正綠色,所以不會有這方面的困擾。
13. 超過1000毫秒而沒作反應就算錯誤,請問突現組和非突現組因為這樣子而錯誤各自各有幾人?會不會有人是因為來不及作反應而導致錯誤呢?
Ans:平均下來是3.9人,個別沒有作計算,因為錯誤率部分還包括「首誤」。我的目的本來就不希望他們思考太久,若思考太久可能是經過大腦思考後才做出反應,就不算被突現刺激干擾了。


【老師回饋部分】

  1. 選用頭影片作為表現,目的是為了輔助口頭上的講解,上面可以留一些線索幫助你的解說,但是不要照稿唸,可能沒有注意到下面的同學都已經快睡著了,要懂得去變化和活用。
  2. 台下問問題上要具體,有些人記得第幾張從那邊問起,相當不錯;最怕的是講到中間用一些代名詞去代替,例如:這兩個因素間有沒有交互作用、這個有沒有問題、那個是不是不一樣,可能會導致台上回答問題或台下亂掉,所以做好不要用代名詞。
  3. 因為實驗本身具複雜性,A、B提問都未能幫助他們釐清,形狀和色彩之間在注意力的分配過程當中,這部分還有更多討論的空間。反應時間都顯著,可能看不出各組間有些可能有一些問題的存在,但是在錯誤率的指標,恰好有一些不顯著,有一些可能是天花板效應,都很少錯誤,但是有一些可能是其他的原因。


少了意仁組

2008年4月25日

A班實況:

【同學提問部分】


1. 問卷發放後,回收時會不會因為有其他的干擾而造成受試者回答的結果有偏誤?
Ans:有可能的,這是因為研究的限制而無法掌握,但是均有讓受試者知道不計名。

2. 與文獻(李卓夫,民89)中的差異?
Ans:最大的差異在屬性變項的控制,在我們的研究中多了母親教育程度。

3. 母親對子女的影響主要是在子女幼時,要如何避免母親可能是在子女成年或者長大以後才外出就業?
Ans:在發放問卷時有事先告知受試者以母親大多數的狀況為主。

4. 問卷採五點量表的方式評分,要如何避免受試者答案作假的問題?
Ans:因為實驗的限制無法精準的避免受試者作假,但是因為樣本數量還算足夠應能避免這樣的問題。

5. 挑選有效問卷的方式與標準?
Ans:作答不完整的問卷列為作答不完整的問卷就不予採用。例如未勾選母親的教育程度。

6. 問卷的題目是如何選擇的?
Ans:性別刻板印象的部分都是採用文獻。

7. 計分時應該有反向計分會比較適當,如果都用極端值可能不太適合?
Ans:會評估對整體性的題目設計來選擇更適合的評分方式。

8. 母親的就業狀況與教育程度可能是共變的,會不會是因為這兩個變項本來就有高相關而影響實驗?
Ans:原本文獻是將母親的就業狀況與教育程度加權計分,而我們是將這兩個變項獨立出來當作實驗的屬性變項。

9. 區分母親的教育狀況是要看母親的刻板印象狀況,所以是否能夠使用母親刻板狀況或兩性平權的態度較好?
Ans:可以有進一步的研究。

10. 在收集樣本資料的時候有沒有事先對樣本做篩選?例如先篩選掉特殊的家庭狀況。
Ans:無事先篩選。

11. 回收問卷有流失的部分會不會造成其他剩餘的有效問卷中,各屬性變項的比例不同而影響數據結果?
Ans:採隨機化處理,希望了解大學生與母親狀況之間的相關。

12. 有沒有考慮到可能母親所就業的職業類別有可能也影響到大學生的刻板印象形成或者減弱?
Ans:在問卷上有需要受試者勾選母親的職業類別來區分。

13. 會不會是因為把母親的教育程度區分過細,所以造成實驗的結果中對於母親教育程度並無顯著影響?
Ans:這部分是參考文獻設計所沿用的。

14. 各地區中可能母親所受的教育與狀況不同,可能所造成的刻板印象影響也有可能不同。問卷的取樣範圍僅有高醫?
Ans:能力限制的緣故因此主要以高醫學生為主。


【老師回饋部分】

1. 報告的同學,PPT 的頁碼要記得標註一下,報告時緊張難免,但要注意報告訴度以及台下反應,不要只看螢幕報告。

2. 以實驗法研究為主,問卷調查研究具有難度,因為問題層面較大,要相當大的抽樣以避免偏誤。

3. 利用文獻的方法要理解文獻中使用的原因,當被問到相似實驗方法的問題時,利用這個方式回應並不太恰當。

4. 問問題時應更具體化較好,與為何有相關的理由。

B班實況:

同學提問部分

  • 實驗澄清部分

1. 請問實驗在發問卷時是當面拿給受試者填嗎?如果是的話,受試者會不會揣測實驗的意思,或是不好意思表現出刻板印象?
Ans:是當面拿給受試者填寫。因為我們實驗並沒有盯著受試者填寫,只是請受試者填寫完畢遞交給我們即可,所以應該不會有這方面的影響。
2. 請問你們報告中提到的「有效問卷」,「有效問卷」是指?
Ans:是指200份的問卷中,若有只有任何一個項度沒有填寫致使無法統計,即是為無效,其餘皆為有效問卷。
3. 在實驗中屬性變項當中,性別是一個很重要的變項,那為什麼受試者男女的受是人數相差會這麼大?如果性別是一個重要的變項,為什麼不控制在一樣的樣本數?
Ans:因為我們只需計算到他的平均數,所以以平均數來講並沒有很大的影響;而且在我們的文獻中其實男女受試者是一樣沒有平均的。
4. 在楊國樞、楊中芳老師「華人本土心理學」中有提到,華人比較重視團體中個人被賦予怎麼樣的角色和責任,而在歐美西方社會較重視個人;請問這樣不同的文化差異是否對性別刻板印象也會造成不同的影響?
Ans:在這次的實驗中並沒有操作,不過在文獻中有探討,台灣的大學生在性別刻板印象比美國來的高,而兩性平權較美國來的低。但是我們比較好奇的是現在的大學生和過去的大學生有什麼樣的差異,是和文獻來相比較,之後有更進一步研究的話才會拿來和國外相比。
5. 請問實驗中判別刻板印象程度的題目是怎麼決定的?
Ans:是和所引用的文獻進行修改,因為文獻距今有點久,有些觀念或用詞並不適用於現在,因此我們會稍作修改。
6. 這次實驗的結果為母親的就業狀況對性別的整體刻板印象沒有顯著影響,可是文獻的結果是全職的家庭主婦會較為顯著,請問是什麼原因導致和文獻不同的結果?
Ans:在文獻的年代,全職家庭主婦較多,外出工作的母親較少;而現今因為經濟壓力大,婦女不得不走出家庭。另一方面,近年來女權伸張,職業婦女並不被視為一種異端,可能這樣才造成與文獻不同的結果。
7. 請問為什麼前測實驗問卷中的效度可以高到.9,正常的信度大概是在.3~.5?
Ans:是採用統計軟體因素分析跑出來的,只是確定此份問卷是否有效,並未探討為何會有這麼高的信度。
8. 在結果部份提到,男生的刻板印象相較於女生有顯著的差異(0.043),是全部比起來嗎?如果是的話,為什麼在探討部份提到,只有在玩具遊戲活動層面有達顯著?
Ans:是整體有效問卷中男性和女性相比有達顯著。而整體下又分作四個分量表,在玩具遊戲活動層面也同時有達顯著的。
9. 刻板印象是女生較高,兩性平權是男生較高,請問刻板印象和兩性平權兩者之間有什麼樣的關係?
Ans:在本次實驗中並沒有探討這部份,不過在文獻中有討論到是呈現負相關,而這次實驗我們並未作此分析,未來進一步探討時會再作兩者之間的比較。
10. 實驗探討的是性別角色刻板印象,應該是指說「性別角色」在社會上扮演的刻板印象,是不是應該把文化層面的因素考慮進去,例如問卷中有提到:洗碗是適合女性還是適合男性?如果他勾其中一個的話,適合女性或適合男性,就表示他有性別刻板印象。可是這裡指的是「角色」的話,是不是應該改成說,煮飯是女性的工作,你認不認同?(文化層面來看女性叫為家庭中洗碗的角色)
Ans:因為我們主要探討的是受試者個人的想法,而不是受到文化層面影響的程度,所以才會採用這樣的問法。


  • 問卷題目和計分方式

1. 問卷的部份是採用李克特的量表,一般的評分方式是1、2、3、4、5,想請問為什麼在「普通」會評0分?
Ans:實驗主要採取0、1、2、1、0的方式來計分,後來也有採取正向計分1、2、3、4、5和反向計分5、4、3、2、1,這三種方式比對後發現差異不大,曲線都一樣,所以最後還是採用0、1、2、1、0的方式計分。
2. 在問卷的五點量表部份,在設計問卷的時候其實已經偏了一個方向,例如「男主外,女主內。」,題目本身已經偏了一個方向,但是在評分的時候,卻是把「沒有意見」設為最高分,如果我勾選反對(0分),我只是反對這個話,我是站在兩性應該平等的位置上去思考,這樣就沒有計到這題得分數,會造成這樣的情況。
Ans:我們認為「不贊成」有兩種意思,有兩種意思,一種是站在完全相反地位置(女主外,男主內。),另一種是反對那句話(認為其實應該是要平等)。可是中間還有一個無意見的選項,我們認為無意見是最中庸的,所以我們會採最高分。此外,其實我們正向和反向計分的方式都有採用過,其實曲線視差不多的,後來我們認為無意見是最中庸的,所以後來選擇此種計分方式。
3. 在題目的1、2題,都是偏向男性的題目;3、4題都是比較偏向中性的題目。譬如說「男主外,女主內。」不認同這句話的話,通常會勾在不認同,但如果像是3、4題較為中性的題目,通常都會勾在無意見。這樣子兩種不同類型的題目(偏向男性/中性)採取同樣的計分方式,是否對結果也會產生影響?
Ans:所以針對實驗的結果有另外有採取不同的計分方式(正向/反向計分),來檢視是否造成影響,結果發現相同的趨勢,所以應該不會產生影響。
4. 關於「刻板印象」的題目方面,像是在玩具運動活動方面,有一題「極限運動」,因為男生的體力較高於女性,所以今天我勾選男生較適合,那麼就代表我有刻板印象嗎?那麼怎麼去定義說去勾哪個性別就代表有刻板印象呢?
Ans:因為極限運動男生和女生都可以玩,且在國外男女很普遍,妳如果認為它只適合某一種人玩時,就代表你有性別的刻板印象。
5. 譬如釣魚,我覺得男性和女性都可以去釣魚,但我覺得男生較常在作,所以較適合男性,這樣代表我有性別刻板印象嗎?
Ans:只要是偏向男或偏向女,都認為有性別刻板印象。


  • 對實驗的建議

1. 請問實驗當中有沒有考慮到受試者父母親離異的部份?因為父母親離異,而受試是給父親撫養,相較之下母親對他的影響較小,這樣可能繪影想到實驗的結果。
2. 實驗結果母親的就業狀況對性別的刻板印象是沒有影響的,第二和第三個屬性都是屬於母親的,那有沒有考慮可能真正影響的是父母間的互動情況影響性別刻板印象和平權狀況。誠如前面報告所述,現在因為經濟壓力的因素,婦女就業的情況相當普遍,那麼這裡的影響就沒有這麼大,很可能父母的互動過程才是主要的原因。
Ans:因為實驗當中很難對「互動」下定義,所以才採用職業來作區分,不過進一步探討時我們會考慮這項因素。


老師回饋部分

  1. 他們的計分方式和平常所看見的不一樣,都有一些意義,並不是說哪個對哪個不對,這種計分方式好處是並不用考慮每一題要計正向或負向,正向、負向有時候很模糊,尤其是在平權的議題上,例如:傳宗接代對男生很重要,「是」或「不是」才是平權?因為問卷上的項目,作答的人並不是完全能掌握主試的意思,有些人認為傳宗接代是女性的任務,這樣的想法可能不平權,以這種角度來思考,也可能勾選「不贊成」。認為男生必須傳宗接代,可能勾選「正向」或「負向」很難講,所以在題目上會有很大的爭議性,所以在這種情況下才會採用這種計分方式,只要有偏向就算是不平權,不過這樣使用也會有問題,這要看實驗者站在什麼角度去使用。
  2. 台上報告提到有另外使用兩種計分方式,「正向」或「負向」看起來差不多,這種說法可能會造成質疑,做好能準備資料,不見得要放在投影片,但若有人提問時可以把資料show出來供檢視。
  3. 社心相關的實驗複雜度較高,一下子可以看到很大範圍的地方,可以較周全看到各種問題,顧慮太多的事情沒有辦法控制到干擾的變項,會導致複雜度高,穩定度卻低,這樣變異量、變動性很大,很難得到一個穩定的東西;作實驗的人就可能認為這樣精準度不高。而實驗設計可以讓我們找到較核心、認為重要的問題,可使用較單純的問題作為操弄,可以看到單純的效果,很多變項是必須控制起來,或把它平衡掉,只看其中的幾個部份,會有比較穩定的結果出現;但從社心的角度來看,只著重在一小部份,無助於對整體的瞭解。不過載心理實驗法的課程中,還是希望同學能從小的地方開始作,能以「實驗設計」操作。

如來佛組

2008年5月2日

A班實況:

【同學提問部分】

1. 影片採用 MV 作為實驗材料,會不會有受試者以前看過或者比較熟悉而造成實驗結果上的誤差?
Ans:在問卷上有事先詢問這個問題,會排除這樣的受試者。

2. 在實驗組與對照組的三個實驗階段過程的第二個階段,對照組以及實驗組的認知歷程好像有些不同?
Ans:為了確保三組都有相同的記憶回朔的情況,因此做這樣的實驗設計。

3. 在最後的測量階段中使用簡答題,可是會不會其實是受試者本來就已經有錯誤認知,而非被干擾?
Ans:因此我們採用組間設計的方式與對照組進行比較。

4. 受試者人數數量的決定方式?有特別控制人數或者男女比例嗎?
Ans:自行評估所需的受試數量,有控制總人數,但並未控制男女數量的比例。

5. 如果有受試者評估自己的自信程度低,但是卻發生答案都正確的情況,這樣的結果是否會被採用?
Ans:在實驗過程中自信程度低的受試者通常傾向不回答或者答案錯誤的狀況,並無發生自信程度低卻答案正確的情況。

6. 使用簡答題做為第三階段材料,可是其實有些簡答題的題目有選擇性的答案,例如左手、右手的選擇?
Ans:類似的封閉性題目並沒有辦法避免,因為若使用難度較高的題目可能造成普遍性錯誤率高,因此我們另外使用信心程度來評估。

7. 干擾表的干擾題目數量決定的方式?型式?
Ans:依據文獻設計為總題數的五分之二,過高時可能會有更明顯的預防針效應;干擾表均由主試者用各種方式手寫填答。

8. 若受試回答時空白或者可能是因為被干擾才發生這類答題錯誤的狀況該如何處理?
Ans:僅有正確回答才列入計算,或者被間接或直接干擾才會計算,其餘皆不計分。

9. 因總題數僅十五題,而干擾題數僅有六題,可能造成實驗結果的數據因一題之差而偏誤過大,能否增加總題數來避免此情形?
Ans:題目均為主試設計,而在經過前測篩減掉過難及其餘不恰當的題目後所剩有限,因此最後僅剩餘十五題。若有機會可嘗試增加。

10. 如何確保受試者在間接干擾組的實驗過程中確實閱讀干擾表?
Ans:會用各種方式確定每個受試者均在詳閱干擾表之後才進行作答。

【老師回饋部分】

1. 台下同學發問時以理論討論為主,語氣控制一些,不要有太過類似質詢的方式詢問台上同學問題。

2. 報告同學在用詞的定義上要更明確,例如實驗中的操作型定義。

3. 回答問題時,回答的內容不要前後不一致,應該是整組同學都對實驗內容及過程都很了解才對。

4. 台上回答問題時不要都是同一個人回答,要適當的分配問題給同組同學,不然計分時會有差距。

B班實況:

【同學提問部分】

1. 對照組看了五分鐘的影片,然後單純的休息六分鐘,但是在這六分鐘的過程中,並沒有給受試者分心作業,在這六分鐘受試者是不是可能可以不斷地rehearsal增強回憶,而有較好的答題率?
Ans:對照組休息六分鐘,過程中希望他能回憶剛剛影片的內容,因為在實驗組方面,不管是間接或直接,間接的時候看干擾表也是在回憶,在直接部分和實驗同謀討論的時候,同樣也是在回憶。所以想說在對照組什麼都不讓受試作,可以讓受試者回顧,這樣才能盡量把三組間控制成一樣。

2. 受試者主要是針對校內的學生,譬如在作學弟妹的話,會不會因為認識實驗同謀而導致實驗的誤差?
Ans:再直接干擾組實驗同謀干擾的時候我們全部都沒有學弟妹,沒有本系的學生,都是外系不認識實驗同謀的人。

3. 在直接干擾組中,所有的受試者都是由同一位實驗同謀來操作,在和受試者討論過程中多少會有差異,是怎麼樣避免這種狀況?而且如果是和不認識的人討論,對方又一直堅持,會不會有點強迫性的選擇這個答案?
Ans:每一位受試者對於實驗同謀的干擾,他們認為的強度一定不可能相同,但是已經盡量在語氣、態度上把情境控制到相同,這是實驗沒有辦法控制到的。

4. 題目數只有六題(干擾題),這麼少的題目答對和答錯即使只有差一題,在統計上的差異還是會很大,是否應該增加題目數呢?
Ans:因為影片長度和內容的限制,絞盡腦汁才製作出20個題目,經過前測後篩選剩下15題。若要再增加題目數,可能未來影片要找長一點或困難一點的,這樣比較有內容可以問才能嘗試增加題目。

5. 十五題之中,九題是不看正確率,只有去比對那六題干擾題的正確率,但若受試者前面都答對,干擾題之中只是有一題忘記或亂選而答錯,這樣算是被干擾嗎?
Ans:每個人注意的地方不一樣,答對的地方也不一樣,我們使用對照組來排除掉這項誤差,不管在哪一組都可能發生六題中剛好有某一題不會的,所以採用三組作比對,統計上跑出來是顯著,這樣就可以除機率因素所造成的。

6. 干擾率是指受試者回答到干擾的答案而答錯,但是會不會可能是有受到干擾的影響,但是回答的卻不是實驗所干擾的內容?例如機車騎士有四個,實驗干擾是五個,但回答卻是六個。
Ans:在這個地方干擾率是算不出來的,所以有正確率的比較,這樣的答案還是錯誤的答案,正確率會下降,但是這個地方是在干擾率並不會算進去的。

7. 會不會受試者本來就是要回答受干擾的答案,而並不是受到實驗的操弄而被干擾,有沒有這樣的可能性?
Ans:我們實驗三組是隨機分派,三組都是來自同一性質的高醫學生,把它打散到三組織後,對照組方面幾乎沒有出現原本寫的答案就是實驗所要干擾的答案,因為是隨機分派,所以在其他組應該也不會出現這樣的情形。

8. 實驗中有使用到欺騙,就是實驗同謀這一部份,請問在實驗之後有作事後澄清嗎?
Ans:做完實驗之後會跟受試者告知,剛剛一起討論的受試者其實是我們的組員。

9. 在對照組六分鐘的休息時間裡,並無讓受試者看到15題的題目。但是在間接或直接干擾組,都有看到或討論關於15題題目方面的問題,所以如果讓對照組看到15題的題目,讓他們直接馬上就可以去思考,這樣歷程會不會比較接近?
Ans:前測有幾位受試者是採用這樣的方式,但是發現如果讓他們看完影片後馬上看題目,他們的印象會非常深刻。在直接干擾組部分,實驗同謀是和受試者一題一題討論;在間接干擾組部分,受試者也是一題一題看題目。這樣對照組若在看完影片直接給予題目,仍和直接/間接干擾組存在差異,因為受試者在題目發下來後可以馬上確定自己等一下要寫什麼答案。三組所經歷的歷程一定不相同,實驗已經盡可能的控制到相同的程度。

10. 實驗探討的題目是「共同證人記憶的干擾」,在文獻中證人記憶都是採用搶劫案、車禍等等事件,這樣可以使受試者很容易的知道他們要focus在哪一個點,可是這次的實驗採用的影片是音樂MV,會不會反而讓受試者不知道該注意在哪方向?
Ans:因為過去證人記憶都是採用搶案、小偷等等新聞事件,所以才會想設計一個不一樣的而沒有注意到這方面的干擾,謝謝你的建議。

11. 在間接干擾組方面,是給受試者一張干擾表,若干擾表的呈現方式是類似統計過的,例如百分之70的人認為…,這樣會不會有不同的效果?
Ans:在間接干擾組是可以這樣做,但是在直接干擾組,實驗同謀無法表現出70%認為是這樣的答案,這樣兩組就沒有辦法比對,所以沒有採用這樣的方式。

12. 請問在直接干擾組指導語的部分,有無告知受試在影片看完之後可以討論?因為若為告知受試者,而突然有個人和他討論,受試者很有可能產生懷疑?
Ans:一開始是請受試者看完影片,休息一分鐘,這一分鐘內是不可以討論的,接下來下指導語:「現在請兩位討論五分鐘。」然後他們開始討論五分鐘。

13. 請問是如何選定15題的題目和6干擾題干擾題目,是如何篩選的?
Ans:在前測的時候我們會看他的正確率,大概是介於中間,答對率太高我們干擾很困難,太低的話干擾會太容易,所以都選擇中間值的題目來施測。

14. 因為之前我們有操作過證人記憶的實驗,發現男生和女生注意的部分其實不同,若你們的受試者將男女比例控制到相同,會不會比較恰當?
Ans:因為這次實驗探討的是直接干擾和間接干擾的差異性,而不是性別的差異性,所以就沒有另外去看男女之間的差異。

15. 因為過去文獻中的實驗都是採用搶案、小偷等影片,這樣受試者在回憶的時候,會有一個主軸,像情節一樣的回憶,但是這次實驗的影片是採用MV,而且長度達五分鐘,且無劇情連貫的情節,在這五分鐘要注意的事情太多,受試者之後也因沒有劇情主軸而難去回想,這樣會不會造成實驗結果有較好的干擾情況?
Ans:因為若採用有劇情的影片,對照組在看完影片後休息六分鐘,會有較好的回憶,他可以不斷地輕楚回想剛剛的事件。但在直接或間接干擾組,受試者都是一題一題的討論或觀看,不斷地被打斷。所以才會想控制成沒有聲音、字幕,片段片段的影片,讓受試者能focus在影片上。


【老師回饋部分】

  1. 之後要請實驗組去思考直接干擾/間接干擾/對照組,這三組織間是否只有干擾的類型是不一樣的,會不會有其他東西會跟著影響到而改變,進而影響到後面結果。有些不一定是實驗控制不好,而是先天上無法控制的因素,這是之後可能要深入探討的部分。
  2. 回答問的方式很好,有時台上會被問到沒有意料到的問題,需要時間來思考,這時再覆誦一次台下發問的人問題,一方面可以更清楚知道他們在講什麼,一方面也可以釐清問題。



瑞可那一組

2008年5月9日

A班實況:

【同學提問部分】


1. 測驗後是否有告訴受試者正確答案?不同受試者可能對答案有不同的看法?
Ans:如果直接先告訴他們的話,可能是因為記憶的原因而不是認知連結。

2. 選擇四種顏色比較的原因?因為實驗的主題是詞色與色塊和詞意辨別,從實驗設計中使用兩色也可以達到效果,且實驗嘗試題目也可以減少題數避免一些混淆變項?
Ans:可參考再改進。

3. 參考文獻第三中,色塊採用 400msec 呈獻的原因是什麼?快慢的問題差在哪?
Ans:在該文獻中,在 300-500msec 呈現時間結果會最顯著,在前測中 300msec 與 500msec 的數據結果相當不穩定,因此採用 400msec。

4. 色塊與詞色連結快,詞色與詞意比較應不同?而詞色與詞意結果不顯著的原因?
Ans:自動歷程的連結是比較強的,我們覺得可能是因為這個原因所以不會有太大差異。

5. 正確反應時間與錯誤率之間的相對意義?
Ans:如果一般情況下,反應時間長,錯誤率應低,因為思考時間較長。我們覺得影響他做出錯誤決定與反應時間長短的歷程與原因是不同的。

6. 總共題數有 96 題,有否受試者在實驗過程中,有過於極端的情況出現時的處理方式?
Ans:如果有產生極端數值,會予以刪除。

7. 請問在實驗過程中,相關詞呈現出來後的反應時間有限制嗎?
Ans:無限制,因為反應時間長短可能代表受試者被干擾的程度。

8. 請問再選擇受試者時,有沒有排除有色盲的受試者?
Ans:有在問卷中事先詢問,事後會排除其數據。

9. 色塊的四個顏色選擇的方式?
Ans:與 stroop 的實驗選擇的顏色相同,並未做其餘考慮。

10. 是否有發現到某個色塊在某個詞的時候,受試者的反應比其他色塊的情況還要明顯?
Ans:沒有過度細分,可能有機會可以再做討論。

11. 在 96 次的嘗試中,相關詞的出線機率比例是相同的?
Ans:是的,且使用隨機分派的方式出題。

12. 會不會有詞優或者字優效應的問題?
Ans:我們是以事前問卷的結果來決定相關詞的選擇。

13. 前測問卷與正式實驗中的受試者有重複到的情況嗎?
Ans:均不重複。

14. 相關詞的決定與選擇方式?
Ans:在前測調查過後以其結果選出較適合的來決定。

15. 有沒有可能性別的差異會造成不同的結果?
Ans:性別在這次的實驗中並非我們想討論的主題,因此並沒有將性別列入控制的變項中。

【老師回饋部分】

1. 實驗本身複雜度高,所以基本上台上的同學報告時需要比較清楚的表現與解釋,在報告時盡量避免使用代名詞,使用適當的名稱報告,比較不會讓台下的同學混淆,雖然有螢幕輔助,但是主要還是口頭報告為重,但是過多的代名詞可能會讓台下的同學不小心就混淆了。

2. 數據的檢驗重要,例如極端值的刪除,極端值的刪除應該有個標準,且應有適當的理由說服大家怎樣的數值是個合理的極端值所以應該被去除。

3. 順序排列用隨機的原因是用來避免一些特殊效果,所以用隨機是一個常見的處理方式,也比刻意去排列實驗順序的情況來得好。

B班實況:


我愛腫子

我愛腫子讀書會之成果報告期初報告

2008年5月16日

A班實況:

【同學提問部分】

1. 計分方式為何要使用五點量表?
Ans:因為怕選項太多無法在短時間內反應,因此使用五點量表。

2. 在五點量表中,若當受試者勾選不清楚的選項,該如何計分?
Ans:如果選填不清楚的話,就不計算分數。

3. 能解釋你們的實驗結果中,統計上達顯著的意義?
Ans:就是我們操弄的實驗對因果知覺有影響。

4. 會不會因為作答時間太短,所以在五點量表中偏向選擇高分?
Ans:因為我們希望受試者是用直覺判斷,不要經過太多的思考歷程,因此設定較短的作答時間。

5. 文獻回顧中討論到練習效果對因果知覺效應有影響,可是在你們的實驗中似乎沒有討論到練習效果對於實驗的影響?
Ans:主要是回顧之前的文獻內容而已,避免有雙重引用的問題。因為其實在張建妤文獻中也是回顧前面的文獻。

6. 想請問在延宕時間的設定超過 153 毫秒時會使得受試者不會對此類撞擊事件產生因果知覺,這樣的數字是絕對數字或者?又為何在妳們的實驗中選擇 150 毫秒這種跟臨界值這麼相近的延宕時間?
Ans:在 Schlottmann 與 Shanks 的實驗中發現在 153 毫秒的延宕時間時是比較明顯的分界點,至於選擇 150 毫秒做為實驗的延宕時間則是因為 flash 軟體使用上的限制。

7. 會不會有可能是你們的方塊速度移動太快,而其實受試者沒有看懂或者看清楚就回答而造成錯誤,如果有這樣的情況該如何處理?
Ans:所以我們有設計刪除樣本資料的限制,當符合或滿足該限制的資料會予以刪除不列入統計分析。

8. 因為你們的實驗只是要是否有產生因果知覺效應,那為什麼不直接用有產生與無產生做為給予受試者回答的量表就好,而需要用到五點量表?
Ans:需要知道所產生的效應強度,而且各組間有比較,所以用五點量表較為適當。

9. 在題目投影片撥放的過程中,方塊的大小好像有一些差異,會不會造成實驗上的誤差?
Ans:這是我們技術上的問題,期待不會有差異,未來還有改進的空間。

10. 人為事件中,方塊運動方式的決定是怎麼去決定的?
Ans:依循文獻的實驗設計。

11. 為什麼不採用組間設計的方式設計實驗,更能夠確定自然事件與人為事件對此效應的影響?
Ans:基本上也是依循文獻的實驗設計方式作為我們這次實驗的實驗設計參考。

12. 文獻中提到關於練習效果對於因果知覺效應的影響,那為什麼在妳們的實驗中還要放入練習題?
Ans:為了確保受試者對於實驗過程沒有問題,而文獻中所提到的練習效果是指練習次數,意思是說當練習題數增加時,可能對因果知覺的影響。

【老師回饋部分】

1. 統計上達顯著的原因需要很清楚,且在報告時也應該有清楚的解釋。

2. 台上回答時,先想到的可以先回答,不一定每次同學提問時都要開小組會議,容易浪費時間,但是也避免都只有固定某個人再回答問題

3. 台下同學發問時,如果台上的同學聽不清楚或者不了解問題,可以先用自己的方式重述一次確認問題的內容以後,在進行回答。

B班實況:

【同學提問部分】

  • 關於實驗相關部分
  • 關於相關詞的編製
  • 實驗建議

1. 應競爭理論中,在辨識物品歷程的部分,是比較平行的,反應的歷程較快;反應的階段是序列的,因為在這裡產生衝突,所以反應會比較慢。有沒有可能是受試要同時反應詞義不和諧和詞色不和諧的部分,它的歷程不太一樣而導致錯誤率較高,而不是它看起來比較不一樣? Ans:分析實驗結果也找了很多理論佐證,但我們並不知道哪一個是最好的,我們盡可能把我們想到認為可能的因素列出,謝謝你的建議。

2. 在前測發問卷的時候是採用「紅色血液、春聯」,但是施測的時候卻是採用「血液紅色」,若p則q但是不等於若q則p(p→q=~q→~p),所以在前測的部分應該是要以物件來讓受試者判斷什麼顏色,這樣才與之後試測相符。

(請填組名)

2008年5月23日


A班實況:

【同學發問部分】

1. 和諧度的判定標準?
Ans:依據文獻中的方式引用。

2. 在文獻回顧第二點中提到視覺記憶的數量大約只有四項,超過就會過載,為何在實驗中題目中選擇十項?
Ans:實驗設計純粹依據文獻,並沒有考慮太多。

3. 改變物的改變度在題目中的比例?
Ans:有控制題目呈現內容,從文獻中取樣,所以圖片中物體數量均相同。

4. 回答時有要求回答的答案品質之類的?
Ans:有要求越詳細越好,但如果有提到相似答案即可算答對。

5. 作答的題數會不會太少?造成統計上偏差?
Ans:這是主要操弄的部分,且人數上有控制,也害怕有練習效果,因此有特殊考量。

6. 多場景的原因?為何不採用一對一的設計?
Ans:怕情境單一影響太大,且因為主要是參考文獻設計。

7. 圖片呈現的時間會不會太短,造成受試者並沒有辨別出差異?
Ans:參考文獻設計,且事後與受試者參詢後決定不改變。

8. 物件的大小比例會不會影響受試者判別?
Ans:此部分由於題目是用隨機分派的方式,應不會造成影響。

9. 前測與正式實驗的差別?
Ans:修改與減少圖片內的物件數量,排除較繁複的圖片。

10. 受試者數據的採用?有無排除極端資料?
Ans:基本上全採用,且因各題目信度不同,不太需要刪除數據。

11. 圖片中,物件改變的發生位置?
Ans:隨機處理。

12. 正確率的判定?有無防止作假或猜題的設計?
Ans:無防止作假的設計,只要改變判定與物體敘述均正確即判定答題正確。

13. 題目呈現前,倒數的原因?
Ans:怕受試者沒發現圖片已經改變,所以設計這樣的設定。

14. 作答時間有無限制?
Ans:基本上無限制。

【老師回饋部分】

1. 統計上有差異性可以是大家問問題時的一個重點。這個實驗很多地方,會有混淆變項的部分還蠻多的。例如刺激進來的方式可能會有關。

2. 報告前能夠盡量早點來找老師盡量早點來,老師也需要時間消化各組的報告內容。

B班實況:


I'm 殺組

2008年5月30日


A班實況:

【同學發問部分】

1. 依變項使用答題錯誤題數而不使用正確率的原因?
Ans:使用過,但結果不顯著,因此改用答題錯誤題數。

2. 題目設計是否有避免猜題的設計?
Ans:題目設計主要是依循文獻,並沒有新增功能。

3. 是否有可能會因為主試者在旁而造成受試者壓力而影響結果?
Ans:這部分因我們的實驗過程已標準化,且我們並沒有討論這部分可能的影響。

4. 有沒有控制閱讀時間?會不會有受試者閱讀時間非常長的情況,如果有,請問該受試數據的處理方式為何?
Ans:並無限制閱讀時間,也沒有遇到受試者閱讀時間非常長的情況。

5. 實驗程序中,兩次干擾安排的原因?
Ans:避免受試者在空白時間或者閒置時對事件回憶。

6. 在實驗過程中,視覺時間持續造成疲累,因此文字事件錯誤率大於聽覺事件?
Ans:圖文不同歷程,並無注意,所以認為無影響。

7. 在實驗過程中,是如何決定干擾三分鐘這個長度的時間?
Ans:主要是想要測短期記憶下的效果與影響,所以干擾是要避免回憶的動作以及避免形成長期記憶。

8. 討論與假設相反的原因?有沒有更深入的探討?
Ans:可能是因為故事有敘述性、受試者的自由控制或者疲累效果等均有可能造成這樣的結果。

9. 故事的選擇有沒有經過特別的篩選或處理?
Ans:剛開始的時候並沒有注意到這點,所以基本上是沿用與文獻相似的故事設計,可以再做討論。

10. 在實驗程序中經由一系列圖片誤導後可能的影響沒有討論?
Ans:圖片誤導的主要用意為避免回憶,且可從結果直接判別事件的影響,因此並沒有做更深入的探討。

11. 圖片更換與顯示的時間是否有特別控制?
Ans:均有適當的控制。

【老師回饋部分】

1. 這個實驗的記憶是長期記憶還是短期記憶似乎不太能夠下定論,雖然比較偏向是短期記憶,但是與早期對短期記憶相關的研究中似乎還是有一些差異。

2. 這個在跟老師的討論過程中,對老師來說是有一定的繁複性,但是報告前才來找老師,也需要給我時間讓我有時間去做修正。

3. 剩下的組別也不多了,最好還是能夠稍早有比較完整的稿件來,太晚來老師會措手不及。

B班實況:

【同學提問部分】

1. 「文字呈現組」比「看+唸組」錯誤率還要高,但是在「文字呈現組」中受試者可以觀看閱讀的速度,重複去觀看,錯誤率應該會比較低,那為什麼實驗結果錯誤率卻是比較高的呢?
Ans:可能是「看+唸組」多了聽覺的刺激,可是這兩組的結果是不顯著的,可能是因為重複觀看或隨意略過的混淆變項,造成這兩組的結果不顯著。

2. 實驗結果是「聲音呈現組」有較低的錯誤率,會不會是因為「文字呈現組」的閱讀方式是一段一段的看,而「聲音呈現組」因為念的語氣的關係,會讓受試者比較容易抓到重點,例如「深藍色的(稍作停頓)房子」,會不會因為這樣的因素而導致錯誤率較低?

3. 在討論的部分有提到:「在聆聽的過程中,受試者會將聽到的內容轉化為圖像。」這時候的受試者是以圖像來記憶;可是後面一系列的圖片誤導,受試者也是以圖像來記憶。會不會因為這兩者間都是以圖像來記憶,所以「聲音呈現組」受到的干擾較大?
Ans:我們實驗中的圖片比較特別,一般人在想像中比較不可能去想像這麼童話、奇怪的人的圖片,所以干擾應該不大。

4. 實驗中「文字呈現組」的九百字是如何決定的?會不會是因為字數太多而有較高的錯誤率?
Ans:第一個部分是是參考證人記憶的文獻,證人記憶通常是以故事作為題材,所以在這次的實驗是以故事來呈現;第二個部分是因為我們先找到影片,在根據影片內容去撰寫故事內容,讓文字和影片內容能夠相符合,才會有這九百字的。

5. 實驗的目的是在探討以聲音或文字方式呈現事件時,若以一事件於後將其干擾,兩者之間何者較容易被影響。那為什麼第三組是採用「看+唸組」而不是採用「看+聽組」,如果是要比較聲音和文字的差異,「看+聽組」是不是比較恰當呢?
Ans:因為若採用「看+聽組」,實驗非常難以控制唸的速度。且根據文獻「聽」的時候,會轉換成文字的記憶,這樣很容易和「看」文章產生干擾;如果是採用「唸」的話,剛開始發音的歷程有會有干擾,但慢慢的這些干擾會逐漸消失,所以最後才會採用「看+唸」的方式。

6. 文獻中是以英文作為研究的材料,而這次實驗是以中文作文研究材料,但英文是表音的文字,中文是表義的文字,是不是它在記憶編碼原本就有很大的差異,是否有找到文獻佐證兩者的差異?
Ans:這次的實驗中沒有找到關於中文和英文兩者之間歷程不同的文獻。

7. 實驗設計採用「看+唸組」,但你唸的時候要先透過你的發音再轉到聽覺歷程,這中間過程不知道會發生什麼干擾,如果改成「看+聽組」會不會更來的直接,造成的干擾也較少?
Ans:今天如果你聽到「有一隻河馬領軍的海賊團」,你聽到的速度跟你唸的速度如果不一致的話,造成的偏誤會更多。

8. 在「聲音呈現組」可以發現錄音檔唸的速度是比較緩慢的,這樣受試者有多餘的時間把聽到的內容轉換成記憶,可是在「文字呈現組」,會不會是受試者很快的看過,只有到編碼的部分,並沒有將這些編碼轉成短期記憶,會不會是這樣的因素,導致「文字呈現組」有較高的錯誤率。
Ans:在「聲音呈現組」部分不可能非常快速的唸過,因為受試者很可能聽不清楚或聽不懂,而在「文字呈現組」方面,我們也沒有辦法去確定受試者是快速或緩慢看過,不過在實驗過程中的觀察,受試者都是很認真的在閱讀。

9. 題目的分散程度怎麼樣,是按照順序排列,還是打散在裡面?是著重在故事的那個部分?另外有無做過統計看看是哪一部份的題目錯誤率較高,如果是事件前面的錯誤率較高,有可能是因為自然遺忘所造成。
Ans:題目是滿分散,而統計結果並沒有發現哪一部份的錯誤率特別高,可能是題目設計上太過簡單所造成。

10. 「看+唸組」唸的部分好像是輸入到大腦之後,在把它輸出,可是今天作的是「聲音與文字對記憶的影響」,是不是播放錄音檔,然後配合著文字閱讀會比較有關?
Ans:看的速度很可能跟聽的速度不同,這是一個混淆變項沒有辦法去掌握它。

11. 之前都在討論唸的速度與看的速度的問題,那麼有沒有可能是依照錄音檔的速度來呈現文字,例如唸「深藍色的房子」,螢幕上就出現「深藍色的房子」,有沒有這種可能?
Ans:如果看的速度較快,可能在唸的過程中已經覆誦了好幾遍,兩者之間還是可能有干擾的存在。

12. 前測的目的是為避免日後實驗發生偏誤影響,排除掉誤差,那麼在前測的時候有發現到題目的設計上太過於簡單的問題嗎?
Ans:前測的時候有發現答題錯誤率低的問題,但當時猜想可能是樣本數過小的問題,所以正式施測提高樣本數應該就可以避免,但後來發現錯誤率一樣很低,才發覺很可能是題目設計過於簡單所造成。

  • 對實驗的建議
  1. 對於中文文字的歷程回憶,之前曾志朗、洪蘭、王士元曾經有作過相關的研究可以參考採用。
  2. 今天實驗作的主題是「聲音與文字對記憶的影響」,但是你們中間卻使用一個證人記憶的干擾方式,但如果只是單純探討聲音與文字對記憶的影響,直接在文字呈現/聲音呈現/看+唸這三組後面,穿插數學干擾題,然後直接測量它的反應時間與錯誤率就好,沒有必要在作證人記憶的誤導,因為多了證人記憶的誤導會讓實驗結果不知道是實驗影響或證人記憶的影響,還是有其他可能,照中間有很多的干擾。



【老師回饋部分】

  1. 作的過程中或設計的方式,可能有一些需要調整好,想像的到的confounding,唸的方式好或聽的方式好這當然可以討論,雖然實驗有一些可能的干擾,但實驗數據做出來是有差異的,當然他們有他們的解釋,但這解釋是否正確呢?這一組在一定要特別解釋,觀看和聽之間有顯著差異;在其它組別比較沒有顯著差異,並不代表它一定相等。就像去法院無罪不代表沒有犯罪,無罪是證據不足,法律上的情形跟統計上的情形是一樣的,在沒有證據之前,內定大家是無罪的;統計也是一樣相信大家是一樣的,有不一樣才說有顯著差異,雖然一樣的部分不一定是真的一樣,不必一直討論它是否一樣;但是在真的有差異的部分,一定要特別去解釋,利用理論方面來作說明,看起來似乎要琢磨一下。
  2. 實驗的設計和過程存在著瑕疵,但是最主要還是要把有顯著的部分解釋清楚,其他的部分留作日後改進或建議,重點應胎是顯著差異的部分。

psycho@ Leipzig

2008年6月6 日


A班實況:


B班實況:

【同學發問部分】

1. 每篇文章替代的字都採用一樣的字嗎?是怎麼決定採用這些字的?
Ans:每一篇替代字都不一樣,這些字的採用都是我們認為是高頻的字,因為沒有高頻字表可以對照,我們選用六種版本都會作四種的替代,不是每篇都採用同樣的字,會視情況以適當的字取代。

2. 受試者是如何取樣,會不會受試者平時有在電腦使用這些語言,而對施測「音似形異」有較好的辨認速度?
Ans:受試者的差異是個人的差異,我們透過隨機抽樣平均掉這項誤差。

3. 有沒有考慮將中文諧音、英文諧音、注音文合在一起施測,因為平常我們在msn的使用都是合併一起使用的,這樣施測比較會符合實際的情況。
Ans:這樣合併使用我們不知道放在一起會不會有其它的交互作用,所以沒有考慮。

4. 為什麼要要求受試者唸出原本的字音,直接唸出諧音不是會比較通順,而且也是可以瞭解原本的意思?。
Ans:是剛剛報告的口誤,基本上是以受試者唸通順為主,並無規定一定要唸諧音或原本的字音。

5. 一篇文章中改的字不是很多,如果改多一點字的話,是不是比較容易看出三組間的差異?
Ans:實驗主要操弄的是和對照組的差異,並不是要作三組間的比較。

6. 當初為什麼要要求受試者把文章唸出來,後面不是有問題確定受試者是否確實閱讀文章嗎?
Ans:唸出來的目的是確定受試者有仔細的觀看,因為假設受試者不唸出來,則不能確定他的瀏覽方式,很可能是隨意快速瀏覽,這樣的話各組之間也無法比較。

7. 在實驗中使用替代的字會影響對全文的理解嗎?
Ans:我們是靠主觀認為高頻的字把它替換掉,當初沒有注意替換的字是否對文意造成影響。

8. 每一篇選擇替換的字都不相同,受試者可能因為替換的字位置不同,對有些文章理解較好,有些較差,這樣是不是可能造成實驗的誤差?
Ans:有可能,但是沒有辦法。我們並沒有高頻的字庫,全憑我們主觀判斷,如果每篇文章選擇替換的字都要相同,也要剛好有這樣的字可以替換,如果硬要更換的話,可能選用不常見的字去替換,反而會造成實驗更大的誤差。

9. 實驗中是如何選用要替代的字,實驗中改的字並不是重點字,像名詞或動詞;而是多改在非重點字,如語尾助詞,對文意並沒有影響。如果選擇重點字的話,是否效果會更加明顯?
Ans:並沒有著重在重點或非重點,因為也不一定有合適的字可以替換。

10. 在實驗中有分別對英文諧音、中文諧音、注音文作兩兩比較,看何種影響是最顯著?
Ans:是和對照組比較何者最顯著,並沒有另外作兩兩比較。

11. 在摘要上面指出「實驗中發現,所操弄的變項確實有造成受試者閱讀障礙的情況發生。」但是所謂的「閱讀障礙」,應該指的是受試者對文意理解感到困難,而實驗中發現的是延遲的現象,因此應該不能推論有「閱讀障礙」的情況發生吧?
Ans:我們想要指出的是延遲的效果,可能字面上的意思還要在作修飾。


【老師回饋部分】

  1. 實驗比較沒有找到直接相關的文獻,不是直接關於網路語言閱讀的資料,可能要多找一些資料補充,並另外將錯誤率、刪除的資料(指閱讀完文章測驗受試是否有理解文意的題目,受試者只要回答錯誤數據就不採用)重新去跑統計,看看有沒有其它的結果。
  2. 雖然刪除的步驟很好,不是針對資料去刪除,而是有一個標準去刪除,但是刪除的資料太多筆,可能要深入探討。
  3. 還有其他相關的文獻可以補充,例如認知歷程方面,不能歸咎於沒有眼球偵測器,希望期末報告能在補強。

(學長組)

2008年6月13日

A班實況:


B班實況: