心理實驗法下學期同學上台順序
出自KMU Wiki
在2008年6月26日 (四) 15:45所做的修訂版本 (編輯) Sinki (對話 | 貢獻) (→【同學提問部分】) ←上一個 |
當前修訂版本 (2008年6月27日 (五) 22:51) (編輯) (撤銷) Zzadjin (對話 | 貢獻) (→A班實況:) |
||
(21個中途的修訂版本沒有顯示。) | |||
第353行: | 第353行: | ||
=== B班實況: === | === B班實況: === | ||
+ | <br> | ||
+ | ====【同學提問部分】==== | ||
+ | *關於實驗相關部分 | ||
+ | |||
+ | 1. 在Stroop效應中,它的文字是代表它的顏色,可是實驗中的文字是相關詞,這樣子對Stroop效應會不會有影響?<br> | ||
+ | Ans:色塊和相關詞的部分是引用T-scope,不是引用Stroop effect,Stroop部分是利用來作顏色的干擾。而且實驗目的是要探討色塊和相關詞的連結性,所以不會用顏色文字來作。<br> | ||
+ | |||
+ | 2. 錯誤率的計算方式為何?<br> | ||
+ | Ans:錯誤題數/該組總題數,例如錯3題,而那一組的總題數24,3/24。<br> | ||
+ | |||
+ | 3. 在討論部分有提到在詞色不和諧與詞義不和諧,它的錯誤率和RT皆高,實驗提到的例子可否在作一下說明?<br> | ||
+ | Ans:例如西瓜、香蕉和蘋果都是水果類,會讓比較搞不清楚是香蕉、蘋果、芭樂或香蕉、蘋果、鳳梨,但若是香蕉、衣服、桌子他們三個是不同類型的話,會讓人比較容易記憶。<br> | ||
+ | |||
+ | 4. 為什麼沒有控制受試者的反應時間,因為若不控制反應時間,受試者可能是經過思考後才回答答案,而導致錯誤率的降低?<br> | ||
+ | Ans:當初設計實驗的時候沒有考慮到設計時間一到就跳下一題的方式,後來發現如果設計秒數的話,不太能抓,可能受試者還沒反應完就跳到下一題,那題目一跳的時候,腦筋又空了一次。而且在指導語有要求受試者盡可能的快速作答,所以在實驗受試者只要一想到就會快速作答,應該不會有停頓思考很久的情形。<br> | ||
+ | |||
+ | 5. 因為實驗是先給色塊,再給詞色和詞義,我自己有參加過實驗,在作的時候可能色塊跳走,看到相關詞的時候,會忘記色塊是什麼,所以會用詞義和詞色受否相同來判斷,所以才會導致詞色、詞義皆和諧反應時間較慢,另外三組反應時間較慢;在錯誤率方面,因為詞義、詞色皆和諧與皆不和諧都相同或都不同,所以可以瞬間反應,不用再回頭想,所以錯誤率較低,而詞色或詞義不和諧,會覺得他們是不一樣的,而忘記去回想色塊的顏色,而導致較高的錯誤率。<br> | ||
+ | Ans:色塊的時間有受試者和我們反應太快或太慢,已經做過修正。但若受試者真的忘記色塊是什麼,這是我們所無法控制的。<br> | ||
+ | |||
+ | 6. 在Stroop裡面是用「字義」和「印刷的顏色」,讓受試者判斷真正字的顏色是什麼;而在這次實驗中,是用「相關字」讓受試者判斷「是」與「否」和諧,會不會是色塊相關字的印刷去影響到反應時間,而不是詞義真正影響到和不和諧的判斷?<br> | ||
+ | Ans:當初實驗設計是要讓受試者反應色塊和字義,放入相關詞是要看它有沒有被受干擾。<br> | ||
+ | |||
+ | 7. 請問會不會有「疲勞效果」的產生,而發現受試者在後半段的錯誤率較高?<br> | ||
+ | Ans:但是實驗前有告訴受試者,在實驗過程若感到疲勞可以休息後再繼續,所以應該可以排除掉這項可能。<br> | ||
+ | |||
+ | 8. 題目每一題答完就會給一個回饋,請問回饋的方式是?<br> | ||
+ | Ans:只有練習題的時候有回饋,後面正式施測實不給回饋。<br> | ||
+ | |||
+ | 9. 詞色和詞義不和諧這部分,如果把它方在同一個page的話,這樣就能同時間接受到刺激,因為不知道接受刺激的時間點是否有影響?<br> | ||
+ | Ans:這樣受試者可能不會記得色塊的顏色,而是以後面是否相同來比較。<br> | ||
+ | |||
+ | 10. 假設海洋是藍色,色塊是藍色,要按是。但原本色塊和字義就已經會干擾,現在還採用相關詞,思考歷程要多一個步驟想說海洋是藍色,反應時間一定會比較長,那作這個的實驗目的為何?<br> | ||
+ | Ans:我們是用色塊和詞義去作連結,Stroop是色塊和字的顏色。我們在作Stroop的實驗的時候發現,最後都會去看旁邊的角,不會直接去看紅那個字,就不會受字的干擾,所以才想說利用相關詞確定受試者有接受到詞義的影響。<br> | ||
+ | |||
+ | 11. 之前作Stroop的時候,剛開始會受到字的意思的干擾,但最後會學習像是看邊邊的角去避免干擾,同樣的在這次實驗中,是否有在實驗之後訪問受試者到後來有沒有學習到一些short cut去判斷?<br> | ||
+ | Ans:這是受試者個人的差異,實驗很難去避免。當初試驗前組內操作時的確有發現捷徑,但是我們認為是操作過很多次才會發生。另外,會選用相關詞是為了避免在Stroop中只看邊邊的角或其他方式的捷徑。<br> | ||
+ | |||
+ | 12. 實驗共分四組,每組24題,在皆和諧的部分最多只有8個配對,那是不是會重複3次。那會不會是因為其他的組別每個配對都只出現1次,在皆和諧的狀況之下會出現三次,會不會是重複出現導致反應時間和錯誤率都比較少?<br> | ||
+ | Ans:其他組別也會出現重複的狀況,因為四組96題我們是全部隨機出現,所以做到重複會已經過了很多題。<br> | ||
+ | |||
+ | 13. 為什麼要選用相關詞而不是選用像Stroop一樣的字的顏色,因為像是「紅」,這是一個自動化的歷程,而如果用「海洋」還要多一個回想的歷程,但並沒有辦法控制每個人的連結強度和回想速度是一樣的,這樣是否會導致更大的誤差?<br> | ||
+ | Ans:會選用相關詞是為了避免在Stroop中所會使用的捷徑,雖然無法完全避免個別差異造成的連結強度不同,但已經盡可能發問卷去採用最好的相關詞。<br> | ||
+ | |||
+ | *關於相關詞的編製 | ||
+ | |||
+ | 1. 因為每個人對詞義顏色的看法不一樣,你怎麼知道前測的那批受試者的看法可以代表之後施測受試者的看法?<br> | ||
+ | Ans:我們前測的時候已經盡可能排除掉模稜兩可的詞彙,我們所選用的相關詞彙選用連結性較強的。<br> | ||
+ | |||
+ | 2. 在聯想顏色的時候,像是陽光不能直接聯想到黃色,要探討反應時間它的相關字本身就不太好聯想到顏色,所以最後到底是顏色的影響,或是各個相關詞聯想時間的不同所影響並不能確定?<br> | ||
+ | Ans:有考慮過這個問題,但這是無法避免的,已經發過問卷盡可能挑選最好的詞。<br> | ||
+ | |||
+ | 3. 因為相關詞的聯想速度並不同,有沒有想說去查詞頻?挑選詞頻較接近的?<br> | ||
+ | Ans:最初有想要找詞頻但發現有困難,詞頻中找不到那些字,我們有將模糊的部分排除掉,再選擇出現頻率比較差不多的。<br> | ||
+ | |||
+ | |||
+ | *實驗建議 | ||
+ | 1. 應競爭理論中,在辨識物品歷程的部分,是比較平行的,反應的歷程較快;反應的階段是序列的,因為在這裡產生衝突,所以反應會比較慢。有沒有可能是受試要同時反應詞義不和諧和詞色不和諧的部分,它的歷程不太一樣而導致錯誤率較高,而不是它看起來比較不一樣?<br> | ||
+ | Ans:分析實驗結果也找了很多理論佐證,但我們並不知道哪一個是最好的,我們盡可能把我們想到認為可能的因素列出,謝謝你的建議。<br> | ||
+ | |||
+ | 2. 在前測發問卷的時候是採用「紅色血液、春聯」,但是施測的時候卻是採用「血液紅色」,若p則q但是不等於若q則p(p→q=~q→~p),所以在前測的部分應該是要以物件來讓受試者判斷什麼顏色,這樣才與之後試測相符。<br> | ||
<br> | <br> | ||
+ | <br> | ||
+ | |||
+ | ====【老師回饋部分】==== | ||
+ | #這實驗要解釋相當困難,不過歷程的部分的確是要考慮到,這當中可能還有一些問題,在他們的分組當中,皆和諧和詞色不和諧是按Yes,詞義不和諧和皆不和諧是按No,這當中很可能會產生差異。 | ||
+ | #還要考慮到它的傾向上,反應時間和錯誤率並不一致,反應時間皆和諧是最短,其他三組是一樣;但是在錯誤率皆和諧和皆不和諧它的錯誤率比其他兩組來的低。這種情況下若想要以一個歷程去解釋這四組的差異,一定會碰到問題。這當中可能不止一個歷程去影響到實驗,這是實驗組還要再釐清的部分。 | ||
+ | #基本資料要在報告時準備,放在旁邊被問的時候才能回答較具體的答案。 | ||
== 我愛腫子 == | == 我愛腫子 == | ||
第413行: | 第479行: | ||
====【同學提問部分】==== | ====【同學提問部分】==== | ||
+ | *實驗相關問題 | ||
+ | 1. 這裡的「人為事件」是指短時間無法用個人的經驗解釋兩物體間的關係,那既然無法用個人經驗去解釋兩物體間關係,那這裡的因果關係是什麼意思?<br> | ||
+ | Ans:因為操弄得時間較短暫,實驗室想探討在這兩種情況下,我們比較容易得知受試者是否比較容易形成因果知覺,實驗發現在人為事件是較不容易形成因果知覺。<br> | ||
- | + | 2. 受試者有無可能因為視覺疲勞現象而對實驗的結果產生影響?<br> | |
+ | Ans:雖然影片的長度常約10min,但在指導語部分有確定受試者受否看的清楚,在實際作題只有3~4分鐘,所以應該不會有視覺疲勞效果。<br> | ||
- | + | 3. 在文獻中有提到練習效果對因果知覺有影響,那麼在這次的實驗中有發現嗎?<br> | |
- | + | Ans:因為這次的實驗是要探討明度配對對因果知覺造成的影響,所以在練習效果這方面並沒有去探討。<br> | |
- | + | 4. 文獻是採用七點量表,而實驗為什麼要採用五點量表?<br> | |
- | + | Ans:七點量表的間隔太多,受試者在短時間內可能沒有辦法很精確的判斷說他到底要填哪一個,所以採用五點量表讓受試者比較好判斷。<br> | |
- | + | 5. 根據練習效果對因果知覺是有用的,每個人的題目是一樣的,到最後題目不會有練習效果嗎?<br> | |
- | + | Ans:在文獻中提到自然事件妳作的越多次的話,練習效果就會降低;在人為事件中,作的越多次的話,練習效果就會提高。因為我們沒有連續的自然事件或連續的人為事件,而且並沒有操弄練習的次數,所以應該不會有練習效果的影響。<br> | |
- | + | 6. 請問明度配對達顯著的意思是?<br> | |
- | + | Ans:顯著的意思是指這樣的操弄樣下對因果知覺是有影響的,更容易或更不容易形成因果知覺。<br> | |
- | + | 7. 實驗結果的地方,自然事件和人為事件的平均數看起來都只有差一點點,但是兩個統計跑出來均有達到顯著,有沒有可能是原本是七點量表,後來改成五點量表所造成?<br> | |
- | + | Ans:因為五點量表有可能因為不夠細緻的原因,導致兩事件的明度配對皆達到顯著,之後會再作更細緻的量表探討,看看是否有差別。<br> | |
- | + | 8. 在自然或人為事件中,碰撞的過程是採用正方形,請問為什麼不採用圓形呢?圓形感覺似乎比較有運動的感覺。<br> | |
- | + | Ans:選用方塊是因為引用張建妤的文獻,在文獻中使用方塊所以我們也跟著使用方塊。<br> | |
- | + | 9. 人為事件的配對有六個,去掉黑黑、灰灰和白白,自然事件是不是也應該排除掉這三種因素?<br> | |
- | + | Ans:因為自然事件和人為事件的運動過程是不一樣的,自然事件是A方塊撞倒B方塊,然後B方塊出去;但是人為事件是A方塊穿越B方塊出去,所以自然事件沒有任何有關於辨色的效果,但是人為事件必須要有辨色的效果,因為黑黑、灰灰、白白明度尚沒有差異,所以在人為事件中並不採用。<br> | |
- | + | 10. 在實驗的結果是明度配對未達顯著,請問什麼會有這樣的結果呢?<br> | |
- | + | Ans:事件的影響太大,在自然、人為事件中明度的配對是達到顯著,但是事件的影響遠大於明度的影響。<br> | |
- | + | 11. 既然題目要探討的是明度配對的話,為什麼不直接選用自然事件或人為事件就好,這樣受試者對明度的反應可能會比較好。<br> | |
- | + | Ans:因為實驗大多是由張建妤的實驗延續下來,只是想單純加入明度配對,並沒有好好去思考實驗的過程,在未來的設計可能要讓實驗在單純一點。<br> | |
- | + | 12. 影片結束之後有三秒的作答時間,請問這三秒是怎麼來的,會不會受試者還來不及反應就已經跳到下一題,看下一題的時候還受到上一題的影響?<br> | |
- | + | Ans:三秒並沒有找到相關文獻,所以是在前測的時候觀察受試者的作答時間得出來的結果。<br> | |
- | + | <br> | |
- | + | *樣本刪除部分 | |
+ | 1. 刪除樣本是針對人為事件來刪除的嗎?<br> | ||
+ | Ans:自然事件和人為事件都有,就是如果相同的題目,但受試者兩次反應都不一樣,就會把它刪除。<br> | ||
- | + | 2. 剛剛有提到平均數是2點多,小於3就會把它刪除,這裡的平均數是指五點量表嗎?<br> | |
- | + | Ans:是指前後不一致的題數,而不是五點量表。<br> | |
- | + | 3. 為什麼要把前後不一致的樣本都刪除,而不把它列入都可以採用的數據?<br> | |
- | + | Ans:因為我們想確定受試者的穩定度,若受試者很多題都前後不一致的話,就代表受試者的穩定性不高。<br> | |
- | + | 4. 實驗樣本是59位高雄醫學大學的學生,有效樣本是38人,是否有去討論為什麼刪掉20多位的原因,是因為實驗的過程中有問題,還是刪題的標準有問題,是否有再去討論?<br> | |
+ | Ans:因為受試者平均反應不一致是2點多,所以超過3題我們認為穩定性不高所以把它刪除,在討論部分也提到在日後實驗受試者實驗後,會詢問受試者的作答狀況來探討原因。<br> | ||
- | + | 5. 實驗的樣本刪掉將近一半會不會太多了?<br> | |
- | + | Ans:因為前測跑出來結果只需要24份樣本,所以可以作這樣的篩選。<br> | |
- | + | 6. 在後面自然差異或人為差異平均都很小,會不會是在前面篩選樣本就已經刪掉約四成的樣本,把那些差異值都刪除掉了,有沒有探討過為什麼那些差異值前後選擇會不一樣呢?<br> | |
- | + | Ans:這部分可能是我們沒有考慮到的,之後實驗會再詢問受試者的思考歷程,再決定是否篩選樣本。<br> | |
- | + | 7. 實驗最後的結果可能還是受刪題所影響,請問在實驗後有無去跑未刪題59位的數據?<br> | |
- | + | Ans:沒有,之後會再跑統計看看。<br> | |
+ | 8. 因為刪題是以平均數高一點下去刪,那們不管樣本數為何,最後一定會刪掉將近一半左右,是否需要找相關文獻來佐證刪題的標準。<br> | ||
+ | Ans:這是實驗沒有考慮好的地方,之後會再找相關文獻佐證。<br> | ||
- | *實驗建議 | ||
- | 1. 應競爭理論中,在辨識物品歷程的部分,是比較平行的,反應的歷程較快;反應的階段是序列的,因為在這裡產生衝突,所以反應會比較慢。有沒有可能是受試要同時反應詞義不和諧和詞色不和諧的部分,它的歷程不太一樣而導致錯誤率較高,而不是它看起來比較不一樣?<br> | ||
- | Ans:分析實驗結果也找了很多理論佐證,但我們並不知道哪一個是最好的,我們盡可能把我們想到認為可能的因素列出,謝謝你的建議。<br> | ||
- | |||
- | 2. 在前測發問卷的時候是採用「紅色血液、春聯」,但是施測的時候卻是採用「血液紅色」,若p則q但是不等於若q則p(p→q=~q→~p),所以在前測的部分應該是要以物件來讓受試者判斷什麼顏色,這樣才與之後試測相符。<br> | ||
- | <br> | ||
- | <br> | ||
====【老師回饋部分】==== | ====【老師回饋部分】==== | ||
+ | #統計應該再跑一次,應該在去找統計老師一次,尤其樣本刪成這個樣子真的是有問題。 | ||
+ | #刪樣本必須要小心,這樣人為的操弄可能影響到數據本來的自然分佈,得到的可能只是你要的,而不是真正存在的情形。 | ||
+ | #統計重跑一遍,敘述可能會不一樣,可能需要重新修改。 | ||
==(請填組名)== | ==(請填組名)== | ||
第535行: | 第606行: | ||
=== B班實況: === | === B班實況: === | ||
+ | ====【同學提問部分】==== | ||
+ | 1. 請圖片出現兩秒是怎麼樣確定的?<br> | ||
+ | Ans:是根據文獻決定的。<br> | ||
- | <br> | + | 2. 改變物件的位置,有時候是發生在正中間,有時候是發生在邊邊,這樣是否會影響到受試者的正確率?<br> |
+ | Ans:物件的位置改變,都是控制在比較偏中間的框框中,且同物件改變的位置,在下一場景會出現在它的相對位置,而不會突然跳到旁邊。<br> | ||
+ | |||
+ | 3. 在文獻中提到,「當視覺記憶的數量大過某個極限(通常此量大約只有4項),則視覺記憶就會過載(overloading)」,但是在實驗的場景中,每個場景出現物件都不止四個,會不會導致受試者過載的現象而無法記憶?<br> | ||
+ | Ans:在另外一篇文獻有提到,盲視做出來較穩定的效果是10~14個物件,在前測的時候受試者有反應物件太多而記不得,所以實驗已調整到最少物件達到最穩定效果,就是每個場景都是10個物件。<br> | ||
+ | |||
+ | 4. 每個改變物件的刺激強度不同,如何去控制改變物件的強度?像是物件中的杯子,改變的只有形狀,強度感覺不大,不管是同類別或不同類別強度一定不同,要如何去控制?<br> | ||
+ | Ans:實驗中採用和原本物件形狀差異不大,且在畫面比例也是差不多,不會有變的過大或過小的情況,顏色方面沒有特別控制,但也不會選用反差過大的。<br | ||
+ | > | ||
+ | 5. 每個受試者只給予三題施測,但題數過少很容易受到例如物件位置、顏色等干擾,很多干擾沒辦法平衡掉,而達到統計上的顯著?<br> | ||
+ | Ans:因為實驗的場景太少,如果在同一個場景更換不同物件重複給受試者施測,受試者可能會記憶場景中的東西,如果要增加題數,日後可能要增加場景的組合。<br> | ||
+ | |||
+ | 6. 實驗中第二張都是出現不和諧,那麼在下結論的時候,是不是不能確定如果不和諧辨識率較高,而只是如果在第二張照片出現不和諧東西辨識率會比較高,而不是說兩張照片的和諧度有差異時辨識率會較高。<br> | ||
+ | Ans:實驗是物件變換到和諧與變換到不和諧去比較,而不是同一組兩張去作比較。<br> | ||
+ | |||
+ | 7. 請問有無控制受試者與螢幕的距離和角度?因為之前有說物件改變的位置大都控制在中間,那麼很可能隨著受試者作的位置不同而有所差異。<br> | ||
+ | Ans:受試者都是坐在電腦螢幕前施測,沒有辦法控制受試者到底離電腦多遠,是以受試者認為可以看到最清楚的位置來調整。<br> | ||
+ | |||
+ | 8. 要在兩秒之中發現改變的物件其實時間還滿短的,而且物件的連結強度其實並不相同,請問是如何決定要改變的物件?<br> | ||
+ | Ans:在文獻中場景和物件有一個表,我們是從其中的20個挑選10個,雖然每個物件的強度不相同,但在每個場景中作了12個不同物件配對,希望能平衡掉不同物件強度的因素,而每個物件改變也盡量挑選大小、比例相符的物件。<br> | ||
+ | |||
+ | 9. 在沒有改變的部分,它的答題正確率是最高,可是信心程度是較低,會不會是受試者只要忘記或發覺不出物件改變,就會都判斷成沒有改變,而導致信心程度較低?<br> | ||
+ | Ans:因為實驗要討論的是會不會有變盲效果的出現,變盲效果是說看到圖片覺得自己有看到,其實是沒有看到的,無法去察覺場景的改變。在實驗結果中,每有改變的選擇是最多人的,受試者可能是察覺到沒有改變,或是看不到而勾選沒有改變,所以勾選無改變之後覺得沒有信心,而導致信心程度降低,所以就是因為出現變盲效果的現象,才會導致這種情況發生。<br> | ||
+ | |||
+ | 10. 在文獻的第二項有提到「當視覺記憶的數量大過某個極限量(通常此量大約只有4項),則視覺記憶就會過載(overloading)」,那請問實驗中有控制每個圖的數量嗎?<br> | ||
+ | Ans:根據另外一篇文獻10~14個物件做出的實驗效果是最為穩定,所以這次實驗控制在每個場景都是10個物件。<br> | ||
+ | |||
+ | 11. 在有桌子、花瓶那個場景中,有兩個改變的東西,會不會有受試者回答是胡椒鹽罐的變化?<br> | ||
+ | Ans:這是實驗沒有控制好,不過受試者都沒有注意到胡椒鹽罐的變換。<br> | ||
+ | |||
+ | 12. 在和諧和不和諧場景在統計上比較有非常顯著的差異,但在一般比較上不和諧的物件本來就是比較容易被注意到,所以在定義和諧和不和諧上是不是應該更清楚?<br> | ||
+ | Ans:和諧度是這次實驗與文獻中不同的操作地方,實驗的確有需要進一步定義好一點的和諧度概念,但是初步的實驗我們是採用若和諧度稍微有一點改變,那麼它的變盲效果有沒有影響,變盲效果有沒有存在,所以重點還是再探討變盲的情況。<br> | ||
+ | |||
+ | 13. 有時候再看第二張圖片的時候,已經忘記第一張圖片是什麼,像有一個場景的第二章圖片,我是覺得滑鼠擺放在那個位置很奇怪,所以可能會猜測滑鼠是改變的東西,那這樣就不是實驗所想要的效果。那如果能把第一張與第二張圖片調換的話,不和諧的情況先出現,這樣是否比較能出現實驗所想測到的效果?<br> | ||
+ | Ans:實驗的目的並不是要受試者回憶第一張圖片看到什麼,受試者看到第一張圖片是在非常快(2s)的時間完成,所以主要是看受試者有沒有發現圖片中有不一樣的地方出現。<br> | ||
+ | |||
+ | 14. 因為在實驗中不論自信程度高低都採用其數據,但是若受試者沒有發現改變,就是用猜的,所以信心程度偏低,而實驗有採納其數據,會不會因此導致正確率有顯著的差異?<br> | ||
+ | Ans:剛開始是沒有加入信心程度,只是單純想要知道有沒有改變;之後之所以會加入信心程度是想要瞭解受試者在答題的肯定程度有多少。受試者如果沒有察覺到改變這就是變盲效果;但如果說是環境沒有改變,受試者沒有察覺到改變,又確定環境沒有改變,這有事另一種效果,不是這次實驗討論的範圍。<br> | ||
+ | |||
+ | 15. 受試者若看到有改變必須寫出看到的物品是什麼,但是若是知道圖片有改變,但是卻不知到改變的東西是什麼,例如看不出圖片上的東西是滑鼠,那麼該怎麼處理?<br> | ||
+ | Ans:受試者不一定要寫出確切的東西名稱,也可寫出改變的區塊大致的位置,最後實驗結束後也會和受試者口頭在確定一次。<br> | ||
+ | |||
+ | 16. 若受試者很多提的信心程度都非常低的話,還納入數據中,會不會造成實驗結果有非常大的差距?<br> | ||
+ | Ans:實驗沒有刪除的原因是假如都是勾選信心程度1分,可能是受試者對答案較為保守,換個角度想受試者的作答基準還滿一致的。<br> | ||
+ | |||
+ | 17. 實驗中控制每個場景都是10個物件,但是很多物件可以combine一起看,或是分開看,那麼是如何區分10個物件的?<br> | ||
+ | Ans:實驗定義10個都是從文獻中找出的,當然受試者也可能把杯子看做三個部分,這是個人的差異,並沒有辦法知道其歷程的變化。<br> | ||
+ | |||
+ | 18. 在一開始報告時的示範圖片,飛機是以消失作為改變,若是以物品消失作為改變,會不會比較單純,也能突顯和諧與不和諧,那為什麼後來會想採用置換物品來作為改變?<br> | ||
+ | Ans:因為實驗想探討的是和不和諧,主要是看物件和背景和不和諧,所以會用形狀、比例相近的東西置換,若是採用消失的話,受試者很可能只是單純察覺到東西好像空了,而不是和不和諧。<br> | ||
+ | |||
+ | ====【老師回饋部分】==== | ||
+ | #有些東西是沒有辦法控制到非常精細,譬如物品的出現頻率應該是沒有這樣的統計,因為這樣的統計沒有價值,這樣的物品出現頻率找不到,找不到還要問實驗組為什麼沒有作,這就有點強人所難。 | ||
+ | #和諧和不和諧這種東西很主觀,可能需要更清楚的定義,但這也難以作數量化的定義。 | ||
+ | #不能因為在台下沒有看到而推測大家都沒有看到,沒有看到是因為很多原因造成當時沒有看到,但數據上可以發現有人看到有人看不到,我們發現在不同的條件下,看的到和看不到的比例不同,作實驗的目的就是在這裡。 | ||
+ | #沒有特殊的原因,絕對不要剔除受試者,因為有時候可能是很多原因造成,這也是應該把它放入統計。 | ||
== I'm 殺組 == | == I'm 殺組 == | ||
第644行: | 第773行: | ||
=== A班實況: === | === A班實況: === | ||
+ | ====【同學提問部分】==== | ||
+ | 1. 文章的性質為何?例如是否均為故事性性質的內容或者有其他的比例分配?<br> | ||
+ | Ans:基本上無限制,包含故事性、時事等均包含,但挑選時為隨機挑選。 | ||
- | <br> | + | 2. 對於延遲這個詞的操作型定義為?<br> |
+ | Ans:參考可能比較有公信力的資料,如 wikipedia 及統合各文獻的定義。 | ||
+ | |||
+ | 3. 年齡對於閱讀與網路使用上有差異,請問實驗中受試者的年齡層分佈,或者主要的受試者年齡層為?<br> | ||
+ | Ans:並無精確的限制,大多以大學生範圍為主。 | ||
+ | |||
+ | 4. 有無可能有信別差異,例如可能在火星文的使用上以某性別較為廣泛 ... 等?<br> | ||
+ | Ans:並無相關文獻可參考,故無法推斷,在本研究中也並非主題討論之內容。 | ||
+ | |||
+ | 5. 文章的數量選擇以六篇文章的原因?<br> | ||
+ | Ans:因為剛好操弄變項的數量為三,取其倍數而定。 | ||
+ | |||
+ | 6. 實驗中要求受試者盡快唸完文章的原因?<br> | ||
+ | Ans:避免受試者在閱讀歷程上有更多的變項。 | ||
+ | |||
+ | 7. 實驗採用受試者間設計,使得每個人念的速度不同而可能影響結果,為何不使用受試者內設計之實驗?<br> | ||
+ | Ans:避免產生更多的混淆變項。 | ||
+ | |||
+ | 8. 所操弄的文字其選擇的主要依據、方式?<br> | ||
+ | Ans:以主觀決定為主,盡量選擇可能的高頻字,且因文中能用的替代字並不多,所以在選擇文字操弄的對象大多以主觀決定。 | ||
+ | |||
+ | 9. 在文獻中,對於相似這個詞的定義?<br> | ||
+ | Ans:主要有兩個標準,字頻與筆畫數。 | ||
+ | |||
+ | 10. 事先使用網路的習慣與方式是否可能造成其中一混淆變項?<br> | ||
+ | Ans:此主要為個人差異,且因採用隨機分派實驗可平衡此變項。 | ||
+ | |||
+ | 11. 所替代的字詞,詞性不同是否可能會造成影響?<br> | ||
+ | Ans:並無操弄詞性這麼變項,而替代字詞主要是以常見的高頻字為主,且在自然的情況下,火星文出現的情況,所以並無刻意操弄替代之字詞。 | ||
+ | |||
+ | 12. 實驗的有效樣本數?<br> | ||
+ | Ans:約剩一半左右,可能是因為與是非題的設計不良有關,這部分可再改進。 | ||
+ | |||
+ | ====【老師回饋部分】==== | ||
+ | |||
+ | 1. 雖然每組都有跟老師討論的情況才進行報告,但是最後的執行者仍然是各組的同學而並非老師,在對問題的回應時,請不要將實驗的決策者推到老師身上。 | ||
+ | |||
+ | 2. 再三的強調,課程的進行是以研討會的方式為主,不是辯論賽或者出庭辯護,問問題與回答問題的同學態度上可以不必太過尖銳。 | ||
+ | |||
+ | 3. 雖然在實驗中的操弄可能有不太恰當的地方,但是因為在最後的結果與討論的比較中並非研究的主題,還算可以接受,但往後如果有機會再做研究,仍需特別注意這些部分。 | ||
=== B班實況: === | === B班實況: === | ||
- | ==== | + | ====【同學提問部分】==== |
1. 每篇文章替代的字都採用一樣的字嗎?是怎麼決定採用這些字的?<br> | 1. 每篇文章替代的字都採用一樣的字嗎?是怎麼決定採用這些字的?<br> | ||
Ans:每一篇替代字都不一樣,這些字的採用都是我們認為是高頻的字,因為沒有高頻字表可以對照,我們選用六種版本都會作四種的替代,不是每篇都採用同樣的字,會視情況以適當的字取代。<br> | Ans:每一篇替代字都不一樣,這些字的採用都是我們認為是高頻的字,因為沒有高頻字表可以對照,我們選用六種版本都會作四種的替代,不是每篇都採用同樣的字,會視情況以適當的字取代。<br> | ||
第695行: | 第866行: | ||
=== A班實況: === | === A班實況: === | ||
- | <br> | + | ====【同學提問部分】==== |
+ | |||
+ | 1. 圖優效果是普遍存在的,請問有沒有提到性別差異可能對於實驗有影響?<br> | ||
+ | Ans:這部分中,文獻並沒有特別提到,而由於非本次實驗目的,所以也並沒有做特別控制。 | ||
+ | |||
+ | 2. 圖優效果不顯著,可能線索是來自於字型而非字義,可能有其探討的空間?<br> | ||
+ | Ans:之前心實實有做過關於詞優效應的實驗,我們覺得其實人類在看到字詞的時候,應會先對字義做反應,比較不會對字型做反應,所以應該是不會有這樣的反應。 | ||
+ | |||
+ | 3. 會不會有一些受試者可能有受過類似的記憶訓練,所以可能造成實驗中的偏誤?<br> | ||
+ | Ans:受試者基本上是隨機挑選的,應可避免此類的受試者差異的問題。 | ||
+ | |||
+ | 4. 在自由回憶的時候會不會有可能強化了文字組的記憶,因此造成了這樣的結果?<br> | ||
+ | Ans:有可能,這部分我們可以再參考作討論。 | ||
+ | |||
+ | 5. 在指示三秒的時間中,所呈現的記憶指示與遺忘指示的比例是否有特別控制?<br> | ||
+ | Ans:採取一比一的比例,隨機排列。 | ||
+ | |||
+ | 6. 在實驗過程中,自由回憶這個部份的設計目的?<br> | ||
+ | Ans:我們的實驗程序基本上是遵循指示遺忘的實驗典範的設計方式,並沒有做其餘的考量。 | ||
+ | |||
+ | 7. 因為你們的實驗是做記憶以及與回憶有關的研究,會不會有可能是文字與圖片各別記憶廣度的限制而造成組間比較不顯著的可能?<br> | ||
+ | Ans:記憶廣度的部分為七加減二,這部分可能不會有影響。 | ||
+ | |||
+ | 8. 在妳們的實驗程序中設計了自由回憶的步驟以及再認測驗的步驟,這兩個都有回憶的動作與效果,會不會有可能造成受試者最後的辨認作業有回憶或記憶混淆的情況出現?<br> | ||
+ | Ans:最後的再認測驗只是辨認動作而已,應該不會造成混淆的情況。且最後會把自由回憶作業的作答紙收回,應該不會造成受試者因為前面的作業而造成混淆。 | ||
+ | |||
+ | 9. 妳們的研究重點應該是在指示遺忘的部分?與自由回憶這個動作並較無關?其實應該可以刪除這部分的作業或許有可能避免一些潛在的混淆變項?<br> | ||
+ | Ans:因為需要自由回憶的動作去確認受試者是否有記憶以及遵守指示遺忘的動作,所以自由回憶的部分主要是檢驗受試者的反應情況。 | ||
+ | |||
+ | 10. 記憶呈現方式有圖片與文字,可是受試者在回憶的時候主要還是以文字的方式再回憶與記憶,會不會因為這樣造成圖優效果並未顯著的原因?<br> | ||
+ | Ans:這部分就是我們主要想要在圖優效果這部分測試的重點。 | ||
+ | |||
+ | 11. 在妳們最後討論的文獻部分,該論文是在研究數學學習與數學問題的解決上,好像與妳們的記憶研究不太相關?用這個文獻來解釋歷程的不相同好像不太適當?<br> | ||
+ | Ans:這篇文獻我們主要參考的部分是該論文所提出的一些相關觀點好像可以解釋關於我們研究中圖片與文字中記憶時的歷程衝突。 | ||
+ | |||
+ | 12. 受試者在最後作答時會提供自由回憶的部分答案以及再認測驗的答案,那如果兩個答案中有衝突或者不相同的情況出現時,會影響到最後的統計結果嗎?<br> | ||
+ | Ans:我們自由回憶的部分是讓受試者自由作答,且最後統計時是分開計算,所以並不會影響到最後的統計與解釋的結果。 | ||
+ | |||
+ | |||
+ | ====【老師回饋部分】==== | ||
+ | |||
+ | 1. 典範本身可能是有一些特殊性,可是因為多了圖片的操弄,如果沿用過去的典範可能會造成問題,那本來可能會有圖優的效果卻消失。 | ||
+ | |||
+ | 2. 如果實驗的順序對於某些因素來說可能會有影響,自由回憶的部分由認知的部分來解釋本身就是有點接近語意回憶的部分,可能就會造成結果會蠻符合這樣的想法。就有可能會因為這樣造成順序效果。因為在自由回憶的這部分較有利於文字回憶的部分。 | ||
+ | |||
+ | 3. 二年級在這邊問問題的時候常常會問到與心測相關的問題,可是常常實驗中是較與認知相關的部分,所以造成問問題的時候會較不容易問到重點或者核心的問題。可能在問問題的時候會較容易在用詞上較不容易有理想的表現,也有可能在背後的認知歷程中較相關的部分卻沒有辦法探討到。 | ||
+ | |||
+ | 4. 經過了一個學期這樣的討論過程,希望大家最起碼要懂得會問問題。其實我很希望大家能夠盡量主動問問題,大家才會知道說該怎麼問問題會比較好,就如同心測實習的過程中常常要實地做測驗會比較好,當然在過程中會出現很多問題,不過還是應該要透過這樣的經驗大家才會有學習到或者進步。 | ||
=== B班實況: === | === B班實況: === | ||
+ | ====【同學提問部分】==== | ||
+ | 1. 為什麼在實驗後面先作了自由回憶,再作在認測驗,為什麼不是分開來作,而是連貫去作,這兩者之間會不會有干擾?<br> | ||
+ | Ans:因為實驗的獨變項是不同的呈現方式(圖、字)與指示線索(記、忘),若再將自由回憶與在認測驗拆開來作,實驗設計會太複雜。而且若先作自由回憶,在作再認測驗,再任測驗是將所有呈現過的刺激列出來,若先作再認測驗一定會影響到自由回憶,所以才將再認測驗放在前面。當然這當中的干擾還是會有的,但已經盡量將干擾降低。<br> | ||
- | <br> | + | 2. 刻意的讓受試者記或忘,對受試者來說是一件很困難的事情,會不會對實驗造成影響?<br> |
+ | Ans:從實驗結束統計的結果,發現是不會有影響的。<br> | ||
+ | |||
+ | 3. 為什麼要作自由回憶和在認測驗兩個,不只選擇一個來作就好?<br> | ||
+ | Ans:作自由回憶的部分受試者不管記或忘都會寫出來,最主要是要看受試者遺忘的部分,作再認測驗是難度較低,可以和自由回憶作比較作為參照。<br> | ||
+ | |||
+ | 4. 在最後有作一個再認測驗,不管記或忘都要回答,會不會有受試者猜想到主試的目的,雖然指導語告訴受試者要忘,但受試者仍然把它記起來?<br> | ||
+ | Ans:是有這個可能,但是這是屬於個人的差異部分,在統計上應該會平衡掉。<br> | ||
+ | |||
+ | 5. 若在自由回憶的部分,受試者用不同的方式指涉相同的東西,例如機車和車子,要怎麼計算?<br> | ||
+ | Ans:在前測的時候已經盡可能排除掉爭議性的東西,但不可避免的多少還是會有這樣的情形發生,基本上受試者只要是指涉相同的東西都會算他對。<br> | ||
+ | |||
+ | 6. 如果一開始刺激是以圖片刺激,在再認的時候也以圖片的時候回答,是不是就能排除掉問題討論中所提到的歷程複雜化,而有圖優效果的出現?<br> | ||
+ | Ans:有可能,但是在這次實驗中,圖片和文字的統計結果比對,雖然沒有達顯著,但還是可以看出圖片的效果是高於文字的。<br> | ||
+ | |||
+ | 7. 關於指示遺忘有項目程序法和列表程序法兩種,為什麼會採用項目程序法?<br> | ||
+ | Ans:會選擇項目程序法有幾個考量,第一個是項目程序法是比較後期的理論,而且在列表程序上,我們並沒有辦法做到刺激隨機的方式,而且呈現一整串之後才告訴受試者記或忘,或許前面的部分受試者已經忘記,或是中間受到什麼干擾我們並不能控制,所以最後才採用項目程序法這個方式。<br> | ||
+ | |||
+ | 8. 之前作班達測驗,五張圖片就給了20分鐘,雖然是要畫圖,那想要請問在實驗中的五分鐘是怎麼定義出來的,五分鐘要受試者回憶20題不知道時間夠不夠?<br> | ||
+ | Ans:五分鐘的限制主要是參考文獻中自由回憶的時間,那在實驗的過程中發現到,其實在兩三分鐘左右的時間,受試者大概已經回憶完畢,想不出來,或者是主動說想不到了。<br> | ||
+ | |||
+ | 9. 因為性別對於記憶的方式是不太相同的,請問在性別在指示遺忘以不同刺激的呈現方式上有無不同?<br> | ||
+ | Ans:不可否認性別可能會影響到實驗,但在這次的實驗中不是討論的範圍,在所蒐集的文獻中也沒加入性別這個變項。<br> | ||
+ | |||
+ | 10. 自由回憶和再認測驗中的圖優效果不達顯著,會不會是因為題數只有20題,所以雖然有差別,但是差別並不是這麼明顯,若是提高題數則圖優效果就可能出現,不知道在文獻中有文提到關於測驗題數大概是多少?<br> | ||
+ | Ans:題數部分也是參照指示遺忘的文獻,文獻中並無提到是否題數增多就會讓圖優效果更明顯,因為圖優效果是後來加入指示遺忘的部分,若再增加題數,可能會受到記憶廣度的影響而無法記憶。<br> | ||
+ | |||
+ | 11. 再認分數為什麼會採用正確再認率-錯誤再認率,再認分數它的定義是什麼?<br> | ||
+ | Ans:減掉錯誤再認率是避免沒有出現但受試者卻勾選的現象。<br> | ||
+ | |||
+ | 12. 請問指示遺忘在兩組間都未達顯著是怎麼算出來的?<br> | ||
+ | Ans:這個部分是用組間比較圖和字這兩組的自由回憶正確率去作比對。這裡的正確率是採用記的正確率加錯的正確率。<br> | ||
+ | |||
+ | 13. 在自由回憶的部分,不論記或忘寫出來都有採計,那為什麼沒有要讓受試者在後面加計把要記或是要忘也寫出來?<br> | ||
+ | Ans:因為在統計上面並沒有另外分類受試者記多少,忘多少。而且受指示遺忘的影響,基本上忘的部分受試者不會記得,但是還是會有影響,但受試者不會特別去記記或忘。<br> | ||
+ | |||
+ | ====【老師回饋部分】==== | ||
+ | #期末考以及期末報告大家請用心準備,尤其是自己覺得發言次數不夠的人。 | ||
+ | #希望同學能透過舉手發問來學習到如何發問是比較好的,在日後也能找到機會學習。 | ||
+ | #自由回憶與再認測驗的順序上的確有爭議性,因為先作自由回憶可能是跟文字比較接近的,先卡了一個和文字比較接近的,在去作再認,前面對文字比較有利,所以在再認測驗本來應該有的圖優效果就會不見。 | ||
+ | #在計算方面圖片和文字合在一起算,再認也是合在一起算,或許損失了一些資訊,可以再重新計算,統計方式不是用t-test,而試用其他的統計方式,或許會有其它的效果。 | ||
+ | #其他組也是一樣,統計計算方式或是解釋方式要更改的,請在書面呈現。 |
當前修訂版本
以下各組名單依上台前後順序排列,上課實況記錄A班由(zzadjin)負責,B班由(sinki)負責。
目錄 |
[編輯] 刻苦耐勞組
2008年3月21日
[編輯] A班實況:
[編輯] 【同學提問部分】
- 實驗相關:
1. 巴南效應評分解釋的來源?
Ans:由仿間心測與星座特質等類似常用語構成十八個不同的解釋。
2. 整體實驗時間長短?
Ans:第一階段約三十分鐘,第二階段在一星期左右完成結果。
3. 兩種不同結果的敘述正負向比例是否影響了巴南解釋大於真實解釋這樣的結果?
Ans:這是我們目前仍需要討論的部分。
4: 在第二階段的實驗材料中,並沒有提供真實效應的短文,是否會因此造成實驗結果的偏差?
Ans:因提示作用效應不大。
5: 在第二階段中,是否確定受試者了解巴南效應?
Ans:在閱讀完短文後會詢問受試者,若有不清楚的地方則會重新解釋。
6. 實驗對象均為大學部學生,是否能夠將此結論推論至涵蓋更大的母群?
Ans:由於使用的 16PF 為大專版本,因此實驗對象有其侷限性。
7. 測驗工具的選擇為何使用卡氏十六種人格因素測驗?
Ans:取得比較容易,且測驗難度適中。
8. 實驗對象是否曾經施測過 16PF?是否會影響實驗結果?
Ans:受試者的部分,採隨機處理以平衡這方面誤差。
9. 自評量表為何使用六點量表?而不使用其他量表?
Ans:前測時曾使用五點量表,但因統計上結果使得測驗有效性判斷不易,故改用六點量表避免此狀況,期望有較明顯的結果。
10. 測驗題數是否可能影響實驗結果?
Ans:並無差異。
- 文獻探討與實驗目的和假設:
1. 在文獻回顧的部分,已經有巴南效應大於提示作用的實驗結果,可是卻又提出提示作用會降低受試者對巴南解釋所評定的有效性分數?兩者好像已經有衝突了?
Ans:這是我們該檢討的部分。
[編輯] 【老師回饋部分】
1. 在回答台下同學的問題時,除了主答的同學外,其餘同組的同學也可以盡量補充回答。
2. 台上表現的部分,除了解釋清楚,例如條列式的方式外,投影片的字體大小也要注意。若有統計圖片需要呈現也需要注意呈現的方式對於實驗中材料的使用,也可將實際的內容放上投影片,但需要注意呈現出來的比例大小。
3. 注意報告的時間以及投影片的數量控制。避免過多過少的情況。
4. 台下的同學在發問的時候,或者聆聽報告的時候,可以注意投影片的編號,在發問時若有需要可以直接從投影片中討論,可使得問題內容更明顯。
[編輯] B班實況:
[編輯] 【同學提問部分】
- 提示作用效果不顯著的原因:
1. 是否確認受試者之前有無接觸過巴南效應,因為巴南效應來自星座專欄,是否受試者之前已接觸過?
Ans:沒有做確認,因為受試者的部分我們採隨機處理以平衡這方面的誤差。
2. 前面有提到巴南效應偏正向受試者比較容易接受,有沒有可能是因為受試者16PF的測驗偏負向,而巴南效應偏中性而使結果不顯著。
Ans:真實結果偏負向而影響到巴南效應的關係可能需要更進一步的實驗探討。
3. 在提示效果不成功的原因裡,有一項操弄不成功是指?
Ans:是指我們有效性的操作型定義下的不夠好,我們期望有提示作用後受試者能夠察覺巴南的描述有效性低,若為真實描述有效性較高,但無法確定受試者確定是否受試者瞭解此定義,可能受試者還是以符不符合來評定描述。
4. 實驗結果受試者者的真實結果偏負向,而真實結果偏正向,而根據文獻受試者傾向選正向的特質,若將巴南效果編制傾向負向,是否會改變不顯著的結果?
Ans:我們對受試者下的操作型定義是有效性,是請他們判斷句子是否是來自他們測驗結果而得,而不是判斷符不符合的程度。
- 對實驗的澄清:
1.為何採用16PF做為工具,而不使用其他心理測驗?
Ans:這是目前我們得到比較方便,且小樺老師願意借我們的測驗。
2.在第二階段會寫出他們的個人特質,七到十個特質和巴南效應,是針對每個人設計不同的題目嗎?還是每個人都一樣?
Ans:在真實部分針對個人實際測驗的結果,而巴南效應是所有人都相同但排序隨機。
3. 前測時採五點量表,為什麼測驗的時候改為六點量表。
Ans:因為前測時發現測驗結果都傾向於3分,為了要瞭解受試者對測驗的有效性高或低,故改為六點量表。
4. 怎麼確定實驗中自己編制的巴南效應題目有效果?
Ans:因為最早的巴南文獻提到是根據星座專欄改編的巴南特質,而我們上網去找星座專欄改編成巴南特質,而根據前測結果發現受試者普遍相信我們所編制的巴南特質。
5. 文獻的部分有提到,受試者即使知道巴南效應的效果也會去相信,那為什麼你們會認為給提示效過之後會有差異?
Ans:因為文獻上提到的是正向的巴南特質,而我們實驗不是採用純正向,也有一些是非正向,我們想探討是不是非正向的部分也會有影響。
6.實驗請受試者針對真實結果和巴南效應進行有效性評分,請問有效評分是指這個敘述是不是符合自己得個性嗎?指導語這樣子說的話,會不會只是單純請受試者判斷那個句子是巴南那個不是,而不是針對他的有效性來評分?而受試者做了16PF,重點應放在判斷敘述句符不符合自己的描述,而不是告訴受試者結果,再來讓受試者判斷那個是巴南那個不是。
Ans:指導語-你若認為該敘述是根據妳所進行的測驗分析而得的結果。我們所操弄的是提示作用的變項,我們想探討受試者有無看巴南解釋。而判斷是否為巴南是我們所要操弄的變項,而這樣的實驗程序也有可能影響到實驗結果,對於那些模糊的句子是否還是會傾向於相信是自己測驗所得的結果,對此來做有效性的評分。至於這樣的實驗程序是否影響可能需更進一步討論。
7. 請問你們所編制的巴南測驗中,是有正向也有負向,還是同一題包含正向和負向?
Ans:因為文獻有提到受試者傾向會去相信正向的巴南特質,所以我們在一個句子中有正有負,沒有特別的偏向。
- 對實驗的建議
1.一般人會認為女生較男生會去看星座,此次的實驗性別也是一半一半,當初有沒有考慮把性別當作事變項來操弄呢?
Ans:當初沒有規劃分性別來操弄,所以此次測驗目前沒辦法探討。
2.若僅是探討提示作用對受試者判別是否為巴南,而要排除符不符合,則不應在前面採16PF,因為根據16PF的結果來判別很難排除符不符合的因素。若探討的不是符合性話,建議採用巴南句子和非巴南的句子,讓受試者勾選是否即可。
[編輯] 【老師回饋部分】
- 投影片的量可以在稍稍增加一點。
- 希望各組可以在報告之前先預演,多加練習。
- 投影片可以提供同學問一些「好問題」的線索,例如:統計結果的部分,有些是顯著、有些是接近顯著。
- 台上的動態示範不錯,但希望如問卷、指導語部分能夠打在投影片上,用掃描的話字太小。
[編輯] 幸福佳婷裡有灰色糖...
2008年3月28日
[編輯] A班實況:
A 班紀錄者(zzadjin)公假。
[編輯] B班實況:
[編輯] 【同學提問部分】
- 實驗設計相關問題
1. 證人記憶之前已經做過很多的研究,男女的區別之前也是有很多研究證實女生比較容易受干擾,報告也說你們和之前研究的實驗結果是相同的,我 想請問你們和之前研究有沒有不一樣或更進一步的操弄?
Ans:在文獻中提到男女在不同性別會有不一樣的回應,我們針對這一點來做改進,將兩性別的比例各分配一半,去掉性別的變項只看誘導關係。
2. 在實驗組中有沒有辦法避免受試者是重複觀看文章的,如果受試者再閱讀完文章後重複觀看次數越多,是否對他們的誘導會有影響?
Ans:這部分我們沒有辦法確認實驗組是有重複觀看或是沒有。認真觀看,但是我們大概檢測一下實驗者答題的情形以及錯誤率,大致上都還分配的滿平均的。
3. 請問受試者的來源是從哪裡來的?是否受試者對環境有一定的瞭解程度會影響到實驗的結果?
Ans:雖然高醫學生對環境比較瞭解,但是實驗和對照組都是看相同的影片,所以應該不會有太大的問題。
4. 因為最後採選擇的方式來檢視,選擇題的選項是否對他們的回答產生影響?會造成是題目選項去誘導它,而不是誘導操弄去誘導,譬如在警衛室那邊可能會選取比較有可能出現的東西?
Ans:如果不知道是題目選項和實驗操弄那個誘導力比較強的話,對照組應該可以解決這個問題,如果題目選項有較強的誘導關係,實驗組應和對照組的誘導關係差不多,但結果有顯著的差別。
5. 在實驗組的部分有無告知受試者哪一個才是真實的情境,會不會有受試者認為後面誘導的文章才是真實的情境?
Ans:我們有在指導語的部分提醒他們作答是根據影片內容的情境。
6. 我覺得他們在回憶的程序上看起來是不太一樣的,這樣看起來似乎是三個階段,在第二個階段一個是誘導文一個是數學題目,會不會受誘導文這組多一次去回憶情境,而另一組可能是空白的直接去做那些題目?
7. 在中間的過程中有一部份的人是看誘導文,另外一部份的人則是做數學題目,想請問為什麼是採用數學題目呢?因為女生不是對文字記憶比較深刻,所以為什麼在無誘導組不同樣採用文字,而是選用數學題目?
Ans:(詳見老師回饋部分2)
8. 請問實驗對象男女生的性別比例是都各半嗎?
Ans:是的,每一組人數皆相同。
9. 你們有引述到的文獻中提到女性對於行動的細節回憶較正確,男性對於整體周圍的細節較正確,那你們照片強調的細節部分是比較偏向於哪方面?
Ans:對於環境人物的身上我們都會放一些。
10. 剛剛頭影片上面有提到「誘導力」,這部分可以麻煩在解釋一次嗎?
Ans:誘導力指的是該題選到要誘導那個選項的人數。如果誘導的是圓形,他選倒圓形,表示該題他有被誘導到;假如十人當中有五人選到圓形的選項,那麼表示該題的誘導力是五成。
11. 在分析結果之前就知道文字對於女生的影響,我是覺得在誘導文部分是以文字呈現,在問卷的部分也是以文字呈現,情境很相像,我想請問是否有考慮用口頭回答的方式,而且比較接近一般法庭在詢問的情況?
Ans:因為我們每個程序盡量都標準化作業,用口頭回答可能產生差異,強調的動詞、語氣、表情都可能會影響到受試者。
12. 如果受試者在信心程度填答0的時候,該題目是否可排除掉,因為受試者很可能是猜的而不是受誘導。
Ans:我們在前測篩選題目的時候,若大多數人都圈選信心程度是0的時候,代表該題目問的問題太細節,我們會把他排除掉。
13. 你們24個圖片呈現刺激的時間是5s,加起來才兩分鐘,而且圖片是比較片段的;而你們去誘導的東西,是一整個比較完整的文章,刺激的時間是五分鐘。那麼你們會不會覺得誘導的情況那麼顯著,是因為兩個刺激的差異太大?
Ans:可能會有這樣的情況。
14. 如果受試者有被誘導的時候你們還會看他的信心程度嗎?若受試者的信心程度為0,你們還會採用嗎?
Ans:我們前測之後就沒有再採用信心程度,前測是因為怕題目出得太細,之後若是用猜的話,會用統計的方法把他排除。
15. 關於妳們拍的頭影片部分,因為是在高醫校園,會不會受試者(高醫學生)是憑著他的記憶去選擇,而不是因為影片?
Ans:因為我們選擇的都是高醫的學生,這樣可以平均調那些剛好有經過或印象比較深的人憑記憶選擇所導致的誤差。
16. 因為你們是在教室放投影片,會不會因為視角的關係大家看到的不一樣?
Ans:我們有告訴受試者,請他選擇能看清楚的位置來坐,我們是控制受試者坐到大概中間的位置。
- 誘導力的問題
1. 誘導力的部分是以選中誘導的題目當分子,那你們有22題的題目,為什麼不以22 題當作分母,猜錯誘導的題目當作分子?因為被猜錯的題數不一樣,被誘導的題數一樣。像是兩個人,一個人猜錯3題,只有一個人被誘導;一個人猜錯兩題,只有一個人被誘導。相較之下猜錯兩題的那個人誘導力就高出很多。
Ans:但是我們是採統計去檢定它的差異,那如果妳只是因為機率的因素讓它選到誘導的選項,這樣在跑統計的時候就會排除兩個比率不同的情況,如果顯著就可能表示這兩個分數機率的不同。
2. 你們的誘導力是指在題目中選到誘導選項,若假設有兩個人選到誘導的題數都一樣,但每個人可能達題的正確率並不一樣,可是卻只看誘導力?
Ans:因為我們主要的是想看誘導的效果,所以我們才會把依變項設為誘導率,正確力可能是因為每個人記憶的能力可能不太一樣,所以我們並沒有探討這個部分。
3. 如果在22 題中,那個人只錯了1題,那一題剛好是你們的誘導題目,那誘導率就是百分之百。另一個人如果答錯12題,誘導率還是答錯1 題的人較高。那麼為什麼不考慮以總題數下去做誘導力的估算呢?
Ans:因為我們做這項設計的用意是要排除個人因回憶能力的不同而導致的差異,在實驗的過程中我們並沒有只錯一題的情況出現。
4. 對照組(無誘導)的誘導力不是歸到0的地方,那這樣算是有誘導力嗎?
Ans:因為我們並沒有操弄對照組的變項,如果有這種情況出現的話,很可能是機率導致選到誘導的選項。
- 對實驗的建議
1. 報告一開始有提到文獻指出女性受誘導的程度比男性高,且女性對於婦女出現和行動細節回憶較正確,那為什麼一開始沒有想到實驗設計把主角換成男生,然後引導文的部分是用男生的口吻去回應,這樣是不是比較能夠看出男性和女性受誘導的程度差異?因為你們focus就已經徧落在文獻提的女性比容易受誘導。
[編輯] 【老師回餽部分】
- 一組三個人,希望一個的報告時間至少十分鐘左右,是希望各位能夠把事情講清楚,這樣台下發問的會更好,不會問出實驗是怎麼操弄的問題。
- 剛才有人問短期記憶的影響,中間隔十分鐘做數學題目是要避免短期記憶的影響,因為怕在十分鐘內若沒有限制他的活動,受試者可能透過複誦來加強他的記憶,所以中間夾雜數學題目來避免受試者複誦。
- 誘導力是希望去校正個人記性好壞的問題,但是這有一個先決條件,就是總錯誤率到底是多少,因為總錯誤率裡面極端的話,這樣的校正誘導率會出問題,就像有人提到記性很好,只錯一題剛好是誘導的題目,這樣會有極端直出現影響會很大。
- 有些問題可能是出現在預料之外,一些low data要準備好,像是統計數據來回答平均錯誤來回答有疑慮的問題。
- 有些問題台上報告講過,或是台下互動中已經被提到很多次,同樣的問題不要繼續問,可能要在想想其他東西。
- 像是總錯誤率等等的問題,報告組在寫到告的時候需注意,四選一中的誘導率機率是多少,跟妳資料的差距大不大,稍微算一下會更好。
[編輯]
心實活動組
2008年4月11日
[編輯] A班實況:
[編輯] 【同學提問部分】
1. 形狀階段部分,使用正方形、圓形、三角形,這樣會不會造成在形狀判斷時,需要多判斷一個步驟而造成時間上較顏色階段來得長?
Ans:依據文獻設計。在顏色部分使用相同形狀而改變底色,而在形狀部分使用相同底色而改變形狀。
2. 在顏色階段的部分,所選擇的顏色為紅色及綠色,選擇這兩個顏色的原因為?
Ans:依據文獻設計。因此使用紅色及綠色這兩個相對比的顏色。
3. 在形狀階段的部分,所使用的圖形順序依序為正方形、圓形至三角形,使用這個順序的原因?
Ans:形狀上的相異,例如圓形與正方形及三角形相比為無角的形狀,較容易辨識。為了讓兩種形狀的差異達到最大。
4. 在顏色階段部分,使用紅色這種視覺上較容易被注意到的顏色,是否會因為這樣降低錯誤率?
Ans:這是有可能的,未來可以的話會嘗試使用不同的對比色組來探討。
5. 為什麼要做反應時間的限制,會不會因為這樣影響了受試者作答時的錯誤率?
Ans:因為主要探討的是對刺激的反應,如果不限制反應時間可能受試者在較長的反應時間可能已經受到其他干擾,例如思考。
6. 在兩階段的實驗過程中,是否有給予受試者足夠的休息時間?
Ans:在實驗程序中,若受試者在十字凝視點並未按下反應鍵則實驗並不會繼續,此時受試者可以有休息的時間;而在兩階段間,閱讀指導語時也可以有休息的時間。
7. 是否能修改材料設計,例如顏色部分將灰色佔位方塊呈現之後,省去原本第二張刺激投影片,直接呈現三綠一紅方塊讓受試者反應;形狀階段也用類似的方式修改。
Ans:這樣會沒辦法呈現突現與刺激。
8. 顏色階段使用紅色作為刺激顏色,可是在很多研究中紅色在大多數情況中較易被人注意,會不會因此當刺激呈現時,更容易辨識出紅色這個刺激而導致錯誤率下降?
Ans:顏色的部分主要是沿用文獻的設計,而我們的實驗主要討論的部分是反應時間,所以會希望錯誤率較低會比較好。
9. 為什麼在最後一個需要受試者判斷刺激的部分需要限制受試者的反應時間呢?因為實驗的主要目的不是要探討反應時間的差異,如果僅平均有效的反應時間數據,不用理會錯誤率的問題,只要統計反應正確的部分,也可以達到實驗目的?
Ans:因為實驗探討的主要是關於對突現刺激的反應時間,如果反應時間過長有可能是因為受試者已經經過思考而干擾了刺激的影響,因此為了確定反應是因為突現刺激的影響,所以必須限制反應時間。
10. 在形狀階段的部分,有沒有考慮使用類似星形之類的多邊圖形,這樣會比使用三角形還來的更容易辨識?
Ans:主要還是使用正型圖形,例如正三角、正方、正圓圖形。
11. 指導語的部分,將實驗情境敘述的如此清楚,會不會有受試者因為指導語造成被過度指導或暗示而影響了實驗結果?或者修改內容將一些比較不需要的部分移除?
Ans:因為如果沒有敘述清楚,在實驗操作上可能會使得受試者誤會突現刺激而造成錯誤時有額外的干擾因素,所以會將實驗情境作較清楚的描述。
12. 有沒有考慮將兩個實驗階段合併為一,利用隨機編排將形狀與顏色的題目都混合進行實驗?
Ans:這樣可能會造成兩者處理歷程上的混淆而造成錯誤率過高的情況,而為了避免練習效果因此分為兩個階段進行交錯實驗。
[編輯] 【老師回饋部分】
1. 只注意到練習效果,卻忽略了疲勞效果以及順序效果,此實驗設計應該是要平衡順序效果。
2. 注意名詞使用上的問題,例如:嘗試 (trial) 以及測試 (test) 的不同。
3. 還是需要注意時間的控制。
4. 台下同學發問及台上同學回答時不必要用很對立的方式,課程主要是互相討論。
5. 在回答同學問題時,可盡量先單獨回答問題,除非真的不知道該如何回答在與其他同組同學討論。因為小組會議多會影響到時間控制。
[編輯] B班實況:
[編輯] 【同學提問部分】
1. 人對顏色的注意力本來就是會有差異,像紅綠燈,我們人對紅色本來就比較敏感,對綠色本來就比較不敏感,那麼為什麼你們做顏色的時候還是選擇紅色、綠色來做?為什麼不選擇敏感程度差不多的顏色?
Ans:實驗選擇紅色、綠色的部分我們是引用文獻,而我們做的是突現刺激,而不是要檢驗顏色的敏感度,基本上顏色只要是對比色就可以了。
2. 開始出現顏色或形狀之前不是會有四個灰色的小框框,可是當你們出現顏色的變項時時,他的框框同時是沒有改變的,可是當你出現形狀的時候,另外三個的形狀不是會變成圓形嗎?為什麼他不要繼續用正方形呢?
Ans:我們第一階段主要是控制形狀,大家都是要用方塊正方形,所以他會有顏色的改變(灰色紅色);第二階段我們要控制的是顏色,所以他只在占位方塊會呈現正方形,皆下來個方塊就會改變成不同的形狀(正方形三角形)。
3. 之前在做實驗的時候,發現在圖形與圖形間的交替會有視覺暫留的現象,因為受試者也想很快地完成,在按下中央圓形鍵切換到下一張時,然會有上一張的圖片殘留的感覺,不知是否會對實驗結果造成影響。
Ans:視覺暫留的現象是從0.1s-0.5s,我們題目切換的時間已經超過1s,所以應該不會有視覺暫留的現象;而在中間十字鍵的位置其實可以稍作停留,不用立刻按下去。
4. 請問剛剛報告錯誤率的地方有提到「首誤」,請問「首誤」指的是什麼意思?
Ans:首誤第一是從反應時間來看,可能他在100毫秒就做出反應,但是人的反應時間沒有辦法這麼快,可能是不小心按到的:第二,他可能是按到圓形鍵就直接跳到下一題,也會判斷它是首誤。
5. 在獨變項中只有突現和非突現的刺激,這樣是單因子實驗設計;可是後來又比較顏色和形狀,這樣還是單因子嗎?是不是在統計檢定要採用其她的統計。
Ans:我們分作兩階段來進行,顏色階段只會出現顏色的改變,並不會出現形狀改變:同樣形狀階段只會出現形狀的改變,不會有顏色改變。形狀和顏色是分開進行的,不會有同時改變形狀和顏色的情況,只是單純想比較兩組反應時間的差異。
6. 為什麼在實驗中採用和反應目標的形狀和顏色,紅色和正方形,而不採用其他的呢?
Ans:因為在文獻中其實有探討相似和非相似,文獻中的非相似效果並不顯著,所以我們打算直接用相似的來作實驗。
7. 實驗中每個圖片呈現的時間,其實和視覺暫留有很大的關係,請問實驗中的600毫秒,跟後面讓他們作決定的1000毫秒是怎麼作決定的?
Ans:是參考文獻方面的設計也是600毫秒和1000毫秒。
8. 最後討論部分,關於「辨識形狀的歷程比辨識顏色的歷程來的複雜」,你們有找到相關的厭來佐證?
Ans:我們並沒有找到相關的文獻來佐證,但我們是依據顏色的反應時間比形狀來的快,所以我們才推論可能是形狀辨識歷程較為複雜。
9. 在實驗中形狀部分用三角形和圓形,顏色部分用紅色和綠色,有沒有考慮加入不同地形狀或顏色組合?
Ans:再進一步實驗時,會考慮加進其他組合搭配的。
10. 實驗組主要是作突現刺激的影響,但是為什麼參考文獻中提到不相似的是不顯著,相似的是顯著,你們還是要選顯著壓?已經確定會造成影響,在實驗中為什麼還要作呢?
Ans:因為我們還有作形狀的部分,所以先作顏色部分和形狀來作對比。
11. 實驗中提到的「新物件假說」,與突現刺激和非突現刺激反應時間達顯著的關係為何?
Ans:從「新物件假說」來看是指一開始從無到有的刺激,從一開始占位方塊就沒有告訴受試者等等刺激會出現的位置,等到下一個畫面出現時,它就突然在外側周圍出現一個干擾,這就是「新物件假說」的意思。而突現和非突現的差別在於,有無提示受試者等等干擾出現的位置,所以可能是因為突現和非突現的關係,影響到受試者做出的反應時間差別。
12. 紅色和綠色在名度上是有差異的,這樣會影響到反應時間的差異嗎?
Ans:因為我們選用的顏色是正紅色或正綠色,所以不會有這方面的困擾。
13. 超過1000毫秒而沒作反應就算錯誤,請問突現組和非突現組因為這樣子而錯誤各自各有幾人?會不會有人是因為來不及作反應而導致錯誤呢?
Ans:平均下來是3.9人,個別沒有作計算,因為錯誤率部分還包括「首誤」。我的目的本來就不希望他們思考太久,若思考太久可能是經過大腦思考後才做出反應,就不算被突現刺激干擾了。
[編輯] 【老師回饋部分】
- 選用頭影片作為表現,目的是為了輔助口頭上的講解,上面可以留一些線索幫助你的解說,但是不要照稿唸,可能沒有注意到下面的同學都已經快睡著了,要懂得去變化和活用。
- 台下問問題上要具體,有些人記得第幾張從那邊問起,相當不錯;最怕的是講到中間用一些代名詞去代替,例如:這兩個因素間有沒有交互作用、這個有沒有問題、那個是不是不一樣,可能會導致台上回答問題或台下亂掉,所以做好不要用代名詞。
- 因為實驗本身具複雜性,A、B提問都未能幫助他們釐清,形狀和色彩之間在注意力的分配過程當中,這部分還有更多討論的空間。反應時間都顯著,可能看不出各組間有些可能有一些問題的存在,但是在錯誤率的指標,恰好有一些不顯著,有一些可能是天花板效應,都很少錯誤,但是有一些可能是其他的原因。
[編輯] 少了意仁組
2008年4月25日
[編輯] A班實況:
[編輯] 【同學提問部分】
1. 問卷發放後,回收時會不會因為有其他的干擾而造成受試者回答的結果有偏誤?
Ans:有可能的,這是因為研究的限制而無法掌握,但是均有讓受試者知道不計名。
2. 與文獻(李卓夫,民89)中的差異?
Ans:最大的差異在屬性變項的控制,在我們的研究中多了母親教育程度。
3. 母親對子女的影響主要是在子女幼時,要如何避免母親可能是在子女成年或者長大以後才外出就業?
Ans:在發放問卷時有事先告知受試者以母親大多數的狀況為主。
4. 問卷採五點量表的方式評分,要如何避免受試者答案作假的問題?
Ans:因為實驗的限制無法精準的避免受試者作假,但是因為樣本數量還算足夠應能避免這樣的問題。
5. 挑選有效問卷的方式與標準?
Ans:作答不完整的問卷列為作答不完整的問卷就不予採用。例如未勾選母親的教育程度。
6. 問卷的題目是如何選擇的?
Ans:性別刻板印象的部分都是採用文獻。
7. 計分時應該有反向計分會比較適當,如果都用極端值可能不太適合?
Ans:會評估對整體性的題目設計來選擇更適合的評分方式。
8. 母親的就業狀況與教育程度可能是共變的,會不會是因為這兩個變項本來就有高相關而影響實驗?
Ans:原本文獻是將母親的就業狀況與教育程度加權計分,而我們是將這兩個變項獨立出來當作實驗的屬性變項。
9. 區分母親的教育狀況是要看母親的刻板印象狀況,所以是否能夠使用母親刻板狀況或兩性平權的態度較好?
Ans:可以有進一步的研究。
10. 在收集樣本資料的時候有沒有事先對樣本做篩選?例如先篩選掉特殊的家庭狀況。
Ans:無事先篩選。
11. 回收問卷有流失的部分會不會造成其他剩餘的有效問卷中,各屬性變項的比例不同而影響數據結果?
Ans:採隨機化處理,希望了解大學生與母親狀況之間的相關。
12. 有沒有考慮到可能母親所就業的職業類別有可能也影響到大學生的刻板印象形成或者減弱?
Ans:在問卷上有需要受試者勾選母親的職業類別來區分。
13. 會不會是因為把母親的教育程度區分過細,所以造成實驗的結果中對於母親教育程度並無顯著影響?
Ans:這部分是參考文獻設計所沿用的。
14. 各地區中可能母親所受的教育與狀況不同,可能所造成的刻板印象影響也有可能不同。問卷的取樣範圍僅有高醫?
Ans:能力限制的緣故因此主要以高醫學生為主。
[編輯] 【老師回饋部分】
1. 報告的同學,PPT 的頁碼要記得標註一下,報告時緊張難免,但要注意報告訴度以及台下反應,不要只看螢幕報告。
2. 以實驗法研究為主,問卷調查研究具有難度,因為問題層面較大,要相當大的抽樣以避免偏誤。
3. 利用文獻的方法要理解文獻中使用的原因,當被問到相似實驗方法的問題時,利用這個方式回應並不太恰當。
4. 問問題時應更具體化較好,與為何有相關的理由。
[編輯] B班實況:
[編輯] 【同學提問部分】
- 實驗澄清部分
1. 請問實驗在發問卷時是當面拿給受試者填嗎?如果是的話,受試者會不會揣測實驗的意思,或是不好意思表現出刻板印象?
Ans:是當面拿給受試者填寫。因為我們實驗並沒有盯著受試者填寫,只是請受試者填寫完畢遞交給我們即可,所以應該不會有這方面的影響。
2. 請問你們報告中提到的「有效問卷」,「有效問卷」是指?
Ans:是指200份的問卷中,若有只有任何一個項度沒有填寫致使無法統計,即是為無效,其餘皆為有效問卷。
3. 在實驗中屬性變項當中,性別是一個很重要的變項,那為什麼受試者男女的受是人數相差會這麼大?如果性別是一個重要的變項,為什麼不控制在一樣的樣本數?
Ans:因為我們只需計算到他的平均數,所以以平均數來講並沒有很大的影響;而且在我們的文獻中其實男女受試者是一樣沒有平均的。
4. 在楊國樞、楊中芳老師「華人本土心理學」中有提到,華人比較重視團體中個人被賦予怎麼樣的角色和責任,而在歐美西方社會較重視個人;請問這樣不同的文化差異是否對性別刻板印象也會造成不同的影響?
Ans:在這次的實驗中並沒有操作,不過在文獻中有探討,台灣的大學生在性別刻板印象比美國來的高,而兩性平權較美國來的低。但是我們比較好奇的是現在的大學生和過去的大學生有什麼樣的差異,是和文獻來相比較,之後有更進一步研究的話才會拿來和國外相比。
5. 請問實驗中判別刻板印象程度的題目是怎麼決定的?
Ans:是和所引用的文獻進行修改,因為文獻距今有點久,有些觀念或用詞並不適用於現在,因此我們會稍作修改。
6. 這次實驗的結果為母親的就業狀況對性別的整體刻板印象沒有顯著影響,可是文獻的結果是全職的家庭主婦會較為顯著,請問是什麼原因導致和文獻不同的結果?
Ans:在文獻的年代,全職家庭主婦較多,外出工作的母親較少;而現今因為經濟壓力大,婦女不得不走出家庭。另一方面,近年來女權伸張,職業婦女並不被視為一種異端,可能這樣才造成與文獻不同的結果。
7. 請問為什麼前測實驗問卷中的效度可以高到.9,正常的信度大概是在.3~.5?
Ans:是採用統計軟體因素分析跑出來的,只是確定此份問卷是否有效,並未探討為何會有這麼高的信度。
8. 在結果部份提到,男生的刻板印象相較於女生有顯著的差異(0.043),是全部比起來嗎?如果是的話,為什麼在探討部份提到,只有在玩具遊戲活動層面有達顯著?
Ans:是整體有效問卷中男性和女性相比有達顯著。而整體下又分作四個分量表,在玩具遊戲活動層面也同時有達顯著的。
9. 刻板印象是女生較高,兩性平權是男生較高,請問刻板印象和兩性平權兩者之間有什麼樣的關係?
Ans:在本次實驗中並沒有探討這部份,不過在文獻中有討論到是呈現負相關,而這次實驗我們並未作此分析,未來進一步探討時會再作兩者之間的比較。
10. 實驗探討的是性別角色刻板印象,應該是指說「性別角色」在社會上扮演的刻板印象,是不是應該把文化層面的因素考慮進去,例如問卷中有提到:洗碗是適合女性還是適合男性?如果他勾其中一個的話,適合女性或適合男性,就表示他有性別刻板印象。可是這裡指的是「角色」的話,是不是應該改成說,煮飯是女性的工作,你認不認同?(文化層面來看女性叫為家庭中洗碗的角色)
Ans:因為我們主要探討的是受試者個人的想法,而不是受到文化層面影響的程度,所以才會採用這樣的問法。
- 問卷題目和計分方式
1. 問卷的部份是採用李克特的量表,一般的評分方式是1、2、3、4、5,想請問為什麼在「普通」會評0分?
Ans:實驗主要採取0、1、2、1、0的方式來計分,後來也有採取正向計分1、2、3、4、5和反向計分5、4、3、2、1,這三種方式比對後發現差異不大,曲線都一樣,所以最後還是採用0、1、2、1、0的方式計分。
2. 在問卷的五點量表部份,在設計問卷的時候其實已經偏了一個方向,例如「男主外,女主內。」,題目本身已經偏了一個方向,但是在評分的時候,卻是把「沒有意見」設為最高分,如果我勾選反對(0分),我只是反對這個話,我是站在兩性應該平等的位置上去思考,這樣就沒有計到這題得分數,會造成這樣的情況。
Ans:我們認為「不贊成」有兩種意思,有兩種意思,一種是站在完全相反地位置(女主外,男主內。),另一種是反對那句話(認為其實應該是要平等)。可是中間還有一個無意見的選項,我們認為無意見是最中庸的,所以我們會採最高分。此外,其實我們正向和反向計分的方式都有採用過,其實曲線視差不多的,後來我們認為無意見是最中庸的,所以後來選擇此種計分方式。
3. 在題目的1、2題,都是偏向男性的題目;3、4題都是比較偏向中性的題目。譬如說「男主外,女主內。」不認同這句話的話,通常會勾在不認同,但如果像是3、4題較為中性的題目,通常都會勾在無意見。這樣子兩種不同類型的題目(偏向男性/中性)採取同樣的計分方式,是否對結果也會產生影響?
Ans:所以針對實驗的結果有另外有採取不同的計分方式(正向/反向計分),來檢視是否造成影響,結果發現相同的趨勢,所以應該不會產生影響。
4. 關於「刻板印象」的題目方面,像是在玩具運動活動方面,有一題「極限運動」,因為男生的體力較高於女性,所以今天我勾選男生較適合,那麼就代表我有刻板印象嗎?那麼怎麼去定義說去勾哪個性別就代表有刻板印象呢?
Ans:因為極限運動男生和女生都可以玩,且在國外男女很普遍,妳如果認為它只適合某一種人玩時,就代表你有性別的刻板印象。
5. 譬如釣魚,我覺得男性和女性都可以去釣魚,但我覺得男生較常在作,所以較適合男性,這樣代表我有性別刻板印象嗎?
Ans:只要是偏向男或偏向女,都認為有性別刻板印象。
- 對實驗的建議
1. 請問實驗當中有沒有考慮到受試者父母親離異的部份?因為父母親離異,而受試是給父親撫養,相較之下母親對他的影響較小,這樣可能繪影想到實驗的結果。
2. 實驗結果母親的就業狀況對性別的刻板印象是沒有影響的,第二和第三個屬性都是屬於母親的,那有沒有考慮可能真正影響的是父母間的互動情況影響性別刻板印象和平權狀況。誠如前面報告所述,現在因為經濟壓力的因素,婦女就業的情況相當普遍,那麼這裡的影響就沒有這麼大,很可能父母的互動過程才是主要的原因。
Ans:因為實驗當中很難對「互動」下定義,所以才採用職業來作區分,不過進一步探討時我們會考慮這項因素。
[編輯] 【老師回饋部分】
- 他們的計分方式和平常所看見的不一樣,都有一些意義,並不是說哪個對哪個不對,這種計分方式好處是並不用考慮每一題要計正向或負向,正向、負向有時候很模糊,尤其是在平權的議題上,例如:傳宗接代對男生很重要,「是」或「不是」才是平權?因為問卷上的項目,作答的人並不是完全能掌握主試的意思,有些人認為傳宗接代是女性的任務,這樣的想法可能不平權,以這種角度來思考,也可能勾選「不贊成」。認為男生必須傳宗接代,可能勾選「正向」或「負向」很難講,所以在題目上會有很大的爭議性,所以在這種情況下才會採用這種計分方式,只要有偏向就算是不平權,不過這樣使用也會有問題,這要看實驗者站在什麼角度去使用。
- 台上報告提到有另外使用兩種計分方式,「正向」或「負向」看起來差不多,這種說法可能會造成質疑,做好能準備資料,不見得要放在投影片,但若有人提問時可以把資料show出來供檢視。
- 社心相關的實驗複雜度較高,一下子可以看到很大範圍的地方,可以較周全看到各種問題,顧慮太多的事情沒有辦法控制到干擾的變項,會導致複雜度高,穩定度卻低,這樣變異量、變動性很大,很難得到一個穩定的東西;作實驗的人就可能認為這樣精準度不高。而實驗設計可以讓我們找到較核心、認為重要的問題,可使用較單純的問題作為操弄,可以看到單純的效果,很多變項是必須控制起來,或把它平衡掉,只看其中的幾個部份,會有比較穩定的結果出現;但從社心的角度來看,只著重在一小部份,無助於對整體的瞭解。不過載心理實驗法的課程中,還是希望同學能從小的地方開始作,能以「實驗設計」操作。
[編輯] 如來佛組
2008年5月2日
[編輯] A班實況:
[編輯] 【同學提問部分】
1. 影片採用 MV 作為實驗材料,會不會有受試者以前看過或者比較熟悉而造成實驗結果上的誤差?
Ans:在問卷上有事先詢問這個問題,會排除這樣的受試者。
2. 在實驗組與對照組的三個實驗階段過程的第二個階段,對照組以及實驗組的認知歷程好像有些不同?
Ans:為了確保三組都有相同的記憶回朔的情況,因此做這樣的實驗設計。
3. 在最後的測量階段中使用簡答題,可是會不會其實是受試者本來就已經有錯誤認知,而非被干擾?
Ans:因此我們採用組間設計的方式與對照組進行比較。
4. 受試者人數數量的決定方式?有特別控制人數或者男女比例嗎?
Ans:自行評估所需的受試數量,有控制總人數,但並未控制男女數量的比例。
5. 如果有受試者評估自己的自信程度低,但是卻發生答案都正確的情況,這樣的結果是否會被採用?
Ans:在實驗過程中自信程度低的受試者通常傾向不回答或者答案錯誤的狀況,並無發生自信程度低卻答案正確的情況。
6. 使用簡答題做為第三階段材料,可是其實有些簡答題的題目有選擇性的答案,例如左手、右手的選擇?
Ans:類似的封閉性題目並沒有辦法避免,因為若使用難度較高的題目可能造成普遍性錯誤率高,因此我們另外使用信心程度來評估。
7. 干擾表的干擾題目數量決定的方式?型式?
Ans:依據文獻設計為總題數的五分之二,過高時可能會有更明顯的預防針效應;干擾表均由主試者用各種方式手寫填答。
8. 若受試回答時空白或者可能是因為被干擾才發生這類答題錯誤的狀況該如何處理?
Ans:僅有正確回答才列入計算,或者被間接或直接干擾才會計算,其餘皆不計分。
9. 因總題數僅十五題,而干擾題數僅有六題,可能造成實驗結果的數據因一題之差而偏誤過大,能否增加總題數來避免此情形?
Ans:題目均為主試設計,而在經過前測篩減掉過難及其餘不恰當的題目後所剩有限,因此最後僅剩餘十五題。若有機會可嘗試增加。
10. 如何確保受試者在間接干擾組的實驗過程中確實閱讀干擾表?
Ans:會用各種方式確定每個受試者均在詳閱干擾表之後才進行作答。
[編輯] 【老師回饋部分】
1. 台下同學發問時以理論討論為主,語氣控制一些,不要有太過類似質詢的方式詢問台上同學問題。
2. 報告同學在用詞的定義上要更明確,例如實驗中的操作型定義。
3. 回答問題時,回答的內容不要前後不一致,應該是整組同學都對實驗內容及過程都很了解才對。
4. 台上回答問題時不要都是同一個人回答,要適當的分配問題給同組同學,不然計分時會有差距。
[編輯] B班實況:
[編輯] 【同學提問部分】
1. 對照組看了五分鐘的影片,然後單純的休息六分鐘,但是在這六分鐘的過程中,並沒有給受試者分心作業,在這六分鐘受試者是不是可能可以不斷地rehearsal增強回憶,而有較好的答題率?
Ans:對照組休息六分鐘,過程中希望他能回憶剛剛影片的內容,因為在實驗組方面,不管是間接或直接,間接的時候看干擾表也是在回憶,在直接部分和實驗同謀討論的時候,同樣也是在回憶。所以想說在對照組什麼都不讓受試作,可以讓受試者回顧,這樣才能盡量把三組間控制成一樣。
2. 受試者主要是針對校內的學生,譬如在作學弟妹的話,會不會因為認識實驗同謀而導致實驗的誤差?
Ans:再直接干擾組實驗同謀干擾的時候我們全部都沒有學弟妹,沒有本系的學生,都是外系不認識實驗同謀的人。
3. 在直接干擾組中,所有的受試者都是由同一位實驗同謀來操作,在和受試者討論過程中多少會有差異,是怎麼樣避免這種狀況?而且如果是和不認識的人討論,對方又一直堅持,會不會有點強迫性的選擇這個答案?
Ans:每一位受試者對於實驗同謀的干擾,他們認為的強度一定不可能相同,但是已經盡量在語氣、態度上把情境控制到相同,這是實驗沒有辦法控制到的。
4. 題目數只有六題(干擾題),這麼少的題目答對和答錯即使只有差一題,在統計上的差異還是會很大,是否應該增加題目數呢?
Ans:因為影片長度和內容的限制,絞盡腦汁才製作出20個題目,經過前測後篩選剩下15題。若要再增加題目數,可能未來影片要找長一點或困難一點的,這樣比較有內容可以問才能嘗試增加題目。
5. 十五題之中,九題是不看正確率,只有去比對那六題干擾題的正確率,但若受試者前面都答對,干擾題之中只是有一題忘記或亂選而答錯,這樣算是被干擾嗎?
Ans:每個人注意的地方不一樣,答對的地方也不一樣,我們使用對照組來排除掉這項誤差,不管在哪一組都可能發生六題中剛好有某一題不會的,所以採用三組作比對,統計上跑出來是顯著,這樣就可以除機率因素所造成的。
6. 干擾率是指受試者回答到干擾的答案而答錯,但是會不會可能是有受到干擾的影響,但是回答的卻不是實驗所干擾的內容?例如機車騎士有四個,實驗干擾是五個,但回答卻是六個。
Ans:在這個地方干擾率是算不出來的,所以有正確率的比較,這樣的答案還是錯誤的答案,正確率會下降,但是這個地方是在干擾率並不會算進去的。
7. 會不會受試者本來就是要回答受干擾的答案,而並不是受到實驗的操弄而被干擾,有沒有這樣的可能性?
Ans:我們實驗三組是隨機分派,三組都是來自同一性質的高醫學生,把它打散到三組織後,對照組方面幾乎沒有出現原本寫的答案就是實驗所要干擾的答案,因為是隨機分派,所以在其他組應該也不會出現這樣的情形。
8. 實驗中有使用到欺騙,就是實驗同謀這一部份,請問在實驗之後有作事後澄清嗎?
Ans:做完實驗之後會跟受試者告知,剛剛一起討論的受試者其實是我們的組員。
9. 在對照組六分鐘的休息時間裡,並無讓受試者看到15題的題目。但是在間接或直接干擾組,都有看到或討論關於15題題目方面的問題,所以如果讓對照組看到15題的題目,讓他們直接馬上就可以去思考,這樣歷程會不會比較接近?
Ans:前測有幾位受試者是採用這樣的方式,但是發現如果讓他們看完影片後馬上看題目,他們的印象會非常深刻。在直接干擾組部分,實驗同謀是和受試者一題一題討論;在間接干擾組部分,受試者也是一題一題看題目。這樣對照組若在看完影片直接給予題目,仍和直接/間接干擾組存在差異,因為受試者在題目發下來後可以馬上確定自己等一下要寫什麼答案。三組所經歷的歷程一定不相同,實驗已經盡可能的控制到相同的程度。
10. 實驗探討的題目是「共同證人記憶的干擾」,在文獻中證人記憶都是採用搶劫案、車禍等等事件,這樣可以使受試者很容易的知道他們要focus在哪一個點,可是這次的實驗採用的影片是音樂MV,會不會反而讓受試者不知道該注意在哪方向?
Ans:因為過去證人記憶都是採用搶案、小偷等等新聞事件,所以才會想設計一個不一樣的而沒有注意到這方面的干擾,謝謝你的建議。
11. 在間接干擾組方面,是給受試者一張干擾表,若干擾表的呈現方式是類似統計過的,例如百分之70的人認為…,這樣會不會有不同的效果?
Ans:在間接干擾組是可以這樣做,但是在直接干擾組,實驗同謀無法表現出70%認為是這樣的答案,這樣兩組就沒有辦法比對,所以沒有採用這樣的方式。
12. 請問在直接干擾組指導語的部分,有無告知受試在影片看完之後可以討論?因為若為告知受試者,而突然有個人和他討論,受試者很有可能產生懷疑?
Ans:一開始是請受試者看完影片,休息一分鐘,這一分鐘內是不可以討論的,接下來下指導語:「現在請兩位討論五分鐘。」然後他們開始討論五分鐘。
13. 請問是如何選定15題的題目和6干擾題干擾題目,是如何篩選的?
Ans:在前測的時候我們會看他的正確率,大概是介於中間,答對率太高我們干擾很困難,太低的話干擾會太容易,所以都選擇中間值的題目來施測。
14. 因為之前我們有操作過證人記憶的實驗,發現男生和女生注意的部分其實不同,若你們的受試者將男女比例控制到相同,會不會比較恰當?
Ans:因為這次實驗探討的是直接干擾和間接干擾的差異性,而不是性別的差異性,所以就沒有另外去看男女之間的差異。
15. 因為過去文獻中的實驗都是採用搶案、小偷等影片,這樣受試者在回憶的時候,會有一個主軸,像情節一樣的回憶,但是這次實驗的影片是採用MV,而且長度達五分鐘,且無劇情連貫的情節,在這五分鐘要注意的事情太多,受試者之後也因沒有劇情主軸而難去回想,這樣會不會造成實驗結果有較好的干擾情況?
Ans:因為若採用有劇情的影片,對照組在看完影片後休息六分鐘,會有較好的回憶,他可以不斷地輕楚回想剛剛的事件。但在直接或間接干擾組,受試者都是一題一題的討論或觀看,不斷地被打斷。所以才會想控制成沒有聲音、字幕,片段片段的影片,讓受試者能focus在影片上。
[編輯] 【老師回饋部分】
- 之後要請實驗組去思考直接干擾/間接干擾/對照組,這三組織間是否只有干擾的類型是不一樣的,會不會有其他東西會跟著影響到而改變,進而影響到後面結果。有些不一定是實驗控制不好,而是先天上無法控制的因素,這是之後可能要深入探討的部分。
- 回答問的方式很好,有時台上會被問到沒有意料到的問題,需要時間來思考,這時再覆誦一次台下發問的人問題,一方面可以更清楚知道他們在講什麼,一方面也可以釐清問題。
[編輯] 瑞可那一組
2008年5月9日
[編輯] A班實況:
[編輯] 【同學提問部分】
1. 測驗後是否有告訴受試者正確答案?不同受試者可能對答案有不同的看法?
Ans:如果直接先告訴他們的話,可能是因為記憶的原因而不是認知連結。
2. 選擇四種顏色比較的原因?因為實驗的主題是詞色與色塊和詞意辨別,從實驗設計中使用兩色也可以達到效果,且實驗嘗試題目也可以減少題數避免一些混淆變項?
Ans:可參考再改進。
3. 參考文獻第三中,色塊採用 400msec 呈獻的原因是什麼?快慢的問題差在哪?
Ans:在該文獻中,在 300-500msec 呈現時間結果會最顯著,在前測中 300msec 與 500msec 的數據結果相當不穩定,因此採用 400msec。
4. 色塊與詞色連結快,詞色與詞意比較應不同?而詞色與詞意結果不顯著的原因?
Ans:自動歷程的連結是比較強的,我們覺得可能是因為這個原因所以不會有太大差異。
5. 正確反應時間與錯誤率之間的相對意義?
Ans:如果一般情況下,反應時間長,錯誤率應低,因為思考時間較長。我們覺得影響他做出錯誤決定與反應時間長短的歷程與原因是不同的。
6. 總共題數有 96 題,有否受試者在實驗過程中,有過於極端的情況出現時的處理方式?
Ans:如果有產生極端數值,會予以刪除。
7. 請問在實驗過程中,相關詞呈現出來後的反應時間有限制嗎?
Ans:無限制,因為反應時間長短可能代表受試者被干擾的程度。
8. 請問再選擇受試者時,有沒有排除有色盲的受試者?
Ans:有在問卷中事先詢問,事後會排除其數據。
9. 色塊的四個顏色選擇的方式?
Ans:與 stroop 的實驗選擇的顏色相同,並未做其餘考慮。
10. 是否有發現到某個色塊在某個詞的時候,受試者的反應比其他色塊的情況還要明顯?
Ans:沒有過度細分,可能有機會可以再做討論。
11. 在 96 次的嘗試中,相關詞的出線機率比例是相同的?
Ans:是的,且使用隨機分派的方式出題。
12. 會不會有詞優或者字優效應的問題?
Ans:我們是以事前問卷的結果來決定相關詞的選擇。
13. 前測問卷與正式實驗中的受試者有重複到的情況嗎?
Ans:均不重複。
14. 相關詞的決定與選擇方式?
Ans:在前測調查過後以其結果選出較適合的來決定。
15. 有沒有可能性別的差異會造成不同的結果?
Ans:性別在這次的實驗中並非我們想討論的主題,因此並沒有將性別列入控制的變項中。
[編輯] 【老師回饋部分】
1. 實驗本身複雜度高,所以基本上台上的同學報告時需要比較清楚的表現與解釋,在報告時盡量避免使用代名詞,使用適當的名稱報告,比較不會讓台下的同學混淆,雖然有螢幕輔助,但是主要還是口頭報告為重,但是過多的代名詞可能會讓台下的同學不小心就混淆了。
2. 數據的檢驗重要,例如極端值的刪除,極端值的刪除應該有個標準,且應有適當的理由說服大家怎樣的數值是個合理的極端值所以應該被去除。
3. 順序排列用隨機的原因是用來避免一些特殊效果,所以用隨機是一個常見的處理方式,也比刻意去排列實驗順序的情況來得好。
[編輯] B班實況:
[編輯] 【同學提問部分】
- 關於實驗相關部分
1. 在Stroop效應中,它的文字是代表它的顏色,可是實驗中的文字是相關詞,這樣子對Stroop效應會不會有影響?
Ans:色塊和相關詞的部分是引用T-scope,不是引用Stroop effect,Stroop部分是利用來作顏色的干擾。而且實驗目的是要探討色塊和相關詞的連結性,所以不會用顏色文字來作。
2. 錯誤率的計算方式為何?
Ans:錯誤題數/該組總題數,例如錯3題,而那一組的總題數24,3/24。
3. 在討論部分有提到在詞色不和諧與詞義不和諧,它的錯誤率和RT皆高,實驗提到的例子可否在作一下說明?
Ans:例如西瓜、香蕉和蘋果都是水果類,會讓比較搞不清楚是香蕉、蘋果、芭樂或香蕉、蘋果、鳳梨,但若是香蕉、衣服、桌子他們三個是不同類型的話,會讓人比較容易記憶。
4. 為什麼沒有控制受試者的反應時間,因為若不控制反應時間,受試者可能是經過思考後才回答答案,而導致錯誤率的降低?
Ans:當初設計實驗的時候沒有考慮到設計時間一到就跳下一題的方式,後來發現如果設計秒數的話,不太能抓,可能受試者還沒反應完就跳到下一題,那題目一跳的時候,腦筋又空了一次。而且在指導語有要求受試者盡可能的快速作答,所以在實驗受試者只要一想到就會快速作答,應該不會有停頓思考很久的情形。
5. 因為實驗是先給色塊,再給詞色和詞義,我自己有參加過實驗,在作的時候可能色塊跳走,看到相關詞的時候,會忘記色塊是什麼,所以會用詞義和詞色受否相同來判斷,所以才會導致詞色、詞義皆和諧反應時間較慢,另外三組反應時間較慢;在錯誤率方面,因為詞義、詞色皆和諧與皆不和諧都相同或都不同,所以可以瞬間反應,不用再回頭想,所以錯誤率較低,而詞色或詞義不和諧,會覺得他們是不一樣的,而忘記去回想色塊的顏色,而導致較高的錯誤率。
Ans:色塊的時間有受試者和我們反應太快或太慢,已經做過修正。但若受試者真的忘記色塊是什麼,這是我們所無法控制的。
6. 在Stroop裡面是用「字義」和「印刷的顏色」,讓受試者判斷真正字的顏色是什麼;而在這次實驗中,是用「相關字」讓受試者判斷「是」與「否」和諧,會不會是色塊相關字的印刷去影響到反應時間,而不是詞義真正影響到和不和諧的判斷?
Ans:當初實驗設計是要讓受試者反應色塊和字義,放入相關詞是要看它有沒有被受干擾。
7. 請問會不會有「疲勞效果」的產生,而發現受試者在後半段的錯誤率較高?
Ans:但是實驗前有告訴受試者,在實驗過程若感到疲勞可以休息後再繼續,所以應該可以排除掉這項可能。
8. 題目每一題答完就會給一個回饋,請問回饋的方式是?
Ans:只有練習題的時候有回饋,後面正式施測實不給回饋。
9. 詞色和詞義不和諧這部分,如果把它方在同一個page的話,這樣就能同時間接受到刺激,因為不知道接受刺激的時間點是否有影響?
Ans:這樣受試者可能不會記得色塊的顏色,而是以後面是否相同來比較。
10. 假設海洋是藍色,色塊是藍色,要按是。但原本色塊和字義就已經會干擾,現在還採用相關詞,思考歷程要多一個步驟想說海洋是藍色,反應時間一定會比較長,那作這個的實驗目的為何?
Ans:我們是用色塊和詞義去作連結,Stroop是色塊和字的顏色。我們在作Stroop的實驗的時候發現,最後都會去看旁邊的角,不會直接去看紅那個字,就不會受字的干擾,所以才想說利用相關詞確定受試者有接受到詞義的影響。
11. 之前作Stroop的時候,剛開始會受到字的意思的干擾,但最後會學習像是看邊邊的角去避免干擾,同樣的在這次實驗中,是否有在實驗之後訪問受試者到後來有沒有學習到一些short cut去判斷?
Ans:這是受試者個人的差異,實驗很難去避免。當初試驗前組內操作時的確有發現捷徑,但是我們認為是操作過很多次才會發生。另外,會選用相關詞是為了避免在Stroop中只看邊邊的角或其他方式的捷徑。
12. 實驗共分四組,每組24題,在皆和諧的部分最多只有8個配對,那是不是會重複3次。那會不會是因為其他的組別每個配對都只出現1次,在皆和諧的狀況之下會出現三次,會不會是重複出現導致反應時間和錯誤率都比較少?
Ans:其他組別也會出現重複的狀況,因為四組96題我們是全部隨機出現,所以做到重複會已經過了很多題。
13. 為什麼要選用相關詞而不是選用像Stroop一樣的字的顏色,因為像是「紅」,這是一個自動化的歷程,而如果用「海洋」還要多一個回想的歷程,但並沒有辦法控制每個人的連結強度和回想速度是一樣的,這樣是否會導致更大的誤差?
Ans:會選用相關詞是為了避免在Stroop中所會使用的捷徑,雖然無法完全避免個別差異造成的連結強度不同,但已經盡可能發問卷去採用最好的相關詞。
- 關於相關詞的編製
1. 因為每個人對詞義顏色的看法不一樣,你怎麼知道前測的那批受試者的看法可以代表之後施測受試者的看法?
Ans:我們前測的時候已經盡可能排除掉模稜兩可的詞彙,我們所選用的相關詞彙選用連結性較強的。
2. 在聯想顏色的時候,像是陽光不能直接聯想到黃色,要探討反應時間它的相關字本身就不太好聯想到顏色,所以最後到底是顏色的影響,或是各個相關詞聯想時間的不同所影響並不能確定?
Ans:有考慮過這個問題,但這是無法避免的,已經發過問卷盡可能挑選最好的詞。
3. 因為相關詞的聯想速度並不同,有沒有想說去查詞頻?挑選詞頻較接近的?
Ans:最初有想要找詞頻但發現有困難,詞頻中找不到那些字,我們有將模糊的部分排除掉,再選擇出現頻率比較差不多的。
- 實驗建議
1. 應競爭理論中,在辨識物品歷程的部分,是比較平行的,反應的歷程較快;反應的階段是序列的,因為在這裡產生衝突,所以反應會比較慢。有沒有可能是受試要同時反應詞義不和諧和詞色不和諧的部分,它的歷程不太一樣而導致錯誤率較高,而不是它看起來比較不一樣?
Ans:分析實驗結果也找了很多理論佐證,但我們並不知道哪一個是最好的,我們盡可能把我們想到認為可能的因素列出,謝謝你的建議。
2. 在前測發問卷的時候是採用「紅色血液、春聯」,但是施測的時候卻是採用「血液紅色」,若p則q但是不等於若q則p(p→q=~q→~p),所以在前測的部分應該是要以物件來讓受試者判斷什麼顏色,這樣才與之後試測相符。
[編輯] 【老師回饋部分】
- 這實驗要解釋相當困難,不過歷程的部分的確是要考慮到,這當中可能還有一些問題,在他們的分組當中,皆和諧和詞色不和諧是按Yes,詞義不和諧和皆不和諧是按No,這當中很可能會產生差異。
- 還要考慮到它的傾向上,反應時間和錯誤率並不一致,反應時間皆和諧是最短,其他三組是一樣;但是在錯誤率皆和諧和皆不和諧它的錯誤率比其他兩組來的低。這種情況下若想要以一個歷程去解釋這四組的差異,一定會碰到問題。這當中可能不止一個歷程去影響到實驗,這是實驗組還要再釐清的部分。
- 基本資料要在報告時準備,放在旁邊被問的時候才能回答較具體的答案。
[編輯] 我愛腫子
我愛腫子讀書會之成果報告期初報告
2008年5月16日
[編輯] A班實況:
[編輯] 【同學提問部分】
1. 計分方式為何要使用五點量表?
Ans:因為怕選項太多無法在短時間內反應,因此使用五點量表。
2. 在五點量表中,若當受試者勾選不清楚的選項,該如何計分?
Ans:如果選填不清楚的話,就不計算分數。
3. 能解釋你們的實驗結果中,統計上達顯著的意義?
Ans:就是我們操弄的實驗對因果知覺有影響。
4. 會不會因為作答時間太短,所以在五點量表中偏向選擇高分?
Ans:因為我們希望受試者是用直覺判斷,不要經過太多的思考歷程,因此設定較短的作答時間。
5. 文獻回顧中討論到練習效果對因果知覺效應有影響,可是在你們的實驗中似乎沒有討論到練習效果對於實驗的影響?
Ans:主要是回顧之前的文獻內容而已,避免有雙重引用的問題。因為其實在張建妤文獻中也是回顧前面的文獻。
6. 想請問在延宕時間的設定超過 153 毫秒時會使得受試者不會對此類撞擊事件產生因果知覺,這樣的數字是絕對數字或者?又為何在妳們的實驗中選擇 150 毫秒這種跟臨界值這麼相近的延宕時間?
Ans:在 Schlottmann 與 Shanks 的實驗中發現在 153 毫秒的延宕時間時是比較明顯的分界點,至於選擇 150 毫秒做為實驗的延宕時間則是因為 flash 軟體使用上的限制。
7. 會不會有可能是你們的方塊速度移動太快,而其實受試者沒有看懂或者看清楚就回答而造成錯誤,如果有這樣的情況該如何處理?
Ans:所以我們有設計刪除樣本資料的限制,當符合或滿足該限制的資料會予以刪除不列入統計分析。
8. 因為你們的實驗只是要是否有產生因果知覺效應,那為什麼不直接用有產生與無產生做為給予受試者回答的量表就好,而需要用到五點量表?
Ans:需要知道所產生的效應強度,而且各組間有比較,所以用五點量表較為適當。
9. 在題目投影片撥放的過程中,方塊的大小好像有一些差異,會不會造成實驗上的誤差?
Ans:這是我們技術上的問題,期待不會有差異,未來還有改進的空間。
10. 人為事件中,方塊運動方式的決定是怎麼去決定的?
Ans:依循文獻的實驗設計。
11. 為什麼不採用組間設計的方式設計實驗,更能夠確定自然事件與人為事件對此效應的影響?
Ans:基本上也是依循文獻的實驗設計方式作為我們這次實驗的實驗設計參考。
12. 文獻中提到關於練習效果對於因果知覺效應的影響,那為什麼在妳們的實驗中還要放入練習題?
Ans:為了確保受試者對於實驗過程沒有問題,而文獻中所提到的練習效果是指練習次數,意思是說當練習題數增加時,可能對因果知覺的影響。
[編輯] 【老師回饋部分】
1. 統計上達顯著的原因需要很清楚,且在報告時也應該有清楚的解釋。
2. 台上回答時,先想到的可以先回答,不一定每次同學提問時都要開小組會議,容易浪費時間,但是也避免都只有固定某個人再回答問題
3. 台下同學發問時,如果台上的同學聽不清楚或者不了解問題,可以先用自己的方式重述一次確認問題的內容以後,在進行回答。
[編輯] B班實況:
[編輯] 【同學提問部分】
- 實驗相關問題
1. 這裡的「人為事件」是指短時間無法用個人的經驗解釋兩物體間的關係,那既然無法用個人經驗去解釋兩物體間關係,那這裡的因果關係是什麼意思?
Ans:因為操弄得時間較短暫,實驗室想探討在這兩種情況下,我們比較容易得知受試者是否比較容易形成因果知覺,實驗發現在人為事件是較不容易形成因果知覺。
2. 受試者有無可能因為視覺疲勞現象而對實驗的結果產生影響?
Ans:雖然影片的長度常約10min,但在指導語部分有確定受試者受否看的清楚,在實際作題只有3~4分鐘,所以應該不會有視覺疲勞效果。
3. 在文獻中有提到練習效果對因果知覺有影響,那麼在這次的實驗中有發現嗎?
Ans:因為這次的實驗是要探討明度配對對因果知覺造成的影響,所以在練習效果這方面並沒有去探討。
4. 文獻是採用七點量表,而實驗為什麼要採用五點量表?
Ans:七點量表的間隔太多,受試者在短時間內可能沒有辦法很精確的判斷說他到底要填哪一個,所以採用五點量表讓受試者比較好判斷。
5. 根據練習效果對因果知覺是有用的,每個人的題目是一樣的,到最後題目不會有練習效果嗎?
Ans:在文獻中提到自然事件妳作的越多次的話,練習效果就會降低;在人為事件中,作的越多次的話,練習效果就會提高。因為我們沒有連續的自然事件或連續的人為事件,而且並沒有操弄練習的次數,所以應該不會有練習效果的影響。
6. 請問明度配對達顯著的意思是?
Ans:顯著的意思是指這樣的操弄樣下對因果知覺是有影響的,更容易或更不容易形成因果知覺。
7. 實驗結果的地方,自然事件和人為事件的平均數看起來都只有差一點點,但是兩個統計跑出來均有達到顯著,有沒有可能是原本是七點量表,後來改成五點量表所造成?
Ans:因為五點量表有可能因為不夠細緻的原因,導致兩事件的明度配對皆達到顯著,之後會再作更細緻的量表探討,看看是否有差別。
8. 在自然或人為事件中,碰撞的過程是採用正方形,請問為什麼不採用圓形呢?圓形感覺似乎比較有運動的感覺。
Ans:選用方塊是因為引用張建妤的文獻,在文獻中使用方塊所以我們也跟著使用方塊。
9. 人為事件的配對有六個,去掉黑黑、灰灰和白白,自然事件是不是也應該排除掉這三種因素?
Ans:因為自然事件和人為事件的運動過程是不一樣的,自然事件是A方塊撞倒B方塊,然後B方塊出去;但是人為事件是A方塊穿越B方塊出去,所以自然事件沒有任何有關於辨色的效果,但是人為事件必須要有辨色的效果,因為黑黑、灰灰、白白明度尚沒有差異,所以在人為事件中並不採用。
10. 在實驗的結果是明度配對未達顯著,請問什麼會有這樣的結果呢?
Ans:事件的影響太大,在自然、人為事件中明度的配對是達到顯著,但是事件的影響遠大於明度的影響。
11. 既然題目要探討的是明度配對的話,為什麼不直接選用自然事件或人為事件就好,這樣受試者對明度的反應可能會比較好。
Ans:因為實驗大多是由張建妤的實驗延續下來,只是想單純加入明度配對,並沒有好好去思考實驗的過程,在未來的設計可能要讓實驗在單純一點。
12. 影片結束之後有三秒的作答時間,請問這三秒是怎麼來的,會不會受試者還來不及反應就已經跳到下一題,看下一題的時候還受到上一題的影響?
Ans:三秒並沒有找到相關文獻,所以是在前測的時候觀察受試者的作答時間得出來的結果。
- 樣本刪除部分
1. 刪除樣本是針對人為事件來刪除的嗎?
Ans:自然事件和人為事件都有,就是如果相同的題目,但受試者兩次反應都不一樣,就會把它刪除。
2. 剛剛有提到平均數是2點多,小於3就會把它刪除,這裡的平均數是指五點量表嗎?
Ans:是指前後不一致的題數,而不是五點量表。
3. 為什麼要把前後不一致的樣本都刪除,而不把它列入都可以採用的數據?
Ans:因為我們想確定受試者的穩定度,若受試者很多題都前後不一致的話,就代表受試者的穩定性不高。
4. 實驗樣本是59位高雄醫學大學的學生,有效樣本是38人,是否有去討論為什麼刪掉20多位的原因,是因為實驗的過程中有問題,還是刪題的標準有問題,是否有再去討論?
Ans:因為受試者平均反應不一致是2點多,所以超過3題我們認為穩定性不高所以把它刪除,在討論部分也提到在日後實驗受試者實驗後,會詢問受試者的作答狀況來探討原因。
5. 實驗的樣本刪掉將近一半會不會太多了?
Ans:因為前測跑出來結果只需要24份樣本,所以可以作這樣的篩選。
6. 在後面自然差異或人為差異平均都很小,會不會是在前面篩選樣本就已經刪掉約四成的樣本,把那些差異值都刪除掉了,有沒有探討過為什麼那些差異值前後選擇會不一樣呢?
Ans:這部分可能是我們沒有考慮到的,之後實驗會再詢問受試者的思考歷程,再決定是否篩選樣本。
7. 實驗最後的結果可能還是受刪題所影響,請問在實驗後有無去跑未刪題59位的數據?
Ans:沒有,之後會再跑統計看看。
8. 因為刪題是以平均數高一點下去刪,那們不管樣本數為何,最後一定會刪掉將近一半左右,是否需要找相關文獻來佐證刪題的標準。
Ans:這是實驗沒有考慮好的地方,之後會再找相關文獻佐證。
[編輯] 【老師回饋部分】
- 統計應該再跑一次,應該在去找統計老師一次,尤其樣本刪成這個樣子真的是有問題。
- 刪樣本必須要小心,這樣人為的操弄可能影響到數據本來的自然分佈,得到的可能只是你要的,而不是真正存在的情形。
- 統計重跑一遍,敘述可能會不一樣,可能需要重新修改。
[編輯] (請填組名)
2008年5月23日
[編輯] A班實況:
[編輯] 【同學發問部分】
1. 和諧度的判定標準?
Ans:依據文獻中的方式引用。
2. 在文獻回顧第二點中提到視覺記憶的數量大約只有四項,超過就會過載,為何在實驗中題目中選擇十項?
Ans:實驗設計純粹依據文獻,並沒有考慮太多。
3. 改變物的改變度在題目中的比例?
Ans:有控制題目呈現內容,從文獻中取樣,所以圖片中物體數量均相同。
4. 回答時有要求回答的答案品質之類的?
Ans:有要求越詳細越好,但如果有提到相似答案即可算答對。
5. 作答的題數會不會太少?造成統計上偏差?
Ans:這是主要操弄的部分,且人數上有控制,也害怕有練習效果,因此有特殊考量。
6. 多場景的原因?為何不採用一對一的設計?
Ans:怕情境單一影響太大,且因為主要是參考文獻設計。
7. 圖片呈現的時間會不會太短,造成受試者並沒有辨別出差異?
Ans:參考文獻設計,且事後與受試者參詢後決定不改變。
8. 物件的大小比例會不會影響受試者判別?
Ans:此部分由於題目是用隨機分派的方式,應不會造成影響。
9. 前測與正式實驗的差別?
Ans:修改與減少圖片內的物件數量,排除較繁複的圖片。
10. 受試者數據的採用?有無排除極端資料?
Ans:基本上全採用,且因各題目信度不同,不太需要刪除數據。
11. 圖片中,物件改變的發生位置?
Ans:隨機處理。
12. 正確率的判定?有無防止作假或猜題的設計?
Ans:無防止作假的設計,只要改變判定與物體敘述均正確即判定答題正確。
13. 題目呈現前,倒數的原因?
Ans:怕受試者沒發現圖片已經改變,所以設計這樣的設定。
14. 作答時間有無限制?
Ans:基本上無限制。
[編輯] 【老師回饋部分】
1. 統計上有差異性可以是大家問問題時的一個重點。這個實驗很多地方,會有混淆變項的部分還蠻多的。例如刺激進來的方式可能會有關。
2. 報告前能夠盡量早點來找老師盡量早點來,老師也需要時間消化各組的報告內容。
[編輯] B班實況:
[編輯] 【同學提問部分】
1. 請圖片出現兩秒是怎麼樣確定的?
Ans:是根據文獻決定的。
2. 改變物件的位置,有時候是發生在正中間,有時候是發生在邊邊,這樣是否會影響到受試者的正確率?
Ans:物件的位置改變,都是控制在比較偏中間的框框中,且同物件改變的位置,在下一場景會出現在它的相對位置,而不會突然跳到旁邊。
3. 在文獻中提到,「當視覺記憶的數量大過某個極限(通常此量大約只有4項),則視覺記憶就會過載(overloading)」,但是在實驗的場景中,每個場景出現物件都不止四個,會不會導致受試者過載的現象而無法記憶?
Ans:在另外一篇文獻有提到,盲視做出來較穩定的效果是10~14個物件,在前測的時候受試者有反應物件太多而記不得,所以實驗已調整到最少物件達到最穩定效果,就是每個場景都是10個物件。
4. 每個改變物件的刺激強度不同,如何去控制改變物件的強度?像是物件中的杯子,改變的只有形狀,強度感覺不大,不管是同類別或不同類別強度一定不同,要如何去控制?
Ans:實驗中採用和原本物件形狀差異不大,且在畫面比例也是差不多,不會有變的過大或過小的情況,顏色方面沒有特別控制,但也不會選用反差過大的。
5. 每個受試者只給予三題施測,但題數過少很容易受到例如物件位置、顏色等干擾,很多干擾沒辦法平衡掉,而達到統計上的顯著?
Ans:因為實驗的場景太少,如果在同一個場景更換不同物件重複給受試者施測,受試者可能會記憶場景中的東西,如果要增加題數,日後可能要增加場景的組合。
6. 實驗中第二張都是出現不和諧,那麼在下結論的時候,是不是不能確定如果不和諧辨識率較高,而只是如果在第二張照片出現不和諧東西辨識率會比較高,而不是說兩張照片的和諧度有差異時辨識率會較高。
Ans:實驗是物件變換到和諧與變換到不和諧去比較,而不是同一組兩張去作比較。
7. 請問有無控制受試者與螢幕的距離和角度?因為之前有說物件改變的位置大都控制在中間,那麼很可能隨著受試者作的位置不同而有所差異。
Ans:受試者都是坐在電腦螢幕前施測,沒有辦法控制受試者到底離電腦多遠,是以受試者認為可以看到最清楚的位置來調整。
8. 要在兩秒之中發現改變的物件其實時間還滿短的,而且物件的連結強度其實並不相同,請問是如何決定要改變的物件?
Ans:在文獻中場景和物件有一個表,我們是從其中的20個挑選10個,雖然每個物件的強度不相同,但在每個場景中作了12個不同物件配對,希望能平衡掉不同物件強度的因素,而每個物件改變也盡量挑選大小、比例相符的物件。
9. 在沒有改變的部分,它的答題正確率是最高,可是信心程度是較低,會不會是受試者只要忘記或發覺不出物件改變,就會都判斷成沒有改變,而導致信心程度較低?
Ans:因為實驗要討論的是會不會有變盲效果的出現,變盲效果是說看到圖片覺得自己有看到,其實是沒有看到的,無法去察覺場景的改變。在實驗結果中,每有改變的選擇是最多人的,受試者可能是察覺到沒有改變,或是看不到而勾選沒有改變,所以勾選無改變之後覺得沒有信心,而導致信心程度降低,所以就是因為出現變盲效果的現象,才會導致這種情況發生。
10. 在文獻的第二項有提到「當視覺記憶的數量大過某個極限量(通常此量大約只有4項),則視覺記憶就會過載(overloading)」,那請問實驗中有控制每個圖的數量嗎?
Ans:根據另外一篇文獻10~14個物件做出的實驗效果是最為穩定,所以這次實驗控制在每個場景都是10個物件。
11. 在有桌子、花瓶那個場景中,有兩個改變的東西,會不會有受試者回答是胡椒鹽罐的變化?
Ans:這是實驗沒有控制好,不過受試者都沒有注意到胡椒鹽罐的變換。
12. 在和諧和不和諧場景在統計上比較有非常顯著的差異,但在一般比較上不和諧的物件本來就是比較容易被注意到,所以在定義和諧和不和諧上是不是應該更清楚?
Ans:和諧度是這次實驗與文獻中不同的操作地方,實驗的確有需要進一步定義好一點的和諧度概念,但是初步的實驗我們是採用若和諧度稍微有一點改變,那麼它的變盲效果有沒有影響,變盲效果有沒有存在,所以重點還是再探討變盲的情況。
13. 有時候再看第二張圖片的時候,已經忘記第一張圖片是什麼,像有一個場景的第二章圖片,我是覺得滑鼠擺放在那個位置很奇怪,所以可能會猜測滑鼠是改變的東西,那這樣就不是實驗所想要的效果。那如果能把第一張與第二張圖片調換的話,不和諧的情況先出現,這樣是否比較能出現實驗所想測到的效果?
Ans:實驗的目的並不是要受試者回憶第一張圖片看到什麼,受試者看到第一張圖片是在非常快(2s)的時間完成,所以主要是看受試者有沒有發現圖片中有不一樣的地方出現。
14. 因為在實驗中不論自信程度高低都採用其數據,但是若受試者沒有發現改變,就是用猜的,所以信心程度偏低,而實驗有採納其數據,會不會因此導致正確率有顯著的差異?
Ans:剛開始是沒有加入信心程度,只是單純想要知道有沒有改變;之後之所以會加入信心程度是想要瞭解受試者在答題的肯定程度有多少。受試者如果沒有察覺到改變這就是變盲效果;但如果說是環境沒有改變,受試者沒有察覺到改變,又確定環境沒有改變,這有事另一種效果,不是這次實驗討論的範圍。
15. 受試者若看到有改變必須寫出看到的物品是什麼,但是若是知道圖片有改變,但是卻不知到改變的東西是什麼,例如看不出圖片上的東西是滑鼠,那麼該怎麼處理?
Ans:受試者不一定要寫出確切的東西名稱,也可寫出改變的區塊大致的位置,最後實驗結束後也會和受試者口頭在確定一次。
16. 若受試者很多提的信心程度都非常低的話,還納入數據中,會不會造成實驗結果有非常大的差距?
Ans:實驗沒有刪除的原因是假如都是勾選信心程度1分,可能是受試者對答案較為保守,換個角度想受試者的作答基準還滿一致的。
17. 實驗中控制每個場景都是10個物件,但是很多物件可以combine一起看,或是分開看,那麼是如何區分10個物件的?
Ans:實驗定義10個都是從文獻中找出的,當然受試者也可能把杯子看做三個部分,這是個人的差異,並沒有辦法知道其歷程的變化。
18. 在一開始報告時的示範圖片,飛機是以消失作為改變,若是以物品消失作為改變,會不會比較單純,也能突顯和諧與不和諧,那為什麼後來會想採用置換物品來作為改變?
Ans:因為實驗想探討的是和不和諧,主要是看物件和背景和不和諧,所以會用形狀、比例相近的東西置換,若是採用消失的話,受試者很可能只是單純察覺到東西好像空了,而不是和不和諧。
[編輯] 【老師回饋部分】
- 有些東西是沒有辦法控制到非常精細,譬如物品的出現頻率應該是沒有這樣的統計,因為這樣的統計沒有價值,這樣的物品出現頻率找不到,找不到還要問實驗組為什麼沒有作,這就有點強人所難。
- 和諧和不和諧這種東西很主觀,可能需要更清楚的定義,但這也難以作數量化的定義。
- 不能因為在台下沒有看到而推測大家都沒有看到,沒有看到是因為很多原因造成當時沒有看到,但數據上可以發現有人看到有人看不到,我們發現在不同的條件下,看的到和看不到的比例不同,作實驗的目的就是在這裡。
- 沒有特殊的原因,絕對不要剔除受試者,因為有時候可能是很多原因造成,這也是應該把它放入統計。
[編輯] I'm 殺組
2008年5月30日
[編輯] A班實況:
[編輯] 【同學發問部分】
1. 依變項使用答題錯誤題數而不使用正確率的原因?
Ans:使用過,但結果不顯著,因此改用答題錯誤題數。
2. 題目設計是否有避免猜題的設計?
Ans:題目設計主要是依循文獻,並沒有新增功能。
3. 是否有可能會因為主試者在旁而造成受試者壓力而影響結果?
Ans:這部分因我們的實驗過程已標準化,且我們並沒有討論這部分可能的影響。
4. 有沒有控制閱讀時間?會不會有受試者閱讀時間非常長的情況,如果有,請問該受試數據的處理方式為何?
Ans:並無限制閱讀時間,也沒有遇到受試者閱讀時間非常長的情況。
5. 實驗程序中,兩次干擾安排的原因?
Ans:避免受試者在空白時間或者閒置時對事件回憶。
6. 在實驗過程中,視覺時間持續造成疲累,因此文字事件錯誤率大於聽覺事件?
Ans:圖文不同歷程,並無注意,所以認為無影響。
7. 在實驗過程中,是如何決定干擾三分鐘這個長度的時間?
Ans:主要是想要測短期記憶下的效果與影響,所以干擾是要避免回憶的動作以及避免形成長期記憶。
8. 討論與假設相反的原因?有沒有更深入的探討?
Ans:可能是因為故事有敘述性、受試者的自由控制或者疲累效果等均有可能造成這樣的結果。
9. 故事的選擇有沒有經過特別的篩選或處理?
Ans:剛開始的時候並沒有注意到這點,所以基本上是沿用與文獻相似的故事設計,可以再做討論。
10. 在實驗程序中經由一系列圖片誤導後可能的影響沒有討論?
Ans:圖片誤導的主要用意為避免回憶,且可從結果直接判別事件的影響,因此並沒有做更深入的探討。
11. 圖片更換與顯示的時間是否有特別控制?
Ans:均有適當的控制。
[編輯] 【老師回饋部分】
1. 這個實驗的記憶是長期記憶還是短期記憶似乎不太能夠下定論,雖然比較偏向是短期記憶,但是與早期對短期記憶相關的研究中似乎還是有一些差異。
2. 這個在跟老師的討論過程中,對老師來說是有一定的繁複性,但是報告前才來找老師,也需要給我時間讓我有時間去做修正。
3. 剩下的組別也不多了,最好還是能夠稍早有比較完整的稿件來,太晚來老師會措手不及。
[編輯] B班實況:
[編輯] 【同學提問部分】
1. 「文字呈現組」比「看+唸組」錯誤率還要高,但是在「文字呈現組」中受試者可以觀看閱讀的速度,重複去觀看,錯誤率應該會比較低,那為什麼實驗結果錯誤率卻是比較高的呢?
Ans:可能是「看+唸組」多了聽覺的刺激,可是這兩組的結果是不顯著的,可能是因為重複觀看或隨意略過的混淆變項,造成這兩組的結果不顯著。
2. 實驗結果是「聲音呈現組」有較低的錯誤率,會不會是因為「文字呈現組」的閱讀方式是一段一段的看,而「聲音呈現組」因為念的語氣的關係,會讓受試者比較容易抓到重點,例如「深藍色的(稍作停頓)房子」,會不會因為這樣的因素而導致錯誤率較低?
3. 在討論的部分有提到:「在聆聽的過程中,受試者會將聽到的內容轉化為圖像。」這時候的受試者是以圖像來記憶;可是後面一系列的圖片誤導,受試者也是以圖像來記憶。會不會因為這兩者間都是以圖像來記憶,所以「聲音呈現組」受到的干擾較大?
Ans:我們實驗中的圖片比較特別,一般人在想像中比較不可能去想像這麼童話、奇怪的人的圖片,所以干擾應該不大。
4. 實驗中「文字呈現組」的九百字是如何決定的?會不會是因為字數太多而有較高的錯誤率?
Ans:第一個部分是是參考證人記憶的文獻,證人記憶通常是以故事作為題材,所以在這次的實驗是以故事來呈現;第二個部分是因為我們先找到影片,在根據影片內容去撰寫故事內容,讓文字和影片內容能夠相符合,才會有這九百字的。
5. 實驗的目的是在探討以聲音或文字方式呈現事件時,若以一事件於後將其干擾,兩者之間何者較容易被影響。那為什麼第三組是採用「看+唸組」而不是採用「看+聽組」,如果是要比較聲音和文字的差異,「看+聽組」是不是比較恰當呢?
Ans:因為若採用「看+聽組」,實驗非常難以控制唸的速度。且根據文獻「聽」的時候,會轉換成文字的記憶,這樣很容易和「看」文章產生干擾;如果是採用「唸」的話,剛開始發音的歷程有會有干擾,但慢慢的這些干擾會逐漸消失,所以最後才會採用「看+唸」的方式。
6. 文獻中是以英文作為研究的材料,而這次實驗是以中文作文研究材料,但英文是表音的文字,中文是表義的文字,是不是它在記憶編碼原本就有很大的差異,是否有找到文獻佐證兩者的差異?
Ans:這次的實驗中沒有找到關於中文和英文兩者之間歷程不同的文獻。
7. 實驗設計採用「看+唸組」,但你唸的時候要先透過你的發音再轉到聽覺歷程,這中間過程不知道會發生什麼干擾,如果改成「看+聽組」會不會更來的直接,造成的干擾也較少?
Ans:今天如果你聽到「有一隻河馬領軍的海賊團」,你聽到的速度跟你唸的速度如果不一致的話,造成的偏誤會更多。
8. 在「聲音呈現組」可以發現錄音檔唸的速度是比較緩慢的,這樣受試者有多餘的時間把聽到的內容轉換成記憶,可是在「文字呈現組」,會不會是受試者很快的看過,只有到編碼的部分,並沒有將這些編碼轉成短期記憶,會不會是這樣的因素,導致「文字呈現組」有較高的錯誤率。
Ans:在「聲音呈現組」部分不可能非常快速的唸過,因為受試者很可能聽不清楚或聽不懂,而在「文字呈現組」方面,我們也沒有辦法去確定受試者是快速或緩慢看過,不過在實驗過程中的觀察,受試者都是很認真的在閱讀。
9. 題目的分散程度怎麼樣,是按照順序排列,還是打散在裡面?是著重在故事的那個部分?另外有無做過統計看看是哪一部份的題目錯誤率較高,如果是事件前面的錯誤率較高,有可能是因為自然遺忘所造成。
Ans:題目是滿分散,而統計結果並沒有發現哪一部份的錯誤率特別高,可能是題目設計上太過簡單所造成。
10. 「看+唸組」唸的部分好像是輸入到大腦之後,在把它輸出,可是今天作的是「聲音與文字對記憶的影響」,是不是播放錄音檔,然後配合著文字閱讀會比較有關?
Ans:看的速度很可能跟聽的速度不同,這是一個混淆變項沒有辦法去掌握它。
11. 之前都在討論唸的速度與看的速度的問題,那麼有沒有可能是依照錄音檔的速度來呈現文字,例如唸「深藍色的房子」,螢幕上就出現「深藍色的房子」,有沒有這種可能?
Ans:如果看的速度較快,可能在唸的過程中已經覆誦了好幾遍,兩者之間還是可能有干擾的存在。
12. 前測的目的是為避免日後實驗發生偏誤影響,排除掉誤差,那麼在前測的時候有發現到題目的設計上太過於簡單的問題嗎?
Ans:前測的時候有發現答題錯誤率低的問題,但當時猜想可能是樣本數過小的問題,所以正式施測提高樣本數應該就可以避免,但後來發現錯誤率一樣很低,才發覺很可能是題目設計過於簡單所造成。
- 對實驗的建議
- 對於中文文字的歷程回憶,之前曾志朗、洪蘭、王士元曾經有作過相關的研究可以參考採用。
- 今天實驗作的主題是「聲音與文字對記憶的影響」,但是你們中間卻使用一個證人記憶的干擾方式,但如果只是單純探討聲音與文字對記憶的影響,直接在文字呈現/聲音呈現/看+唸這三組後面,穿插數學干擾題,然後直接測量它的反應時間與錯誤率就好,沒有必要在作證人記憶的誤導,因為多了證人記憶的誤導會讓實驗結果不知道是實驗影響或證人記憶的影響,還是有其他可能,照中間有很多的干擾。
[編輯] 【老師回饋部分】
- 作的過程中或設計的方式,可能有一些需要調整好,想像的到的confounding,唸的方式好或聽的方式好這當然可以討論,雖然實驗有一些可能的干擾,但實驗數據做出來是有差異的,當然他們有他們的解釋,但這解釋是否正確呢?這一組在一定要特別解釋,觀看和聽之間有顯著差異;在其它組別比較沒有顯著差異,並不代表它一定相等。就像去法院無罪不代表沒有犯罪,無罪是證據不足,法律上的情形跟統計上的情形是一樣的,在沒有證據之前,內定大家是無罪的;統計也是一樣相信大家是一樣的,有不一樣才說有顯著差異,雖然一樣的部分不一定是真的一樣,不必一直討論它是否一樣;但是在真的有差異的部分,一定要特別去解釋,利用理論方面來作說明,看起來似乎要琢磨一下。
- 實驗的設計和過程存在著瑕疵,但是最主要還是要把有顯著的部分解釋清楚,其他的部分留作日後改進或建議,重點應胎是顯著差異的部分。
[編輯] psycho@ Leipzig
2008年6月6 日
[編輯] A班實況:
[編輯] 【同學提問部分】
1. 文章的性質為何?例如是否均為故事性性質的內容或者有其他的比例分配?
Ans:基本上無限制,包含故事性、時事等均包含,但挑選時為隨機挑選。
2. 對於延遲這個詞的操作型定義為?
Ans:參考可能比較有公信力的資料,如 wikipedia 及統合各文獻的定義。
3. 年齡對於閱讀與網路使用上有差異,請問實驗中受試者的年齡層分佈,或者主要的受試者年齡層為?
Ans:並無精確的限制,大多以大學生範圍為主。
4. 有無可能有信別差異,例如可能在火星文的使用上以某性別較為廣泛 ... 等?
Ans:並無相關文獻可參考,故無法推斷,在本研究中也並非主題討論之內容。
5. 文章的數量選擇以六篇文章的原因?
Ans:因為剛好操弄變項的數量為三,取其倍數而定。
6. 實驗中要求受試者盡快唸完文章的原因?
Ans:避免受試者在閱讀歷程上有更多的變項。
7. 實驗採用受試者間設計,使得每個人念的速度不同而可能影響結果,為何不使用受試者內設計之實驗?
Ans:避免產生更多的混淆變項。
8. 所操弄的文字其選擇的主要依據、方式?
Ans:以主觀決定為主,盡量選擇可能的高頻字,且因文中能用的替代字並不多,所以在選擇文字操弄的對象大多以主觀決定。
9. 在文獻中,對於相似這個詞的定義?
Ans:主要有兩個標準,字頻與筆畫數。
10. 事先使用網路的習慣與方式是否可能造成其中一混淆變項?
Ans:此主要為個人差異,且因採用隨機分派實驗可平衡此變項。
11. 所替代的字詞,詞性不同是否可能會造成影響?
Ans:並無操弄詞性這麼變項,而替代字詞主要是以常見的高頻字為主,且在自然的情況下,火星文出現的情況,所以並無刻意操弄替代之字詞。
12. 實驗的有效樣本數?
Ans:約剩一半左右,可能是因為與是非題的設計不良有關,這部分可再改進。
[編輯] 【老師回饋部分】
1. 雖然每組都有跟老師討論的情況才進行報告,但是最後的執行者仍然是各組的同學而並非老師,在對問題的回應時,請不要將實驗的決策者推到老師身上。
2. 再三的強調,課程的進行是以研討會的方式為主,不是辯論賽或者出庭辯護,問問題與回答問題的同學態度上可以不必太過尖銳。
3. 雖然在實驗中的操弄可能有不太恰當的地方,但是因為在最後的結果與討論的比較中並非研究的主題,還算可以接受,但往後如果有機會再做研究,仍需特別注意這些部分。
[編輯] B班實況:
[編輯] 【同學提問部分】
1. 每篇文章替代的字都採用一樣的字嗎?是怎麼決定採用這些字的?
Ans:每一篇替代字都不一樣,這些字的採用都是我們認為是高頻的字,因為沒有高頻字表可以對照,我們選用六種版本都會作四種的替代,不是每篇都採用同樣的字,會視情況以適當的字取代。
2. 受試者是如何取樣,會不會受試者平時有在電腦使用這些語言,而對施測「音似形異」有較好的辨認速度?
Ans:受試者的差異是個人的差異,我們透過隨機抽樣平均掉這項誤差。
3. 有沒有考慮將中文諧音、英文諧音、注音文合在一起施測,因為平常我們在msn的使用都是合併一起使用的,這樣施測比較會符合實際的情況。
Ans:這樣合併使用我們不知道放在一起會不會有其它的交互作用,所以沒有考慮。
4. 為什麼要要求受試者唸出原本的字音,直接唸出諧音不是會比較通順,而且也是可以瞭解原本的意思?。
Ans:是剛剛報告的口誤,基本上是以受試者唸通順為主,並無規定一定要唸諧音或原本的字音。
5. 一篇文章中改的字不是很多,如果改多一點字的話,是不是比較容易看出三組間的差異?
Ans:實驗主要操弄的是和對照組的差異,並不是要作三組間的比較。
6. 當初為什麼要要求受試者把文章唸出來,後面不是有問題確定受試者是否確實閱讀文章嗎?
Ans:唸出來的目的是確定受試者有仔細的觀看,因為假設受試者不唸出來,則不能確定他的瀏覽方式,很可能是隨意快速瀏覽,這樣的話各組之間也無法比較。
7. 在實驗中使用替代的字會影響對全文的理解嗎?
Ans:我們是靠主觀認為高頻的字把它替換掉,當初沒有注意替換的字是否對文意造成影響。
8. 每一篇選擇替換的字都不相同,受試者可能因為替換的字位置不同,對有些文章理解較好,有些較差,這樣是不是可能造成實驗的誤差?
Ans:有可能,但是沒有辦法。我們並沒有高頻的字庫,全憑我們主觀判斷,如果每篇文章選擇替換的字都要相同,也要剛好有這樣的字可以替換,如果硬要更換的話,可能選用不常見的字去替換,反而會造成實驗更大的誤差。
9. 實驗中是如何選用要替代的字,實驗中改的字並不是重點字,像名詞或動詞;而是多改在非重點字,如語尾助詞,對文意並沒有影響。如果選擇重點字的話,是否效果會更加明顯?
Ans:並沒有著重在重點或非重點,因為也不一定有合適的字可以替換。
10. 在實驗中有分別對英文諧音、中文諧音、注音文作兩兩比較,看何種影響是最顯著?
Ans:是和對照組比較何者最顯著,並沒有另外作兩兩比較。
11. 在摘要上面指出「實驗中發現,所操弄的變項確實有造成受試者閱讀障礙的情況發生。」但是所謂的「閱讀障礙」,應該指的是受試者對文意理解感到困難,而實驗中發現的是延遲的現象,因此應該不能推論有「閱讀障礙」的情況發生吧?
Ans:我們想要指出的是延遲的效果,可能字面上的意思還要在作修飾。
[編輯] 【老師回饋部分】
- 實驗比較沒有找到直接相關的文獻,不是直接關於網路語言閱讀的資料,可能要多找一些資料補充,並另外將錯誤率、刪除的資料(指閱讀完文章測驗受試是否有理解文意的題目,受試者只要回答錯誤數據就不採用)重新去跑統計,看看有沒有其它的結果。
- 雖然刪除的步驟很好,不是針對資料去刪除,而是有一個標準去刪除,但是刪除的資料太多筆,可能要深入探討。
- 還有其他相關的文獻可以補充,例如認知歷程方面,不能歸咎於沒有眼球偵測器,希望期末報告能在補強。
[編輯] (學長組)
2008年6月13日
[編輯] A班實況:
[編輯] 【同學提問部分】
1. 圖優效果是普遍存在的,請問有沒有提到性別差異可能對於實驗有影響?
Ans:這部分中,文獻並沒有特別提到,而由於非本次實驗目的,所以也並沒有做特別控制。
2. 圖優效果不顯著,可能線索是來自於字型而非字義,可能有其探討的空間?
Ans:之前心實實有做過關於詞優效應的實驗,我們覺得其實人類在看到字詞的時候,應會先對字義做反應,比較不會對字型做反應,所以應該是不會有這樣的反應。
3. 會不會有一些受試者可能有受過類似的記憶訓練,所以可能造成實驗中的偏誤?
Ans:受試者基本上是隨機挑選的,應可避免此類的受試者差異的問題。
4. 在自由回憶的時候會不會有可能強化了文字組的記憶,因此造成了這樣的結果?
Ans:有可能,這部分我們可以再參考作討論。
5. 在指示三秒的時間中,所呈現的記憶指示與遺忘指示的比例是否有特別控制?
Ans:採取一比一的比例,隨機排列。
6. 在實驗過程中,自由回憶這個部份的設計目的?
Ans:我們的實驗程序基本上是遵循指示遺忘的實驗典範的設計方式,並沒有做其餘的考量。
7. 因為你們的實驗是做記憶以及與回憶有關的研究,會不會有可能是文字與圖片各別記憶廣度的限制而造成組間比較不顯著的可能?
Ans:記憶廣度的部分為七加減二,這部分可能不會有影響。
8. 在妳們的實驗程序中設計了自由回憶的步驟以及再認測驗的步驟,這兩個都有回憶的動作與效果,會不會有可能造成受試者最後的辨認作業有回憶或記憶混淆的情況出現?
Ans:最後的再認測驗只是辨認動作而已,應該不會造成混淆的情況。且最後會把自由回憶作業的作答紙收回,應該不會造成受試者因為前面的作業而造成混淆。
9. 妳們的研究重點應該是在指示遺忘的部分?與自由回憶這個動作並較無關?其實應該可以刪除這部分的作業或許有可能避免一些潛在的混淆變項?
Ans:因為需要自由回憶的動作去確認受試者是否有記憶以及遵守指示遺忘的動作,所以自由回憶的部分主要是檢驗受試者的反應情況。
10. 記憶呈現方式有圖片與文字,可是受試者在回憶的時候主要還是以文字的方式再回憶與記憶,會不會因為這樣造成圖優效果並未顯著的原因?
Ans:這部分就是我們主要想要在圖優效果這部分測試的重點。
11. 在妳們最後討論的文獻部分,該論文是在研究數學學習與數學問題的解決上,好像與妳們的記憶研究不太相關?用這個文獻來解釋歷程的不相同好像不太適當?
Ans:這篇文獻我們主要參考的部分是該論文所提出的一些相關觀點好像可以解釋關於我們研究中圖片與文字中記憶時的歷程衝突。
12. 受試者在最後作答時會提供自由回憶的部分答案以及再認測驗的答案,那如果兩個答案中有衝突或者不相同的情況出現時,會影響到最後的統計結果嗎?
Ans:我們自由回憶的部分是讓受試者自由作答,且最後統計時是分開計算,所以並不會影響到最後的統計與解釋的結果。
[編輯] 【老師回饋部分】
1. 典範本身可能是有一些特殊性,可是因為多了圖片的操弄,如果沿用過去的典範可能會造成問題,那本來可能會有圖優的效果卻消失。
2. 如果實驗的順序對於某些因素來說可能會有影響,自由回憶的部分由認知的部分來解釋本身就是有點接近語意回憶的部分,可能就會造成結果會蠻符合這樣的想法。就有可能會因為這樣造成順序效果。因為在自由回憶的這部分較有利於文字回憶的部分。
3. 二年級在這邊問問題的時候常常會問到與心測相關的問題,可是常常實驗中是較與認知相關的部分,所以造成問問題的時候會較不容易問到重點或者核心的問題。可能在問問題的時候會較容易在用詞上較不容易有理想的表現,也有可能在背後的認知歷程中較相關的部分卻沒有辦法探討到。
4. 經過了一個學期這樣的討論過程,希望大家最起碼要懂得會問問題。其實我很希望大家能夠盡量主動問問題,大家才會知道說該怎麼問問題會比較好,就如同心測實習的過程中常常要實地做測驗會比較好,當然在過程中會出現很多問題,不過還是應該要透過這樣的經驗大家才會有學習到或者進步。
[編輯] B班實況:
[編輯] 【同學提問部分】
1. 為什麼在實驗後面先作了自由回憶,再作在認測驗,為什麼不是分開來作,而是連貫去作,這兩者之間會不會有干擾?
Ans:因為實驗的獨變項是不同的呈現方式(圖、字)與指示線索(記、忘),若再將自由回憶與在認測驗拆開來作,實驗設計會太複雜。而且若先作自由回憶,在作再認測驗,再任測驗是將所有呈現過的刺激列出來,若先作再認測驗一定會影響到自由回憶,所以才將再認測驗放在前面。當然這當中的干擾還是會有的,但已經盡量將干擾降低。
2. 刻意的讓受試者記或忘,對受試者來說是一件很困難的事情,會不會對實驗造成影響?
Ans:從實驗結束統計的結果,發現是不會有影響的。
3. 為什麼要作自由回憶和在認測驗兩個,不只選擇一個來作就好?
Ans:作自由回憶的部分受試者不管記或忘都會寫出來,最主要是要看受試者遺忘的部分,作再認測驗是難度較低,可以和自由回憶作比較作為參照。
4. 在最後有作一個再認測驗,不管記或忘都要回答,會不會有受試者猜想到主試的目的,雖然指導語告訴受試者要忘,但受試者仍然把它記起來?
Ans:是有這個可能,但是這是屬於個人的差異部分,在統計上應該會平衡掉。
5. 若在自由回憶的部分,受試者用不同的方式指涉相同的東西,例如機車和車子,要怎麼計算?
Ans:在前測的時候已經盡可能排除掉爭議性的東西,但不可避免的多少還是會有這樣的情形發生,基本上受試者只要是指涉相同的東西都會算他對。
6. 如果一開始刺激是以圖片刺激,在再認的時候也以圖片的時候回答,是不是就能排除掉問題討論中所提到的歷程複雜化,而有圖優效果的出現?
Ans:有可能,但是在這次實驗中,圖片和文字的統計結果比對,雖然沒有達顯著,但還是可以看出圖片的效果是高於文字的。
7. 關於指示遺忘有項目程序法和列表程序法兩種,為什麼會採用項目程序法?
Ans:會選擇項目程序法有幾個考量,第一個是項目程序法是比較後期的理論,而且在列表程序上,我們並沒有辦法做到刺激隨機的方式,而且呈現一整串之後才告訴受試者記或忘,或許前面的部分受試者已經忘記,或是中間受到什麼干擾我們並不能控制,所以最後才採用項目程序法這個方式。
8. 之前作班達測驗,五張圖片就給了20分鐘,雖然是要畫圖,那想要請問在實驗中的五分鐘是怎麼定義出來的,五分鐘要受試者回憶20題不知道時間夠不夠?
Ans:五分鐘的限制主要是參考文獻中自由回憶的時間,那在實驗的過程中發現到,其實在兩三分鐘左右的時間,受試者大概已經回憶完畢,想不出來,或者是主動說想不到了。
9. 因為性別對於記憶的方式是不太相同的,請問在性別在指示遺忘以不同刺激的呈現方式上有無不同?
Ans:不可否認性別可能會影響到實驗,但在這次的實驗中不是討論的範圍,在所蒐集的文獻中也沒加入性別這個變項。
10. 自由回憶和再認測驗中的圖優效果不達顯著,會不會是因為題數只有20題,所以雖然有差別,但是差別並不是這麼明顯,若是提高題數則圖優效果就可能出現,不知道在文獻中有文提到關於測驗題數大概是多少?
Ans:題數部分也是參照指示遺忘的文獻,文獻中並無提到是否題數增多就會讓圖優效果更明顯,因為圖優效果是後來加入指示遺忘的部分,若再增加題數,可能會受到記憶廣度的影響而無法記憶。
11. 再認分數為什麼會採用正確再認率-錯誤再認率,再認分數它的定義是什麼?
Ans:減掉錯誤再認率是避免沒有出現但受試者卻勾選的現象。
12. 請問指示遺忘在兩組間都未達顯著是怎麼算出來的?
Ans:這個部分是用組間比較圖和字這兩組的自由回憶正確率去作比對。這裡的正確率是採用記的正確率加錯的正確率。
13. 在自由回憶的部分,不論記或忘寫出來都有採計,那為什麼沒有要讓受試者在後面加計把要記或是要忘也寫出來?
Ans:因為在統計上面並沒有另外分類受試者記多少,忘多少。而且受指示遺忘的影響,基本上忘的部分受試者不會記得,但是還是會有影響,但受試者不會特別去記記或忘。
[編輯] 【老師回饋部分】
- 期末考以及期末報告大家請用心準備,尤其是自己覺得發言次數不夠的人。
- 希望同學能透過舉手發問來學習到如何發問是比較好的,在日後也能找到機會學習。
- 自由回憶與再認測驗的順序上的確有爭議性,因為先作自由回憶可能是跟文字比較接近的,先卡了一個和文字比較接近的,在去作再認,前面對文字比較有利,所以在再認測驗本來應該有的圖優效果就會不見。
- 在計算方面圖片和文字合在一起算,再認也是合在一起算,或許損失了一些資訊,可以再重新計算,統計方式不是用t-test,而試用其他的統計方式,或許會有其它的效果。
- 其他組也是一樣,統計計算方式或是解釋方式要更改的,請在書面呈現。