第五講:Perceiving Objects and Scenes
出自KMU Wiki
(修訂版本間差異)
在2013年11月6日 (三) 10:45所做的修訂版本 (編輯) Woody (對話 | 貢獻) (→這些人是誰?) ←上一個 |
在2013年11月6日 (三) 11:34所做的修訂版本 (編輯) (撤銷) Woody (對話 | 貢獻) (→Perceiving Objects and Scenes) 下一個→ |
||
第1行: | 第1行: | ||
==Perceiving Objects and Scenes== | ==Perceiving Objects and Scenes== | ||
- | + | ==Scenes== | |
*日常所見 | *日常所見 | ||
*困難所在 | *困難所在 | ||
- | + | ===臉形辨識=== | |
*困難處之一(角度) | *困難處之一(角度) | ||
*在家中的畫面 | *在家中的畫面 | ||
**機器人分析與錯誤 | **機器人分析與錯誤 | ||
- | + | ===機器視覺=== | |
*車速最高 50Km/hr | *車速最高 50Km/hr | ||
*平均22Km/hr | *平均22Km/hr | ||
- | + | ==Spirit in Mars== | |
*2004-1-4 | *2004-1-4 | ||
*Sashimi(生魚片) | *Sashimi(生魚片) | ||
第19行: | 第19行: | ||
*形狀類似美國阿爾崗金族印第安人的帳篷故得名 | *形狀類似美國阿爾崗金族印第安人的帳篷故得名 | ||
*get a X-ray | *get a X-ray | ||
- | + | ==Optic== | |
*成像 | *成像 | ||
- | + | ===Inverse projection problem=== | |
*又稱 Inverse Optics | *又稱 Inverse Optics | ||
- | + | ===An environmental sculpture by Thomas Macaulay=== | |
*從二樓陽台看 | *從二樓陽台看 | ||
*從一樓看 | *從一樓看 | ||
*找一找鉛筆和眼鏡 | *找一找鉛筆和眼鏡 | ||
- | + | ===這些人是誰?=== | |
Prince Charies, Woody Allen, Bill Clinton, Saddam Hussein, Richard Nixon, Princess Diana | Prince Charies, Woody Allen, Bill Clinton, Saddam Hussein, Richard Nixon, Princess Diana | ||
- | + | ===從不同角度看=== | |
- | + | ===哪些照片是同一個人?=== | |
- | + | ==完形心理學== | |
*根據這些點(dot)累積創造出我們對臉的知覺的嗎? | *根據這些點(dot)累積創造出我們對臉的知覺的嗎? | ||
- | + | ===似動現象(Apparent Movement)=== | |
*由左至右的跑馬燈,似動現象(Apparent Movement) | *由左至右的跑馬燈,似動現象(Apparent Movement) | ||
- | + | === 錯覺輪廓(Illusory Contour)=== | |
- | + | ===Illusory contour=== | |
- | + | ===Good continuation (5.16)=== | |
- | + | ===Pragnanz=== | |
*good figure / simple figure | *good figure / simple figure | ||
- | + | ===相似性 law of similarity=== | |
*相似的刺激傾向被知覺為一體 | *相似的刺激傾向被知覺為一體 | ||
*Similarity ? | *Similarity ? | ||
- | + | ===proximity=== | |
*共同區域(Common Region,圖5.18b)、 | *共同區域(Common Region,圖5.18b)、 | ||
*連結律(Uniform Connectedness,圖5.18c)、 | *連結律(Uniform Connectedness,圖5.18c)、 | ||
第50行: | 第50行: | ||
*自然情境 | *自然情境 | ||
*Common fate | *Common fate | ||
- | + | ===12張臉孔在內?=== | |
*具有意義或對觀察者較熟悉的刺激,會被視為一體, | *具有意義或對觀察者較熟悉的刺激,會被視為一體, | ||
所以初看為一幅畫 | 所以初看為一幅畫 | ||
- | + | ===你看到什麼?=== | |
*知覺到的其中一個物體,另一個就成為背景 | *知覺到的其中一個物體,另一個就成為背景 | ||
*(a)實驗呈現方式 | *(a)實驗呈現方式 | ||
第60行: | 第60行: | ||
*Figure ground separation 圖形背景分離 | *Figure ground separation 圖形背景分離 | ||
*自然scene中的背景 | *自然scene中的背景 | ||
- | + | ===convex region=== | |
- | + | ===meaningfulness=== | |
*face ?? | *face ?? | ||
- | + | ===Gestalt law as Heuristics=== | |
- | + | ===Recognition by component=== | |
- | + | ===Non-accidental properties=== | |
*上面的三條線 | *上面的三條線 | ||
*上面的兩條線 | *上面的兩條線 | ||
第75行: | 第75行: | ||
*3個geons | *3個geons | ||
的飛機 | 的飛機 | ||
- | + | ==場景知覺(Gist of the Scene)== | |
*Mary Potter(1976)快速呈現16張複雜場景圖片,每張只呈現250毫秒。 | *Mary Potter(1976)快速呈現16張複雜場景圖片,每張只呈現250毫秒。 | ||
*在一連串呈現之前看到目標圖片或只是提示語(如:小女生在拍手) | *在一連串呈現之前看到目標圖片或只是提示語(如:小女生在拍手) | ||
第82行: | 第82行: | ||
*利用masking每張圖片呈現27到500毫秒,每張圖片呈現完之後會呈現一個mask來精確控制刺激呈現時間 | *利用masking每張圖片呈現27到500毫秒,每張圖片呈現完之後會呈現一個mask來精確控制刺激呈現時間 | ||
*結果67ms 即可辨識(看到有人 :p) | *結果67ms 即可辨識(看到有人 :p) | ||
- | + | ===Masking=== | |
*masking procedure | *masking procedure | ||
- | * | + | *抵消persistence of vision |
- | + | ===Global Image Feature=== | |
*Oliva and Torralba (2001, 2006) | *Oliva and Torralba (2001, 2006) | ||
**Degree of naturalness | **Degree of naturalness | ||
第92行: | 第92行: | ||
**Degree of expansion | **Degree of expansion | ||
**Color | **Color | ||
- | + | ===Regularity=== | |
- | + | ===light-from-above heuristic=== | |
*旋轉 | *旋轉 | ||
- | + | ===Semantic Regularity=== | |
*Hollingworth (2005) | *Hollingworth (2005) | ||
**前圖為例,條件為二 | **前圖為例,條件為二 | ||
第111行: | 第111行: | ||
*當後面出現的這張圖片為麵包的時候,受試者的正確率較高。 | *當後面出現的這張圖片為麵包的時候,受試者的正確率較高。 | ||
*multiple personalities of blob:Oliva & Torralba(2007) | *multiple personalities of blob:Oliva & Torralba(2007) | ||
- | + | ===The role of inference in perception=== | |
- | + | ===theory of unconscious inference=== | |
*當我們面對不清楚的刺激時,視覺系統會根據其他各種條件,比如過去經驗,去推測當下的刺激為何。這樣的知覺推理歷程稱之為theory of unconscious inference | *當我們面對不清楚的刺激時,視覺系統會根據其他各種條件,比如過去經驗,去推測當下的刺激為何。這樣的知覺推理歷程稱之為theory of unconscious inference | ||
*likelihood principle | *likelihood principle | ||
*Bayesian inference | *Bayesian inference | ||
- | + | ===Neurons for grouping=== | |
原來對垂直線段有最佳反應的神經細胞(a),若置於其它隨機角度的線段中,反應會受到抑制(b),但若置於具有共線關係的線段中,便又使得反應增強(c) | 原來對垂直線段有最佳反應的神經細胞(a),若置於其它隨機角度的線段中,反應會受到抑制(b),但若置於具有共線關係的線段中,便又使得反應增強(c) | ||
- | + | ===Contextual modulation=== | |
*Lamme (1995) | *Lamme (1995) | ||
**如果線條符合V1細胞的接受區形式且在「圖形」中:反應(a) | **如果線條符合V1細胞的接受區形式且在「圖形」中:反應(a) | ||
**如果線條符合V1細胞的接受區形式但不在「圖形」中:不反應(b) | **如果線條符合V1細胞的接受區形式但不在「圖形」中:不反應(b) | ||
- | + | ==Sensory coding== | |
*在臉部知覺的部分,以下幾個區域會有怎樣的反應? | *在臉部知覺的部分,以下幾個區域會有怎樣的反應? | ||
- | + | ===Grill-Spector(2004)之實驗=== | |
*Grill-Spector(2004)之實驗結果 | *Grill-Spector(2004)之實驗結果 | ||
**fMRI資料顯示,FFA不只對是否看到臉有不同反應,也會因為受試者的反應正確與否而有不同的反應 | **fMRI資料顯示,FFA不只對是否看到臉有不同反應,也會因為受試者的反應正確與否而有不同的反應 | ||
- | + | ===Sheinberg and Logothesis (1997)=== | |
*binocular rivalry | *binocular rivalry | ||
*IT上的細胞會根據猴子的主觀知覺是看到類似太陽的刺激還是蝴蝶而有不同的反應 | *IT上的細胞會根據猴子的主觀知覺是看到類似太陽的刺激還是蝴蝶而有不同的反應 | ||
- | + | ===Tong等人(1998)實驗=== | |
*當觀看者,經驗到非臉,則:PPA>FFA,經驗到臉,則FFA>PPA | *當觀看者,經驗到非臉,則:PPA>FFA,經驗到臉,則FFA>PPA | ||
- | + | ===Voxels=== | |
*Voxels(volumetric pixel) | *Voxels(volumetric pixel) | ||
*fMRI Voxels2~3mm立方體 | *fMRI Voxels2~3mm立方體 | ||
*Kamitani and Tong(2005) 可以由Voxels預測觀察者所見的傾斜方向 | *Kamitani and Tong(2005) 可以由Voxels預測觀察者所見的傾斜方向 | ||
- | + | ===Kamitani and Tong(2005)=== | |
*發現腦部反應可以預測觀察者的注意力是在哪個傾斜刺激上 | *發現腦部反應可以預測觀察者的注意力是在哪個傾斜刺激上 | ||
- | + | ===Kay等人(2008)實驗=== | |
*呈現1,750黑白照片 | *呈現1,750黑白照片 | ||
*測量V1的500個voxels | *測量V1的500個voxels | ||
第147行: | 第147行: | ||
**正確率72~92% | **正確率72~92% | ||
*Kay等人(2008)實驗結果 | *Kay等人(2008)實驗結果 | ||
- | + | ===Structure encoding=== | |
*觀看1750張圖 | *觀看1750張圖 | ||
*測量各voxel的活動 | *測量各voxel的活動 | ||
*每一voxel對於不同圖的反應特性來計算該voxel 的特徵 | *每一voxel對於不同圖的反應特性來計算該voxel 的特徵 | ||
- | + | ==Are faces special?== | |
*face!! | *face!! | ||
**negative image | **negative image | ||
- | + | ===face in brain=== | |
*可能有關的 | *可能有關的 | ||
*development | *development | ||
*development inf brain | *development inf brain | ||
*Think about | *Think about |
在2013年11月6日 (三) 11:34所做的修訂版本
Perceiving Objects and Scenes
Scenes
- 日常所見
- 困難所在
臉形辨識
- 困難處之一(角度)
- 在家中的畫面
- 機器人分析與錯誤
機器視覺
- 車速最高 50Km/hr
- 平均22Km/hr
Spirit in Mars
- 2004-1-4
- Sashimi(生魚片)
- Spirit
- 登陸艇
- 機械臂
- Adirondack
- 形狀類似美國阿爾崗金族印第安人的帳篷故得名
- get a X-ray
Optic
- 成像
Inverse projection problem
- 又稱 Inverse Optics
An environmental sculpture by Thomas Macaulay
- 從二樓陽台看
- 從一樓看
- 找一找鉛筆和眼鏡
這些人是誰?
Prince Charies, Woody Allen, Bill Clinton, Saddam Hussein, Richard Nixon, Princess Diana
從不同角度看
哪些照片是同一個人?
完形心理學
- 根據這些點(dot)累積創造出我們對臉的知覺的嗎?
似動現象(Apparent Movement)
- 由左至右的跑馬燈,似動現象(Apparent Movement)
錯覺輪廓(Illusory Contour)
Illusory contour
Good continuation (5.16)
Pragnanz
- good figure / simple figure
相似性 law of similarity
- 相似的刺激傾向被知覺為一體
- Similarity ?
proximity
- 共同區域(Common Region,圖5.18b)、
- 連結律(Uniform Connectedness,圖5.18c)、
- 以及同步發生(Synchrony,圖5.18d)
- 自然情境
- Common fate
12張臉孔在內?
- 具有意義或對觀察者較熟悉的刺激,會被視為一體,
所以初看為一幅畫
你看到什麼?
- 知覺到的其中一個物體,另一個就成為背景
- (a)實驗呈現方式
- (b)當深色方塊被看成背景,則小黑點落在小方塊邊界上
- (c)當被看成中間有孔的深色方塊,則小黑點落在黑色方塊邊界上
- Figure ground separation 圖形背景分離
- 自然scene中的背景
convex region
meaningfulness
- face ??
Gestalt law as Heuristics
Recognition by component
Non-accidental properties
- 上面的三條線
- 上面的兩條線
- 都是非偶發特性(non-accidental properties)
- Biederman的實驗
- Nonaccidental properties
- What's this?
- 6個geons的飛機
- 3個geons
的飛機
場景知覺(Gist of the Scene)
- Mary Potter(1976)快速呈現16張複雜場景圖片,每張只呈現250毫秒。
- 在一連串呈現之前看到目標圖片或只是提示語(如:小女生在拍手)
- 結果受試者都可以看得到
- Li Fei-Fei (2007)
- 利用masking每張圖片呈現27到500毫秒,每張圖片呈現完之後會呈現一個mask來精確控制刺激呈現時間
- 結果67ms 即可辨識(看到有人 :p)
Masking
- masking procedure
- 抵消persistence of vision
Global Image Feature
- Oliva and Torralba (2001, 2006)
- Degree of naturalness
- Degree of openness
- Degree of roughness
- Degree of expansion
- Color
Regularity
light-from-above heuristic
- 旋轉
Semantic Regularity
- Hollingworth (2005)
- 前圖為例,條件為二
- 目標出現
- 目標不出現
- 作業
- 目標出現在何處
- 目標該出現在何處(在無目標條件下)
- 結果
- 小圓:目標出現時
- 大圓:目標不出現時
- 前圖為例,條件為二
- Palmer (1975)
- 先呈現給受試者流理台的圖片(圖5.39左)
- 然後再快速閃現另一組圖片(圖5.39右)
- 當後面出現的這張圖片為麵包的時候,受試者的正確率較高。
- multiple personalities of blob:Oliva & Torralba(2007)
The role of inference in perception
theory of unconscious inference
- 當我們面對不清楚的刺激時,視覺系統會根據其他各種條件,比如過去經驗,去推測當下的刺激為何。這樣的知覺推理歷程稱之為theory of unconscious inference
- likelihood principle
- Bayesian inference
Neurons for grouping
原來對垂直線段有最佳反應的神經細胞(a),若置於其它隨機角度的線段中,反應會受到抑制(b),但若置於具有共線關係的線段中,便又使得反應增強(c)
Contextual modulation
- Lamme (1995)
- 如果線條符合V1細胞的接受區形式且在「圖形」中:反應(a)
- 如果線條符合V1細胞的接受區形式但不在「圖形」中:不反應(b)
Sensory coding
- 在臉部知覺的部分,以下幾個區域會有怎樣的反應?
Grill-Spector(2004)之實驗
- Grill-Spector(2004)之實驗結果
- fMRI資料顯示,FFA不只對是否看到臉有不同反應,也會因為受試者的反應正確與否而有不同的反應
Sheinberg and Logothesis (1997)
- binocular rivalry
- IT上的細胞會根據猴子的主觀知覺是看到類似太陽的刺激還是蝴蝶而有不同的反應
Tong等人(1998)實驗
- 當觀看者,經驗到非臉,則:PPA>FFA,經驗到臉,則FFA>PPA
Voxels
- Voxels(volumetric pixel)
- fMRI Voxels2~3mm立方體
- Kamitani and Tong(2005) 可以由Voxels預測觀察者所見的傾斜方向
Kamitani and Tong(2005)
- 發現腦部反應可以預測觀察者的注意力是在哪個傾斜刺激上
Kay等人(2008)實驗
- 呈現1,750黑白照片
- 測量V1的500個voxels
- 整理voxels之活動之後
- 經過數學處理
- 由voxels的活動猜測觀察者所見
- 正確率72~92%
- Kay等人(2008)實驗結果
Structure encoding
- 觀看1750張圖
- 測量各voxel的活動
- 每一voxel對於不同圖的反應特性來計算該voxel 的特徵
Are faces special?
- face!!
- negative image
face in brain
- 可能有關的
- development
- development inf brain
- Think about