第五講:Perceiving Objects and Scenes

出自KMU Wiki

(修訂版本間差異)
跳轉到: 導航, 搜索
在2014年1月14日 (二) 01:32所做的修訂版本 (編輯)
Woody (對話 | 貢獻)
(face in brain)
←上一個
在2014年1月14日 (二) 02:43所做的修訂版本 (編輯) (撤銷)
Woody (對話 | 貢獻)
(Scenes)
下一個→
第1行: 第1行:
==Perceiving Objects and Scenes== ==Perceiving Objects and Scenes==
==Scenes== ==Scenes==
-[[Image:05Scenes.png]]+*參照第94頁 封面
*日常所見 *日常所見
-[[Image:05Scenes2.png]]+*參照第96頁 figure 5.1
*困難所在 *困難所在
-[[Image:05Scenes3.png]]+*參照第96頁 figure 5.2
===臉形辨識=== ===臉形辨識===
*困難處之一(角度) *困難處之一(角度)
-[[Image:05face.png]]+*參照第97頁 figure 5.3
*在家中的畫面 *在家中的畫面
**機器人分析與錯誤 **機器人分析與錯誤
-[[Image:05home.png]]+*參照第97頁 figure 5.4
===機器視覺=== ===機器視覺===
[[Image:05car.png]] [[Image:05car.png]]

在2014年1月14日 (二) 02:43所做的修訂版本

目錄

Perceiving Objects and Scenes

Scenes

  • 參照第94頁 封面
  • 日常所見
  • 參照第96頁 figure 5.1
  • 困難所在
  • 參照第96頁 figure 5.2

臉形辨識

  • 困難處之一(角度)
  • 參照第97頁 figure 5.3
  • 在家中的畫面
    • 機器人分析與錯誤
  • 參照第97頁 figure 5.4

機器視覺

Image:05car.png Image:05car2.png

  • 車速最高 50Km/hr
  • 平均22Km/hr

Spirit in Mars

  • 2004-1-4
  • Sashimi(生魚片)

Image:05Spirit in Mars.png

  • Spirit

Image:05Spirit in Mars 2.png

  • 登陸艇

Image:05Spirit in Mars 3.png

  • 機械臂

Image:05Spirit in Mars 4.png

  • Adirondack
  • 形狀類似美國阿爾崗金族印第安人的帳篷故得名

Image:05Spirit in Mars 5.png

  • get a X-ray

Image:05Spirit in Mars 6.png

Optic

  • 成像

Image:05optic.png

Inverse projection problem

Image:05Inverse projection problem.png

  • 又稱 Inverse Optics

An environmental sculpture by Thomas Macaulay

  • 從二樓陽台看

Image:05An environmental sculpture by Thomas Macaulay.png

  • 從一樓看

Image:05An environmental sculpture by Thomas Macaulay2.png

  • 找一找鉛筆和眼鏡

Image:05pencil&glass.png

這些人是誰?

Image:05who.png Prince Charies, Woody Allen, Bill Clinton, Saddam Hussein, Richard Nixon, Princess Diana

從不同角度看

Image:05different angle.png

哪些照片是同一個人?

Image:05which one.png Image:05buildding.png

完形心理學

  • 根據這些點(dot)累積創造出我們對臉的知覺的嗎?

Image:05dot.png

似動現象(Apparent Movement)

  • 由左至右的跑馬燈,似動現象(Apparent Movement)

Image:05Apparent Movement.png

錯覺輪廓(Illusory Contour)

Image:05Illusory Contour.png

Illusory contour

Image:05Illusory contour2.png

Good continuation (5.16)

  • Image:05Good continuation.png
  • Image:05Good continuation2.png

Pragnanz

  • good figure / simple figure

Image:05Pragnanz.png

相似性 law of similarity

  • 相似的刺激傾向被知覺為一體

Image:05law of similarity.png

  • Similarity ?

Image:05Similarity.png

proximity

Image:05proximity.png

  • 共同區域(Common Region,圖5.18b)、
  • 連結律(Uniform Connectedness,圖5.18c)、
  • 以及同步發生(Synchrony,圖5.18d)

Image:05Common Region.png

  • 自然情境

Image:05nature situation.png

  • Common fate

Image:05Common fate.png

12張臉孔在內?

  • 具有意義或對觀察者較熟悉的刺激,會被視為一體,所以初看為一幅畫

Image:0512face.png

你看到什麼?

Image:05face&vase.png

  • 知覺到的其中一個物體,另一個就成為背景

Image:05face&vase2.png Image:05frontal& background.png

  • (a)實驗呈現方式
  • (b)當深色方塊被看成背景,則小黑點落在小方塊邊界上
  • (c)當被看成中間有孔的深色方塊,則小黑點落在黑色方塊邊界上
  • Figure ground separation 圖形背景分離

Image:05Figure ground.png

  • 自然scene中的背景

Image:05nature sence background.png

convex region

  • Image:05nature sence background2.png
  • Image:05convex region.png

meaningfulness

  • Image:05meaningfulness.png
  • Image:05meaningfulness2.png
  • face ??

Image:0512face.png

Gestalt law as Heuristics

Image:05Gestalt law as Heuristics.png

Recognition by component

Image:05Recognition by component.png

Non-accidental properties

Image:05Non-accidental properties.png Image:05non-accidental2.png

  • 上面的三條線--------------------------------------------------------------------上面的兩條線
  • 都是非偶發特性(non-accidental properties)
  • Biederman的實驗

Image:05non-accidental3.png

  • Nonaccidental properties
    • What's this?
  • Image:05Nonaccidental properties.png
  • Image:05Nonaccidental properties2.png
  • Image:05Nonaccidental properties3.png
  • Image:05Nonaccidental properties4.png
  • 6個geons的飛機

Image:05air plane.png

  • 3個geons的飛機

場景知覺(Gist of the Scene)

  • Mary Potter(1976)快速呈現16張複雜場景圖片,每張只呈現250毫秒。
  • 在一連串呈現之前看到目標圖片或只是提示語(如:小女生在拍手)
  • 結果受試者都可以看得到

Image:05Gist of the Scene.png

  • Li Fei-Fei (2007)
  • 利用masking每張圖片呈現27到500毫秒,每張圖片呈現完之後會呈現一個mask來精確控制刺激呈現時間
  • 結果67ms 即可辨識(看到有人 :p)

Image:05Gist of the Scene2.png

Masking

  • masking procedure
  • 抵消persistence of vision

Image:05Masking.png

Global Image Feature

  • Oliva and Torralba (2001, 2006)
    • Degree of naturalness
    • Degree of openness
    • Degree of roughness
    • Degree of expansion
    • Color

Image:05Global Image Feature.png

Regularity

Image:05Regularity.png

light-from-above heuristic

Image:05light-from-above heuristic.png

  • 實例

Image:05light-from-above heuristic2.png Image:05light-from-above heuristic3.png

  • 旋轉

Image:05light-from-above heuristic4.png

Semantic Regularity

Image:05Semantic Regularity.png

  • Hollingworth (2005)
    • 前圖為例,條件為二
      • 目標出現
      • 目標不出現
    • 作業
      • 目標出現在何處
      • 目標該出現在何處(在無目標條件下)
    • 結果
      • 小圓:目標出現時
      • 大圓:目標不出現時
  • Palmer (1975)
  • 先呈現給受試者流理台的圖片(圖5.39左)
  • 然後再快速閃現另一組圖片(圖5.39右)
  • 當後面出現的這張圖片為麵包的時候,受試者的正確率較高。

Image:05Semantic Regularity2.png

  • multiple personalities of blob:Oliva & Torralba(2007)

Image:05Semantic Regularity3.png

The role of inference in perception

Image:05The role of inference in perception.png

theory of unconscious inference

  • 當我們面對不清楚的刺激時,視覺系統會根據其他各種條件,比如過去經驗,去推測當下的刺激為何。這樣的知覺推理歷程稱之為theory of unconscious inference
  • likelihood principle
  • Bayesian inference

Neurons for grouping

原來對垂直線段有最佳反應的神經細胞(a),若置於其它隨機角度的線段中,反應會受到抑制(b),但若置於具有共線關係的線段中,便又使得反應增強(c) Image:05Neurons for grouping.png

Contextual modulation

  • Lamme (1995)
    • 如果線條符合V1細胞的接受區形式且在「圖形」中:反應(a)
    • 如果線條符合V1細胞的接受區形式但不在「圖形」中:不反應(b)

Image:05Contextual modulation.png

Sensory coding

  • 在臉部知覺的部分,以下幾個區域會有怎樣的反應?

Image:05Sensory coding.png

Grill-Spector(2004)之實驗

Image:05Grill-Spector.png

  • Grill-Spector(2004)之實驗結果
    • fMRI資料顯示,FFA不只對是否看到臉有不同反應,也會因為受試者的反應正確與否而有不同的反應

Image:05Grill-Spector2.png

Sheinberg and Logothesis (1997)

  • binocular rivalry
  • IT上的細胞會根據猴子的主觀知覺是看到類似太陽的刺激還是蝴蝶而有不同的反應
  • Image:05Sheinberg and Logothesis.png
  • Image:05Sheinberg and Logothesis2.png

Tong等人(1998)實驗

  • 當觀看者,經驗到非臉,則:PPA>FFA,經驗到臉,則FFA>PPA

Image:05Tong.png

Voxels

  • Voxels(volumetric pixel)
  • fMRI Voxels2~3mm立方體
  • Kamitani and Tong(2005) 可以由Voxels預測觀察者所見的傾斜方向

Image:05Voxels.png

Kamitani and Tong(2005)

  • 發現腦部反應可以預測觀察者的注意力是在哪個傾斜刺激上

Image:05Kamitani and Tong.png

Kay等人(2008)實驗

  • 呈現1,750黑白照片
  • 測量V1的500個voxels
  • 整理voxels之活動之後
    • 經過數學處理
  • 由voxels的活動猜測觀察者所見
    • 正確率72~92%
  • Kay等人(2008)實驗結果

[[Image:05Kay.png】]

Structure encoding

  • 觀看1750張圖
  • 測量各voxel的活動
  • 每一voxel對於不同圖的反應特性來計算該voxel 的特徵

Image:05Structure encoding.png Image:05Structure encoding2.png

Are faces special?

Image:05Are faces special.png

  • face!!
    • negative image

Image:05negative image.png

face in brain

  • 可能有關的

Image:05face in brain.png

  • development

Image:05development.png Image:05development2.png

  • development inf brain

Image:05development inf brain.png