搜尋引擎歷史與使用技巧

出自KMU Wiki

在2018年10月1日 (一) 20:18由U104007006 (對話 | 貢獻)所做的修訂版本
(差異) ←上一修訂 | 當前修訂 (差異) | 下一修訂→ (差異)
跳轉到: 導航, 搜索

目錄

[編輯] 搜尋引擎


[編輯] 搜尋引擎的出現因素

  • 在Internet中現有網頁數
  • 已經沒有人統計了
  • 因為統計一點都沒有用
  • 但至少以「億」數以上的網頁
  • 在這麼多網頁中,那裡有我「要」的?

[編輯] 搜尋與檢索

  • 資料庫(以圖書館館藏為例)
    • 1.Index(架位號、索書碼、圖書館分類號.....)
    • 2.內容(書本本身)
  • 網頁的檢索(早期分類)
    • 1.手動/自動
    • 2.分類/不分類

[編輯] 網路上早期的搜尋方式

  • 人工分類
    • 剛開始最有名的Yahoo!
      • David Filo 和楊致遠(Jerry Yang) 1994年4月創立
      • 以階層式分類
      • 用資料庫貯存及檢索
    • 1995年起隨著Internet人口增加而急速成長

參考資料(已經不見了!!)

[編輯] Yam

蕃薯藤介紹(已消失)

  • 蕃薯藤數位科技致力於提供全球華文地區個人網友及企 業用戶最佳之4C資訊傳播整合加值服務,是您選擇刊登 網路廣告與企業e化解決方案的最佳選擇,更是您每天必 上的網站,詳細資訊請參閱「關於蕃薯藤」站內資料。 您亦可透過左方的站內搜尋,快速取得相關資料。

蕃薯藤工作小組大事紀

[編輯] Gais

Gais介紹(已消失) 全由台灣人開發的全文搜尋引擎

  • 特 色
    • 可 以 容 錯 搜 尋 或 近 似 搜 尋
    • 提 供 中 文 同 音 搜 尋
    • 可 以 做 全 文 檢 索 、 欄 位 檢 索 , 或 兩 者 混 合 檢 索
    • 可 以 使 用 自 然 語 言 檢 索
    • 可 使 用 有 序 性 之 布 林 檢 索 (Ordered Boolean)

[編輯] 專論—咕狗大神

  • 1998-9-7
    • 在加洲一個車庫裡開始
  • 1999
    • 前後獲得幾位大金主的支持
    • 共得資金2500萬美元
  • 2000
    • 成為Internet最大搜尋引擎

google的主機

  • Google 的內幕
    • PageRankTM
      • PageRank 如同個別網頁價值的指示器,透過龐大的連結架構來信賴網站獨特地民主性質。簡單來說,Google 說明網頁 A 連結至網頁 B 時,則視為網頁 A 投給網頁 B 一票。當然,Google 會查看票數來源,或是連結網頁接收的票數;同時它也會分析參予投票的網頁。透過「重要的」網頁來參予投票,並且幫助其它的網頁也成為「重要的」網頁資料。

概念圖
Image:06-1.png


[編輯] SEO

  • SEO (Search engine optimization)
    • 現在多數網站(尤其是商業網站)最關心的是多少人會來他們的網站。
    • 很多人會由搜尋引擎來到各網站
    • 讓一個網站容易被搜尋引擎找到,變成一個新的技術
  • Google Bomber (2007前)
  • 內幕的內幕
    • 搜尋引擎
    • 利用程式在浩瀚的網路空間找使用者要的資料
    • 她是機器自動化,不能用人為去改變整個搜尋的邏輯
    • 但可以改變一些「參數」
    • 在大陸找不到「民主」、「自由主義」....
    • 2007年1月之後'miserable failure' 不會連到President Bush
  • SEO vs Google
    • 兩難困境
      • 業主希望自的網頁出現在相關詞搜尋的前幾頁
    • Google希望使用者在前幾頁就找到他要找的
    • SEO要提升前者
    • 但那對後者不見得有好的結果
  • Google的對策
  • 改變演算法參數
  1. 站點的年齡
  2. 自該網域註冊後過多久
  3. 內容的年齡
  4. 新內容增加的規律性
  5. 鏈接的年齡和連接站點的名譽

參考資料

[編輯] 搜尋技巧

  • 最大關鍵就在關鍵詞
    • 明確
    • 由大至小縮小範圍
    • 換個角度
    • 換個語言
  • 搜尋技巧—實例
    • 想知醫學中心有關兒童發展相關業務
    • 「醫學中心有關兒童發展相關業務」為關鍵詞
      • 有一堆無關的
    • 「發展遲緩」為關鍵詞
      • 反而較接近
    • 再加「醫學中心」
      • 各家醫學中心的網頁會出現在第一頁(高醫在較下面)
  • 進階技巧

Image:06-2.png

    • Google技巧
      • 利用進階搜尋頁 進階
      • 限定網頁範圍 site:
      • 找定義 define:
      • 誰在連我 link:
    • 其他埋入瀏覽器中的搜尋引擎
      • Opera
      • IE
      • Mozilla (firefox)
      • Google toolbar
      • Google desktop
      • Google chrome
      • 趨勢
        • 把Internet上的網頁當作自己電腦檔案的延伸
        • 實際上網路愈來愈寬,網頁連結愈來愈快
        • LAN WAN MAN 甚至自己PC分際愈來愈模糊
  • Google desktop
    • 趨勢
    • 把Internet上的網頁當作自己電腦檔案的延伸
    • 實際上網路愈來愈寬,網頁連結愈來愈快
    • LAN WAN MAN 甚至自己PC分際愈來愈模糊

[編輯] 搜尋的背後意義

  • 不是在找網頁
    • 是找答案
    • 或是找解決問題的方法
    • 明天要約會,去哪吃飯?
    • 要去面試穿什麼衣服?
    • 明天去台北要不要帶傘?
  • 不同需求,不同搜尋
    • 有些問題不必搜尋
    • 有些問題網路上沒有答案
    • 有些問題要問對地方
  • 滿足需求了嗎?
    • 雙方需要
      • 提供資訊的(不管賣東西、或是純粹寫寫網誌)
        • 希望別人(而且越多人)看到
      • 找尋資訊的
        • 希望能找到自已需要的
    • 滿足了嗎?
      • 這就是你們的可能性所在!
  • 你要找什麼?
    • 心理人的主張
    • 你想主張什麼?
    • 心中有具體的事項嗎?
      • 社會中充滿「心理人」該關心的事
        • 正念、正向
        • 心理疾病污名化
        • 霸凌、公平、正義
        • 低薪、過勞
        • ...
  • 你的主張有根據嗎?
    • 例如:你主張推廣正向、正念
      • 正向、正念何處比其他的好?
        • 實徵資訊?
      • 何時、何種狀況下是有用的?
        • 任何狀況都有用? → 那極可能有問題!
        • 也需要實徵資訊!

[編輯] 作業

  • 在你的網誌
    • 先寫出你想要主張的事情
      • 簡短說明(字數約500~1000字)
    • 再搜尋可以找到的的參考資訊
      • 支持、不支持最好都有
      • 不見得要網站、學術文獻、影音資訊...
      • 至少要由多數個(即不可只有一個)

回到網際網路與心理學