搜尋引擎歷史與使用技巧

出自KMU Wiki

在2011年3月29日 (二) 21:04由Sakurai (對話 | 貢獻)所做的修訂版本
跳轉到: 導航, 搜索

目錄

搜尋引擎 與部落格


搜尋引擎的出現因素

  • 在Internet中現有網頁數
  • 已經沒有人統計了
  • 因為統計一點都沒有用
  • 但至少以「億」數以上的網頁
  • 在這麼多網頁中,那裡有我「要」的?

搜尋與檢索

  • 資料庫(以圖書館館藏為例)
    • 1.Index(架位號、索書碼、圖書館分類號.....)
    • 2.內容(書本本身)
  • 網頁的檢索(早期分類)
    • 1.手動/自動
    • 2.分類/不分類

網路上早期的搜尋方式

  • 人工分類
    • 剛開始最有名的Yahoo!
      • David Filo 和楊致遠(Jerry Yang) 1994年4月創立
      • 以階層式分類
      • 用資料庫貯存及檢索
    • 1995年起隨著Internet人口增加而急速成長

參考資料

  • 本土早期
    • 蕃薯藤 Yam
      • 1995年1月
    • GAIS (Global Area Information Servers)
      • 1995年底,中正大學資訊工程研究所,吳昇教授
    • Kimo
      • 不可考
      • 2001年2月與Yahoo!合併
    • Yam

蕃薯藤介紹


    • 蕃薯藤數位科技致力於提供全球華文地區個人網友及企 業用戶最佳之4C資訊傳播整合加值服務,是您選擇刊登 網路廣告與企業e化解決方案的最佳選擇,更是您每天必 上的網站,詳細資訊請參閱「關於蕃薯藤」站內資料。 您亦可透過左方的站內搜尋,快速取得相關資料。

蕃薯藤組織


    • Gais

Gais介紹

      • 全由台灣人開發的全文搜尋引擎
      • 特 色
      • 可 以 容 錯 搜 尋 或 近 似 搜 尋
      • 提 供 中 文 同 音 搜 尋
      • 可 以 做 全 文 檢 索 、 欄 位 檢 索 , 或 兩 者 混 合 檢 索
      • 可 以 使 用 自 然 語 言 檢 索
      • 可 使 用 有 序 性 之 布 林 檢 索 (Ordered Boolean)

專論—咕狗大神

  • 1998-9-7
    • 在加洲一個車庫裡開始
  • 1999
    • 前後獲得幾位大金主的支持
    • 共得資金2500萬美元
  • 2000
    • 成為Internet最大搜尋引擎
  • Google 的內幕
    • PageRankTM
      • PageRank 如同個別網頁價值的指示器,透過龐大的連結架構來信賴網站獨特地民主性質。簡單來說,Google 說明網頁 A 連結至網頁 B 時,則視為網頁 A 投給網頁 B 一票。當然,Google 會查看票數來源,或是連結網頁接收的票數;同時它也會分析參予投票的網頁。透過「重要的」網頁來參予投票,並且幫助其它的網頁也成為「重要的」網頁資料。


SEO

  • SEO (Search engine optimization)
    • 現在多數網站(尤其是商業網站)最關心的是多少人會來他們的網站。
    • 很多人會由搜尋引擎來到各網站
    • 讓一個網站容易被搜尋引擎找到,變成一個新的技術
  • Google Bomber (2007前)
  • 內幕的內幕
    • 搜尋引擎
    • 利用程式在浩瀚的網路空間找使用者要的資料
    • 她是機器自動化,不能用人為去改變整個搜尋的邏輯
    • 但可以改變一些「參數」
    • 在大陸找不到「民主」、「自由主義」....
    • 2007年1月之後'miserable failure' 不會連到President Bush
  • SEO vs Google
    • 兩難困境
      • 業主希望自的網頁出現在相關詞搜尋的前幾頁
    • Google希望使用者在前幾頁就找到他要找的
    • SEO要提升前者
    • 但那對後者不見得有好的結果
  • Google的對策
  • 改變演算法參數
  1. 站點的年齡
  2. 自該網域註冊後過多久
  3. 內容的年齡
  4. 新內容增加的規律性
  5. 鏈接的年齡和連接站點的名譽

參考資料

搜尋技巧

  • 最大關鍵就在關鍵詞
    • 明確
    • 由大至小縮小範圍
    • 換個角度
    • 換個語言
  • 搜尋技巧—實例
    • 想知醫學中心有關兒童發展相關業務
    • 「醫學中心有關兒童發展相關業務」為關鍵詞
      • 有一堆無關的
    • 「發展遲緩」為關鍵詞
      • 反而較接近
    • 再加「醫學中心」
      • 各家醫學中心的網頁會出現在第一頁(高醫在較下面)
  • Google desktop
    • 趨勢
    • 把Internet上的網頁當作自己電腦檔案的延伸
    • 實際上網路愈來愈寬,網頁連結愈來愈快
    • LAN WAN MAN 甚至自己PC分際愈來愈模糊

作業

省略

回到網際網路與心理學