搜尋引擎歷史與使用技巧

出自KMU Wiki

在2008年4月30日 (三) 15:07由Sakurai (對話 | 貢獻)所做的修訂版本
跳轉到: 導航, 搜索

目錄

搜尋引擎 與部落格


搜尋引擎的出現因素

  • 在Internet中現有網頁數
  • 已經沒有人統計了
  • 因為統計一點都沒有用
  • 但至少以「億」數以上的網頁
  • 在這麼多網頁中,那裡有我「要」的?

搜尋與檢索

  • 資料庫(以圖書館館藏為例)
    • 1.Index(架位號、索書碼、圖書館分類號.....)
    • 2.內容(書本本身)
  • 網頁的檢索(早期分類)
    • 1.手動/自動
    • 2.分類/不分類

網路上早期的搜尋方式

  • 人工分類
    • 剛開始最有名的Yahoo!
      • David Filo 和楊致遠(Jerry Yang) 1994年4月創立
      • 以階層式分類
      • 用資料庫貯存及檢索
    • 1995年起隨著Internet人口增加而急速成長

參考資料

  • 本土早期
    • 蕃薯藤 Yam
      • 1995年1月
    • GAIS (Global Area Information Servers)
      • 1995年底,中正大學資訊工程研究所,吳昇教授
    • Kimo
      • 不可考
      • 2001年2月與Yahoo!合併
    • Yam

蕃薯藤介紹


    • 蕃薯藤數位科技致力於提供全球華文地區個人網友及企 業用戶最佳之4C資訊傳播整合加值服務,是您選擇刊登 網路廣告與企業e化解決方案的最佳選擇,更是您每天必 上的網站,詳細資訊請參閱「關於蕃薯藤」站內資料。 您亦可透過左方的站內搜尋,快速取得相關資料。

蕃薯藤組織


    • Gais

Gais介紹

      • 全由台灣人開發的全文搜尋引擎
      • 特 色
      • 可 以 容 錯 搜 尋 或 近 似 搜 尋
      • 提 供 中 文 同 音 搜 尋
      • 可 以 做 全 文 檢 索 、 欄 位 檢 索 , 或 兩 者 混 合 檢 索
      • 可 以 使 用 自 然 語 言 檢 索
      • 可 使 用 有 序 性 之 布 林 檢 索 (Ordered Boolean)

專論—咕狗大神

  • 1998-9-7
    • 在加洲一個車庫裡開始
  • 1999
    • 前後獲得幾位大金主的支持
    • 共得資金2500萬美元
  • 2000
    • 成為Internet最大搜尋引擎
  • Google 的內幕
    • PageRankTM
      • PageRank 如同個別網頁價值的指示器,透過龐大的連結架構來信賴網站獨特地民主性質。簡單來說,Google 說明網頁 A 連結至網頁 B 時,則視為網頁 A 投給網頁 B 一票。當然,Google 會查看票數來源,或是連結網頁接收的票數;同時它也會分析參予投票的網頁。透過「重要的」網頁來參予投票,並且幫助其它的網頁也成為「重要的」網頁資料。


SEO

  • SEO (Search engine optimization)
    • 現在多數網站(尤其是商業網站)最關心的是多少人會來他們的網站。
    • 很多人會由搜尋引擎來到各網站
    • 讓一個網站容易被搜尋引擎找到,變成一個新的技術
  • Google Bomber (2007前)
  • 內幕的內幕
    • 搜尋引擎
    • 利用程式在浩瀚的網路空間找使用者要的資料
    • 她是機器自動化,不能用人為去改變整個搜尋的邏輯
    • 但可以改變一些「參數」
    • 在大陸找不到「民主」、「自由主義」....
    • 2007年1月之後'miserable failure' 不會連到President Bush
  • SEO vs Google
    • 兩難困境
      • 業主希望自的網頁出現在相關詞搜尋的前幾頁
    • Google希望使用者在前幾頁就找到他要找的
    • SEO要提升前者
    • 但那對後者不見得有好的結果
  • Google的對策
  • 改變演算法參數
  1. 站點的年齡
  2. 自該網域註冊後過多久
  3. 內容的年齡
  4. 新內容增加的規律性
  5. 鏈接的年齡和連接站點的名譽

參考資料

搜尋技巧

  • 最大關鍵就在關鍵詞
    • 明確
    • 由大至小縮小範圍
    • 換個角度
    • 換個語言
  • 搜尋技巧—實例
    • 想知醫學中心有關兒童發展相關業務
    • 「醫學中心有關兒童發展相關業務」為關鍵詞
      • 有一堆無關的
    • 「發展遲緩」為關鍵詞
      • 反而較接近
    • 再加「醫學中心」
      • 各家醫學中心的網頁會出現在第一頁(高醫在較下面)
  • 進階技巧
    • 改用搜尋引擎
      • google, yahoo, msn, ...重疊率不高
    • 用詞定義相關
      • wikipedia
      • 教育部國語辭典
      • 教育部成語典
  • Google desktop
    • 趨勢
    • 把Internet上的網頁當作自己電腦檔案的延伸
    • 實際上網路愈來愈寬,網頁連結愈來愈快
    • LAN WAN MAN 甚至自己PC分際愈來愈模糊

部落格

  • Weblog 即web上的log(網路上的日誌)
  • wikipedia的定義(四要素)
    • 彙整(Archive)
    • 靜態鏈結(Permalink)
    • 時間戳印
    • 日期標頭
  • 部落格附加功能
    • RSS
    • Really Simple Syndication(RSS 2.0)
    • RDF (Resource Description Framework) Site Summary(RSS 0.91, RSS 1.0)
    • Rich Site Summary (RSS 0.9 and 1.0)
    • TrackBack
      • 是一種網路日誌應用工具,它可以讓網誌作者知道有那些人看到自己的文章後撰寫了與之有關的短文。
      • wikipedia之定義
      • 技術上:傳送TrackBack ping給指定的URL
        • title:傳送者定的名稱
        • excerpt:摘要
        • url
        • blog_name

部落格的行銷

  • 被動的
    • 勤寫文章
    • 等待有人(或搜尋引擎)來看你的
  • 主動的
    • 與他們部落格間有資訊往來
    • 在書籤上登錄
    • 串聯(資訊聯播)

作業

  • 在討論區貼你的部落格URL
  • 在你部落格貼你上台報的構想書
  • 另外請搜尋Internet為你上台報告議題的有關歷史找出一些相關資料,並根據這一資料寫一篇文章
    • 上述前兩項請於本週五23:59前完成
    • 最後一項請於下週五23:59前完成