如何用網路查資料

分享我如何快速查資料來增進工作效率。

為什麼要學怎麼搜尋

在科技業中知識或資訊的有效期限很短。今天可能覺得是有用的東西,明天就變成過時的作法或產品。

我和在美國教在職資料科學班的講師聊過,她說她觀察學生和行家之間最大的差異之一是:利用搜尋引擎來找答案的速度。學生比專家來得慢很多,搜尋結果的品質差異也大。

我在工作場所的觀察也是一樣:對一般人而言,現在工作的速度不是取決於記得多少(Information storage)而是搜尋速度和品質(Information retrieval)。

換句話說,查資料的速度,是決定工作效率的關鍵。

根據我的估計,在工作中我一天至少會搜尋 30 次,如果每次搜尋的結果能讓我省下三分鐘,那就代表我每天能省一個半小時,一年就是五百小時,餘下的時間能拿去做其他事來再投資在自己身上。

搜尋引擎

我用的搜尋引擎主要是兩個

DDG的中文搜尋個人認為還有待加強,但英文已經夠好並和Google作出差異化。因為我對Google的最近廣告越來越多很感冒,所以工作時大多數時間是用DDG。

我的搜尋模式

兩步驟:搜尋和分析

搜尋其實有兩個步驟:

  1. 找出相關資料
  2. 篩選出有用資料

我的作法是將這兩步分開,如影片:

根據我對自己的觀察,將這兩個步驟分開來作是最有效率的。以影片的例子來說:

  1. 先將所有可能的單詞搜尋出來,並在瀏覽器內開出多個分頁 (善用 Ctrl+滑鼠左鍵點連結來開啟新分頁)。至少找出十到十五個不同的網頁。
  2. 等把搜尋結果都開完之後,再開始快速掃過各分頁中內容。只要網頁是看起來很廢或像是在打廣告,不用細讀,直接關掉。
  3. 關一關大概會剩六七個。這時再開始細讀分頁中的內容。至少會讀兩到三個分頁才會開始實作。

將這些步驟分開的目的是為了增強集中力:如果打開一個網頁後馬上開始細讀,就會導致

  • 搜尋的範圍不夠廣:通常讀到第二或第三個網頁就會覺得自己已經知道怎麼作了,但實際上還漏掉很多資訊。
  • 腦子要在「這一頁在講什麼」和「我該打什麼詞進去搜尋」之間切換。浪費時間,也消耗集中力。

開網頁的時間成本很低,所以在第一步中大量開網頁來獲取資訊是很有效率的辦法。

對我來說,集中力和專注度是最重要的資源。能將工作分批來有效使用,可以提升效率,避免浪費。

技巧:善用搜尋引擎的內建功能

不管是 Google 或 DDG 都有內建特定字串來幫助篩選搜尋結果

在搜尋時,最重要的是善用模糊搜尋:很多人其實不知道可以一次搜尋好幾個詞!

當把多個詞用空白隔開時,搜尋引擎會想辦法找出和多個詞契合的網頁。比如說,我如果搜尋

  • python api package

則搜尋引擎會想辦法找出和這三個詞同時有高度相關的網頁。

技巧:善用動詞、形容詞、語助詞

很多時候加上一些其他詞會找到更精確的結果。舉例來說,搜尋

  • python api apckage

  • best python api package

就會看到一堆列出不同包裹排名的文章,結果和沒加 best 差很多。

如果搜尋

  • how to python api

則會找出很多教學。

實作例子:

技巧:善用搜尋引擎特殊功能

每個搜尋引擎都還會有一些特殊功能:

Google

  • 雙引號 "" 代表其中的詞必須100%符合。搜尋 "python" 代表網頁內必須含有 python 這詞
  • site:ptt.cc 代表只會列出特定網站內的結果,如 ptt.cc 內的結果
  • blog:python 代表只會列出 Google 認為是部落格文章的網頁,在搜尋入門教學時相當好用

DDG

  • + 加號的功能同 Google 的雙引號。
  • - 減號代表搜尋結果內不能包含內容。一個經典的例子是:兩三年前搜尋 Anaconda,在Google中的第一個結果通常是歌手 Nicki Minaj 的音樂影片,但如果是寫 Python 的人,通常是想要抓包裹。這時減號 -“Minaj” 就很方便。PS. 現在 Anaconda 比 Nicki Minaj 還有名了。

技巧:善用日期過濾

如果是要搜尋科技相關的內容,通常3年為一個世代。

這個在工作外也很好用。我常用日期來過濾旅遊景點或店家評價,善用日期過濾來篩掉過時資訊,通常可以得到較有用的結果。

日期篩選

技巧:盡量找出至少兩種做法

當我剛開始工作時有一個心態:只要找到第一個解答就可以開始做。但我現在的經驗是,這世界上往往並沒有所謂最好的辦法。再解決問題時,找出二種以上的作法來分析利弊並作取捨,才最有可能找到理想方案。

舉例來說,在機器學習實作中,如果用Python寫API,則大部分的教學都會說用Flask。但現在有更快更方便的包裹叫 FastAPI。Flask 的教學因為發表較久,通常都落在搜尋結果的第一頁。如果只點了幾個 Flask 教學後開始實作,就會漏掉現今最好的作法,增加工作中的無形成本,拖累之後的效率。

Written on March 25, 2020