第1章 量化生活(摘錄)
真正的問題在於,這一切的操作過程都是無形的。
演算法在我們瀏覽的網頁上,出現個人化的廣告選擇,或是Netflix網站決定該推薦什麼影片給我們,我們所看到的一切都是最終結果。
沃伯岡湖策略
成立於2011 年的Gild 是人力資源公司,替一些全球最大、最具聲望的科技公司招募人才。Gild 公司目前著重於開發演算法自動挖掘有天份的程式設計師,其成立宗旨就是將數位方程式應用在向來被視為不可靠的人才招募程序。為了達成這個目的,Gild 利用演算法分析成千上萬筆的個人資料,利用不同的測量指標和數據點,從中挖掘出Gild 所謂的「廣泛預測建模」(broad predictive modelling)的洞察。
這家公司成功發掘人才的故事令人印象深刻。最經典的便是現年26 歲、沒有上過大學的傑德.多明格斯(Jade Domingues),他住在南加州帕薩迪納市,靠信用卡賒賬度日,在家自學電腦程式設計。15被Gild 的演算程式「自動發掘」之後,他現在成了該公司旗下的一名程式設計師。他的故事其實一點也不特別。「有些人的履歷,你可能都不會瞧第二眼,但卻被我們的演算法預測是最適合這份工作的人,」Gild 的首席科學家薇薇安.明(Vivienne Ming)表示:「對我們的一些企業客戶來說,那正是他們所需要的尋找人才方式。這些公司收到成千上萬的履歷,他們不需要我們找人,他們需要我們找出『與眾不同』的人才。」
我第一次和薇薇安.明交談,是在2013 年五月,當時她正坐在計程車後座,準備前往舊金山國際機場。她是一位身材高挑、有銀藍色雙眼和草莓色金髮的女性,她也是卡內基美隆大學畢業的神經科學理論家。從她頭上戴著預先發行的谷歌眼鏡,可以很輕易看出她的電腦工程怪咖特性。除了她的神經科學背景之外,薇薇安.明在推特(Twitter)帳戶上描述自己是一位「大膽的企業家、不受歡迎的超級英雄、和非常愛睏的母親。」
薇薇安.明全心投入Gild 的理想願景,想將工作場所變成某種精英管理制度,她相信這麼做是應該的。「事情本來就應該用這種模式運作的,不是嗎?」她反問道。「做出聘用決策的人,應該要很清楚地了解我這個人,而不是光憑我的外表而下一個倉促的決定。但是,相信我,人的外表對於是否被錄用真的有很大的影響力。」若要問薇薇安.明為什麼對於第一印象給人錯誤判斷一事,感觸特別深,或許與她的成長背景有關。出生時原名為「伊文.坎培爾.史密斯」(Evan Campbell Smith),薇薇安.明在2008 年作了變性手術,直到那時才「擺脫性別認同危機的陰霾」。「我一向都不是一位正統的好學生,」她解釋說道:「我常常有很多科目被當,也經常在學校惹麻煩。我沒有辦法專心,但是我真的很在乎學習經驗。我惹上最大的麻煩就是說謊留在優等化學課,我很喜歡那一門課,我熱愛學習。」經歷變性手術成為女人之後,她注意到別人對待她的方式和以前不一樣了:她不再像以前一樣常被問到數學問題,也比較少被男同事邀請參加社交活動或業務聯繫。
對薇薇安.明來說,傳統人才招募策略存在兩個主要的問題。第一是他們固有的偏見。雖然大多數的人都認同招聘與自己不同背景的人員之價值,但他們並沒有社交管道認識這一類的人。她問說,為什麼典型的科技新創公司都是由年齡相仿、外形相似的成員所組成,都帶著一點兒工程師不修邊幅的樣貌?因為他們都雇用自己認識的人。一位白種、男性、中產階級上層、工作認真的工程師所交的朋友,根據統計,也很有可能是工作認真的工程師,他們也可能是、男性、中產階級上層人士。隨著數據演算文化接管一切,這些隨意的假設,在許多情況都變成一種規則。要想要進入臉書工作,在篩選的過程中使用的檢驗標準之一,便是找一個已經在臉書內部工作、也認識你的人推薦。這個和LinkedIn 的想法一樣,他們利用演算法搜尋個人、和他們想要接洽的人、兩者之間的關聯性。雖然這種概念在某種程度上是很不錯的,但也有不良的效應,這麼做也很可能排除了許多來自不同地區、社會和文化背景的人。
薇薇安.明提到的另一個問題便是(對於科學家而言,肯定是更嚴重的問題),從前的人才招募策略已經被證明不夠精確,尤其在預測職場上誰是最適任員工的這一方面。像矽谷這種強調數據驅動人才招募的客觀性應該勝於一切的地方,這一點特別不可原諒。比方說,谷歌運用所謂的「沃伯岡湖策略」(Lake Wobegon Stragety)來招募人才,這個名字源自於美國幽默作家蓋瑞森.凱勒(Garrison Keillor),他宣稱自己生長於虛構的沃伯岡湖,「那裡的所有女人都很強壯,男人都很英俊瀟灑,所有的小孩也都在水準之上。」根據谷歌的沃伯岡湖策略,在每年加倍成長的組織機構,要維持技術高水平,新進員工的能力必需是現任員工的平均水平之上,才能獲得錄用。要衡量像「能力」這種不可測量的概念,谷歌傳統上相當重視學術表現。一個人的在校成績和所唸的大學,被視為是預測職場成功表現的指標,因為它顯示過去在學校時是否認真嚴謹、努力不懈、如期完成工作的能力。一個在麻省理工學院就讀資訊工程學系的人,或許不是世界頂級的電腦工程師,但至少可以肯定地假設他們能力「夠好」,才能夠進入該科系就讀。反之,隨便找一個不是唸麻省理工學院的人,雖然還是可能有出色的表現,但他們搞砸的機率還是高了許多。在這個禁不起風險的行業裡,很少有人會因為在一個沒希望的身上賭注成功,而得到獎勵,但卻很有可能因為雇用了一個極不適任的員工,而丟掉飯碗。難怪許多科技公司都寧可選擇採取安全的玩法。
然而,隨著數據資料不斷地增加,以及演算系統能夠在訊息堆中快速尋找線索,谷歌意識到他們目前採用的預測工作能力的變量(包括在校成績、考試結果、以前的工作經驗、乃至於面試表現),對於什麼樣的人能在特定職務上有傑出表現的預測,準確性並不高。這個發現本身並不新奇。在1960 年代,電信巨人AT&T 向低階的經理人進行智力測驗,然後花了二十年的時間,追踪他們在組織內部的工作表現。跟一般人普遍的想法一樣,AT&T 設想這些智商較高的員工將會爬到最高階層,而智商較低的人則停留在公司基層,就如同水會自行找到水平面一樣。然而,研究發現,智商高低只能夠說明各經理人才表現不到15% 的變化。其餘的都是一些不可測量的變數組合來決定成就,例如人品、情感特質、社交能力,以及許多其它的特性。
谷歌一察覺到有必要增加人才招募的參數之後,這項文化任務就由Gild 得到了。每年不再僅限於上萬筆的人才資料庫,高科技公司現在幾乎擁有全世界的人可供選擇。畢竟,沒人能知道哪裡有可能意外發現未經琢磨的鑽石。為了避免損失,Gild 實際檢視測量潛在員工時,任何一丁點兒關於他們的資訊都不放過。薇薇安.明將傳統的人為招募與這種科學方法相比較,就像西洋棋棋士對抗專門分析西洋棋的超級電腦「深藍」(Deep Blue)一樣,「深藍」曾經擊敗世界冠軍棋手蓋瑞.卡斯帕羅夫(Garry Kasparov),此舉曾被《新聞週刊》(Newsweek)描述成「人腦的最後戰役」。薇薇安.明表示:「電腦精密地規劃每一步可能的走法,並選擇最佳的一步棋;而西洋棋專家並不是如此。他們暗自捨棄大多數可能的步數,只考慮二、三、四種可能性,而這些步數湊巧是不錯的。」她認為,人才聘用的人為決策也正是如此,只是在這種情況下,所要考慮的變數正好沒有那麼多。盡可能觀察一個人所有的數據點,那麼許多異常的因素,如面試者那天是否碰巧狀況不佳等,都可以被排除在外。Gild 也額外檢視人們所瀏覽的網站,這一點被證明是預測職場技能的一個強力因子。「如果你花費太多時間在網路日誌上,那表示你可能不會是一個優秀的電腦程式人員,遠不如在Quora 線上知識市場上下功夫的人,」薇薇安.明以兩位臉書舊員工所建立的Quora 問答網站為例。現在就連推特上的推文都能夠利用語義或意見探勘來挖掘有用的資訊。最後,結合一切考量的因素,每一個潛在雇員都會得到一個「Gild 比分」,滿分是一百分。
「如果你對演算法很熱衷,這是一件很酷的事,但真正重要的是,我們最終致力於獲取的,是對於人存在於世界一個獨立完整的描述。」她說:「我們所談論的演算法,它真正的意圖就是總結你的人生,對於你究竟是怎麼的一個人,建立一個非常準確的表述。」
量化人類潛能
開發評估個人職場能力的判斷指標,Gild 並不是唯一對此感興趣的公司。在2012 年,針對臉書的個人檔案是否能成為預測一個人未來工作成功與否的指標,有三所大學對此進行研究。藉由分析照片、塗鴉牆上的貼文、留言、個人檔案等,研究者認為,對於回答「這個人是否值得信賴?」「這個人的情緒是否穩定?」這一類的問題,都有相當高的準確性。常旅行、交遊廣闊、有廣泛的興趣和嗜好的學生,通常得到正面的評價。參加派對的照片也不見得一定是負面的,因為人們所謂的派對大王通常都是比較外向和友善的:兩者都被視為職場表現成功的理想特質。做出預測之後六個月,研究者追蹤訪問五十六位受測者的雇主,結果發現臉書的得分特質,如認真負責、好相處、有求知慾等,和工作表現呈現相當大的關聯性。他們的研究結論是,臉書的個人檔案是很強的指標,因為和傳統的工作面試相較之下,求職應徵者比較不容易在社群網站「假造自己的人格特質。」
推特讓你繼續「活」下去
在2013年十一月,我為《快速企業》寫了一篇文章,內容是關於兩位電腦科學研究人員創造了一個演算法,利用用戶在推特上的推文來生產個人的自傳。這是以「話題提取」為主題,很吸引人的一項實驗研究,依據該篇文章的讀者回饋和點閱量。該項研究的作者之一李紀為(Jiwei Li)解釋說,推特是研究人員最佳的利器。首先,它鼓勵用戶在公開、容易取得的媒體中記錄日誌。其次,這個微網誌站上強調一百四十字的訊息量限制,迫使用戶必須簡明扼要:將複雜的人生事件壓縮成幾個短句。
要讀取一個人過去好幾年的推文,必然是非常耗時的(尤其是對象數量龐大時,例如,假如你是老闆需要更深入了解旗下員工時,可能就得這麼做)。這個演算法的主要任務就是掃描所有的資料,並將這些資料以更容易理解、更容易閱讀的形式呈現;只提取一個人的生涯事蹟中重大、相關的消息。它運作的方式,就是分析每則推文內容,將之劃分成「公眾」和「私人」範疇(例如,對於重要體育事件的個人看法,相對於個人的生日)。然後再將每一個範疇細分成「一般的」和「特殊的」類別。「一般」類別的典型代表事件,諸如抱怨通勤工作、對於每週瑜伽課的評論,這類事件由於長時間重複發生,顯示可預測性。反之,「特殊」類別包含改變人生的重大事件,例如婚禮、得到一份新工作,這類事件也會是發生在短時間內、許多活動的熱門主題。
不令人意外的,正是最後這類「私人─特殊」事件,才是生產微型傳記最感興趣的部份。任何讀過暢銷傳記的人都知道,主要內容通常著重於傳記人物獨特的生平事件,而不是在於廣大社會中的一般個人背景。例如,華特.艾薩克森所推出的《賈伯斯傳》(Walter Isaacson’s Steve Jobs),大多著墨於賈伯斯創造iPhone 智慧型手機的成就,而非他每天從加州帕羅奧多市家中開車往返路途之所見。然而,若說「公眾」或「一般」的事件單純只是需要過濾掉的雜訊,這種假設有其風險存在,它過度簡化了一個人的生平,這些事件宛如存在於一個缺少情境的真空之中。如果你身處於政治圈中,無可否認的,像大選或海外衝突這一類「公眾」事件,對於個人私生活絕對有其影響。對於那些重覆發生、本身又不特殊的事件也是如此。上班族通勤到辦公室,或住在內都市的窮人家庭,家裡斷電或住家附近犯罪猖獗,這些可能都不是「特殊」事件,但多多少少說明了他們的生活狀況,更甚於他們向未來伴侶求婚時標注的地理位置。
在現今的數位世界,自我的概念大多取決於演算法的推論──也就是比較個人特質與大量的數據資料「認知」的特質,再找出相互關係。從實際意義上來說,這些是自我的方程式。有些極度複雜,得依賴搜集特定人士盡可能多的數據點,才能提供結論。有些則強調簡化:就好比抽象藝術,盡可能用最廣義的「外形」來定義人,亦即「歸謬法」。一家名為Hunch的科技新創公司就宣稱,只要利用五個數據點,它幾乎就能回答關於消費者喜好的任何問題,準確性可達至80% 到85%。同時,「按讚代表你是誰」網站,透過分析用戶在臉書上按「讚」的內容、與一組「社會層面」數據資料,兩者之間的普遍相關性,來生產特定用戶詳細的檔案。例如,據說,常對線上藝術社區網站deviantART.com 按「讚」的用戶,政治上傾向於自由派;而對「全美國運動汽車競賽協會」按「讚」的人,則傾向於保守派。其它的「讚」也同樣能夠預測像是「多疑的」或「含蓄的」人格類型。
劍橋大學研究學者在2013年執行過類似的研究,利用演算法分析五萬八千名美國臉書用戶的數據資料,結果發現透過用戶按「讚」的內容,能準確推斷其人格特質,包括種族、年齡、智商、性傾向、個性、嗑藥情形和政治觀點等。另一個服務網站TweetPsych 宣稱,它能夠利用演算法,依據用戶選擇的推文主題,包括學習、金錢、情感和焦慮等,計算出人的情緒和智力商數。還有更多研究已經證明能夠推論性別、性傾向、政治偏好、宗教和種族,準確性高達75% 以上。
獨立自主的個體概念,與演算法傾向於將個人視為聚合群眾當中一個可歸類的節點,這兩者之間的鴻溝,能導致數位方程式時代所謂的自我危機。在2012年,針對臉書在社群網站用戶界面,推出新版的時間軸模式,有一名用戶評論,這不同於以往的用戶界面,時間軸模式具有敘事效果,將一連串事件依歷史順序排列(如工作、人際關係),未知的範疇則留下空白,這麼做是希望用戶可以在自己的時間軸上,繼續增補個人大事年表,回頭去敘述個人的故事,直到「出生」這個範疇。該用戶說,「我感覺被出賣了⋯這個界面表面上看似提供許多選擇,實際上卻將我們所有的創造力限制在預設、包裝好的框架範疇裡,要我們在其中找到自己的定位,」該用戶指出:
它以不同、微妙的形式傷害我們所有的人。當然,要我在框框中勾選「女性」,我個人沒什麼問題,但我認識至少兩打的朋友,都不知該如何勾選。我應該要宣告我的「家鄉」在哪兒,但我已經有二十幾年沒有所謂的家鄉,因此那對我根本不管用。現在,我還得在地圖上標記地方,或者被強迫接受系統預設地圖,像今天下午出現在我個人檔案的⋯ 假若我一點都不想受任何時間的制約、不想讓臉書來決定什麼是我人生的「重大」事件呢?
抑制清道夫等級
網際網路設備服務商「思科系統」曾將他們不夠優質的客戶稱之為「清道夫等級」(scavenger class),公司對這類客戶在某些應用程式上提供「非盡力而為的服務」。在碰上網路壅塞和下載速度變慢的時段,對於清道夫等級的用戶,流量可能會「被抑制到近乎零」。反之,對於受重視的企業用戶,將得到思科保證的自由順暢、獨享贊助的高速途徑。類似的差別待遇,也在別處可見。亞美亞電信公司的廣告行銷手冊,也同樣保證他們的電話預定系統能利用演算法,將個別電話中心來電者的數量和數據資料庫作比對,如果來電者是名列在前5%的客戶,系統會立刻將電話轉至服務人員高優先處理,當服務人員接起電話時,會聽到低聲的提示,告知現在的通話對象是「名列前5%」的客戶。同樣的技術可能被用在其它情況下執行,利用演算法過濾個別來電者的人格特質,來電者可能依其人格類型而接受不同的服務。因此,比較容易對服務失去耐心、卻又能讓公司有利可圖的客戶,會被安排即刻得到服務,優先於比較拖拖拉拉、愛提問、卻又不太可能讓公司未來賺很多錢的這類客戶。
或許這種「人性軟體分類」最細微的例子,可見於演算法驅動的「差別取價」概念。這是許多網路商店,包括亞馬遜在內,已經在試驗的東西。不需要行銷術語的額外虛飾,差別取價意味著,同一項產品,某些用戶可能會比其他人支付更高的價格。理論上,這裡所採用的演算法,和那些買了《哈利波特》和《暮光之城》(Twilight)這兩本書的讀者,可能也會喜歡《飢餓遊戲》(The Hunger Games)三部曲的預測演算法,沒什麼不同。這呈現出另一種層次的個人化,也就是關於那些記住你姓名的網站(而且,最重要的是,記住你的信用卡資料)。
在2012年九月,谷歌取得「電子內容動態定價」的專利權,能夠依據演算法判斷用戶購買特定產品的可能性高低,而隨機改變線上資料的定價,例如影片和錄音、電子書和電腦遊戲等。該專利權申請中還附上實例欣喜地證明,某些用戶可能被說服支付比其他人高於四倍以上的費用,買下完全相同的數位檔案。換句話說,如果谷歌的演算法根據你以前的搜尋記錄,「知道」你很容易受《哈利波特》和《暮光之城》這類的青少年讀物吸引,它便可以確定你願意花大錢買下《飢餓遊戲》。同時,也能夠透過降低價格增加吸引力,誘使那些曾對青少年魔法師、和帥哥吸血鬼表達過一丁點兒興趣的人,購買這些產品。
最近幾年所謂「情感嗅探」的演算法也慢慢崛起,設計旨在依據用戶的聲音語調、臉部表情、甚至網頁瀏覽記錄,來預測他們的情感狀態。「微軟研究院」就執行了一項研究,分析用戶的電話紀錄、使用的應用程式、和目前所在位置,然後利用這些指標預測他們的心情。
根據微軟以演算法對每日心情的預測,它從一開始66% 的準確性,經過兩個月的資料訓練之後,逐漸增加到93%。由於心情對於消費者的喜好有極大的影響,諸如此類的訊息對於市場行銷人員應該是極其珍貴的。比方說,假設你的電腦或智慧型手機能夠判斷,你在某一特定時刻可能特別容易感覺脆弱,在這種情況下,也許可以暗中提高你可能感興趣的產品價格,因為設計來「嗅探」心情的演算法判定,就統計上來說,你在這個情緒狀態下,很有可能會有購物欲望。
主張自由市場的理想主義者,或許會贊同這樣的方法。在高檔餐廳館喝一瓶啤酒所支付的價錢,可能在其它地方用一半價格就可以買到了,差別取價的概念也可能運用同樣的方式,以更加科學的精確度,確保一個人以其願意支付的價格購買某一個產品。
然而,雖然真是如此,以下這個比喻也許更加準確,未來餐廳服務生會偷翻你的私人物品,查看以前的收據,他們再來決定,你該為這一餐的飲食付出多少費用。