群眾外包:天才般的需求匹配,或世界級的偉大剝削

前圖紙-avatar-img
發佈於公民社會 個房間
更新 發佈閱讀 7 分鐘

〈群眾外包:天才般的需求匹配,或世界級的偉大剝削〉2023-11-15


  「巴拿馬運河和埃及金字塔,人類最宏大的專案需要十萬人的參與。」


  說話者名為Luis von Ahn。你可能並不認識這個看起來不太像英文的名字,但他在二十歲出頭就做出的一項發明,卻深刻地滲入到了網路時代中,影響了我們每個人的生活。


  當這名於2006年獲得麥克阿瑟獎金的年輕科學家與創新家說出「現在,在人類歷史上,我們將第一次能夠如此輕鬆地獲得所有這些數量的勞動力。想像一下如果我們有5億人,我們能夠做什麼?」時,他並不是在談論一種空洞的願景。而是,他真正地為世界帶來一種新的模式,讓全世界的無數人自願地、不知不覺地,每天為整體世界發展貢獻一部分自己的腦力與勞力。



  千禧年,網路的蠻荒時期。使用系統自動搶票的黃牛、大量註冊免費信箱發送垃圾郵件的不肖人士就已經在網路上大量出現。為了應對這項連當時的頂尖科技公司都束手無策的問題,在卡內基梅隆大學研究計算機科學與密碼學的路易斯.馮.安(Luis von Ahn),和伙伴一同提出了「全自動區分電腦和人類的圖靈測試(CAPTCHA,也就是俗稱的驗證碼)」的構想與系統。


  這項系統很快地被雅虎和其他網路公司使用。一方面有效地讓當時許多無法辨識圖像的簡單腳本難以發揮作用,另一方面,也讓我們這些人類,時常必須在登入帳號時,煩燥地辨識與輸入那些歪七扭八的字詞。



  隨著驗證碼的廣泛出現,路易斯意識到了這個系統對人類總體時間與腦力的浪費,同時看見了「輸入驗證碼」這項活動包含的潛力。於是,他開啟了「reCAPTCHA 計畫」,從這一刻起,那些顯示在我們面前的驗證碼圖像,將不再是隨機的亂碼,而是兩個有意義的單詞。


  他並不是要我們透過這些單詞來學英文(即便我們之後會發現,路易斯對人們學習語言的需求同樣有相當程度的重視),而是,他希望將這些人類為了對網站證明自己是人類而浪費掉的時間,拿來協助曠時費日的圖書數位化工作。雖然OCR(光學字元辨識)技術已經有一定的發展,但在當時,還是有大約20%的材料沒有辦法被確定地辨識出來。於是,我們輸入驗證碼的這個過程,就被媒合進了這項辨識工作之中。


  在那套系統當中,我們面前的兩個單詞,由一個OCR能夠辨識的單詞與一個它無法辨識的單詞來組成。系統會先判斷我們是否答對第一個單詞,如果我們答對,我們輸入的第二個單詞則會被「計點」。當點數足夠時,你與世界另一端的人們共同給出的答案便會被認為是正確的答案。


  於是,我們很長一段時間內都為發行了一百多年的《紐約時報》數位化做出了貢獻。並在reCAPTCHA被Google收購後,我們也開始為Google辨識街景、以及訓練AI辨識各式各樣的事物(譬如說:請在下列圖片中選出腳踏車)。也就是說,如果某一天自動駕駛電動車真的全面普及了,不客氣。



  這種將廣大用戶的微小行為與大規模計劃相互媒合的發想,讓路易斯在一些時候也被稱為「群眾外包之父」。不負這一稱呼地,在路易斯創立的另一間公司上,他也運用了這樣的思維。


  就像我們前面已經埋下的伏筆,路易斯的另一個目標是讓全世界的人都可以有機會免費學習外語。於是,已經成為計算機科學教授的路易斯與其研究生共同創立了一個語言學習平台,由拉丁語字根duo(兩個)和lingo(語言)組成的Duolingo(多鄰國)。在這裡,我們並不打算過多地談論多鄰國如何透過口耳相傳取得成功、甚至於2021在納斯達克掛牌上市。而是展示出,就連多鄰國的使用者,也已經在不知不覺間,參與了「群眾外包」。


  作為一個語言學習網站(程式),多鄰國在基本免費的條件下,提供了相當多樣的語言選擇。一開始,多鄰國僅提供了特定的幾種語言學習。而隨著用戶量的增加,這些用戶所提供的不同語言間的翻譯也持續增加。這些翻譯,則會反過來成為多鄰國提供新的語言學習課程的材料,讓它能夠更好地建構新課程,時至今日,上面已經累積了超過一百種不同的語言課程,並持續增加當中。


  同時,多鄰國也讓企業提供他們需要翻譯的文件,就像當時把需要數位化的文件分散地做成驗證碼圖像,這些文件也被分解成細小的翻譯練習題。用戶在練習翻譯的同時,也相當於主動提供多鄰國翻譯所需的勞力,讓它們能夠從需要文件翻譯的企業那裡得到相應的報酬。譬如CNN和BuzzFeed的網頁翻譯,都包含有多鄰國用戶的「熱心」參與。



  從創意和有效利用人力的角度來說,我們都不得不佩服路易斯這種「讓世界各地群眾共同成就大項目」的思維。但另一方面,如果多鄰國還可以說是「用戶主動想要學習外語與企業需要文件翻譯的各取所需」,reCAPTCHA對人類集體時間和勞動力的無償徵用,其實不能完全說是我們的「自願參與」。


  雖然說CAPTCHA替人們抵擋了一部分自動腳本,但與其說這是維護用戶的利益,更大程度上,也是在幫企業與網站解決問題。從當前的技術來說,透過偵測用戶按下「我不是機器人」時的滑鼠軌跡,其實已經可以很大程度辨識出用戶是否為人類。也有越來越多駭客程式能夠破解常見的reCAPTCHA內容。


  此時,早就超出路易斯原初構想,被Google收入囊中的reCAPTCHA,真的還是在「將人類浪費掉的時間用來做其他有價值的事」嗎?還是,Google正在利用這個其實不再需要,但我們已經逐漸習慣的行為,將每一個網路用戶都當成供它剝削的免費勞工?


  也許在這個過程中,我們真的共同成就了一些人類科技的重要進程,但不能不去問的是:我們有說我們要嗎?我們是否將過多的個人時間,在不知不覺中又送給了這些企業。





延伸閱讀:

〈那些被奪取的時間:前Google員工崔斯坦的反省〉

〈《誰偷走了你的專注力?》閱讀筆記(一):我們的行為已經被科技產品給重塑〉

〈預防小孩沉迷手遊:除了禁止,還能做些什麼?〉

〈如何讓自己成功地被賣出去?〉

〈睡夢中安詳離去的司機〉

〈大收購--動視暴雪對微軟的戰略價值〉




留言
avatar-img
前圖紙的沙龍
138會員
1.2K內容數
一個寫作實踐,關於我看到和思考中的事情。
前圖紙的沙龍的其他內容
2024/12/31
  作為一名每天晚上留給自己兩小時坐在電腦前打字的人,今天的行程自然也是這樣。如果要說今年有什麼成就的話:沒有任何一天真的沒挪出時間或寫不出東西。這值得給自己一點微鼓勵(左右手食指快速彼此觸碰六下)。本來還想寫些下個年度的安排,但今日事今日畢,明年的事情,明年再來說。
2024/12/31
  作為一名每天晚上留給自己兩小時坐在電腦前打字的人,今天的行程自然也是這樣。如果要說今年有什麼成就的話:沒有任何一天真的沒挪出時間或寫不出東西。這值得給自己一點微鼓勵(左右手食指快速彼此觸碰六下)。本來還想寫些下個年度的安排,但今日事今日畢,明年的事情,明年再來說。
2024/12/30
  我們能看見樓上的房東與樓下的房客,我們能往上走也能往下落。我們會經歷痛苦與不安、焦慮與急躁,但同時又有足夠的支持性社會網絡。我們不是那些「只要努力就會成功」的人,也不是那些「再怎麼努力都注定要被辜負」的人。我們所要前往的地方既要求著努力,也要求著機運。
2024/12/30
  我們能看見樓上的房東與樓下的房客,我們能往上走也能往下落。我們會經歷痛苦與不安、焦慮與急躁,但同時又有足夠的支持性社會網絡。我們不是那些「只要努力就會成功」的人,也不是那些「再怎麼努力都注定要被辜負」的人。我們所要前往的地方既要求著努力,也要求著機運。
2024/12/29
  一個真正遵循道德或任何一種規範的所謂「自律」的人,不應該僅僅是遵循一個現存的規範,依樣畫葫蘆地將自己行為成該種規範的形狀。而是,他會去給出一個,按照他自己的形象構造出來的規則。他不是放棄思考,被動地遵循。而是,透過規則,他去將自己展現為自身行為的主人,去透過規則落實自己的價值觀與意志。
2024/12/29
  一個真正遵循道德或任何一種規範的所謂「自律」的人,不應該僅僅是遵循一個現存的規範,依樣畫葫蘆地將自己行為成該種規範的形狀。而是,他會去給出一個,按照他自己的形象構造出來的規則。他不是放棄思考,被動地遵循。而是,透過規則,他去將自己展現為自身行為的主人,去透過規則落實自己的價值觀與意志。
看更多
你可能也想看
Thumbnail
我們越來越習慣讓 AI 幫我們讀、幫我們選、幫我們說。 但那份便利背後,讓我們失去了原始資料的敏銳度—— 你已經不再問:「這句話,真的是我該相信的嗎?」 真正的資訊素養,不是會問 AI, 而是知道什麼不能問。
Thumbnail
我們越來越習慣讓 AI 幫我們讀、幫我們選、幫我們說。 但那份便利背後,讓我們失去了原始資料的敏銳度—— 你已經不再問:「這句話,真的是我該相信的嗎?」 真正的資訊素養,不是會問 AI, 而是知道什麼不能問。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
當 AI 已經能替你寫簡報、開會、甚至幫你加班,最關鍵的一步卻要你親手落筆。本文透過最新數據、腦科學實驗與 2050 年的職場想像,揭示為何「寫得一手好字」可能成為深偽年代裡最難被複製的人類底牌。
Thumbnail
當 AI 已經能替你寫簡報、開會、甚至幫你加班,最關鍵的一步卻要你親手落筆。本文透過最新數據、腦科學實驗與 2050 年的職場想像,揭示為何「寫得一手好字」可能成為深偽年代裡最難被複製的人類底牌。
Thumbnail
為演算法服務的免洗人力 (菲爾.瓊斯,商周出版) 人工智慧及演算法的大量應用,卻在你看不到的地方,有Google、亞馬遜、Uber、FB等公司推出的群包平台,透過網路及演算法,把本來請人工作的僱傭關係,打散成支離破碎的Case,然後僱傭關係變成了承攬關係。
Thumbnail
為演算法服務的免洗人力 (菲爾.瓊斯,商周出版) 人工智慧及演算法的大量應用,卻在你看不到的地方,有Google、亞馬遜、Uber、FB等公司推出的群包平台,透過網路及演算法,把本來請人工作的僱傭關係,打散成支離破碎的Case,然後僱傭關係變成了承攬關係。
Thumbnail
  在當時,有大約20%的文字材料沒有辦法被確定地辨識出來。於是,我們輸入驗證碼的這個過程,就被媒合進了這項辨識工作之中。在那套系統當中,我們面前的兩個單詞,由一個OCR能夠辨識的單詞與一個它無法辨識的單詞組成。如果我們答對第一個單詞,我們輸入的第二個單詞就會被計點,點數夠多便能夠被視作正確答案。
Thumbnail
  在當時,有大約20%的文字材料沒有辦法被確定地辨識出來。於是,我們輸入驗證碼的這個過程,就被媒合進了這項辨識工作之中。在那套系統當中,我們面前的兩個單詞,由一個OCR能夠辨識的單詞與一個它無法辨識的單詞組成。如果我們答對第一個單詞,我們輸入的第二個單詞就會被計點,點數夠多便能夠被視作正確答案。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
探索OCR在全球化時代的重要作用,了解pdftopdf.ai在多語種文本處理中的先進功能,並學習其在學術、商業及個人需求中的實際應用,幫助用戶輕鬆優化文檔管理效率。
Thumbnail
探索OCR在全球化時代的重要作用,了解pdftopdf.ai在多語種文本處理中的先進功能,並學習其在學術、商業及個人需求中的實際應用,幫助用戶輕鬆優化文檔管理效率。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
AI 基準測試(Benchmark)歷來無法捕捉現實世界中的複雜性,特別是針對 AI 系統可能執行的任務,經常導致對 AI 當前能力和未來影響產生誤導性結論。
Thumbnail
AI 基準測試(Benchmark)歷來無法捕捉現實世界中的複雜性,特別是針對 AI 系統可能執行的任務,經常導致對 AI 當前能力和未來影響產生誤導性結論。
Thumbnail
在學術研究中,文獻整理是一項繁瑣但至關重要的任務。 我們經常需要從大量的文獻掃描件中選取關鍵資訊,進行整理和引用。 傳統的手動輸入管道不僅耗時,還容易出錯。 隨著時代的進步,科技的發展,現在有很多工具可以通過OCR文字選取科技幫我們解决這一難題。
Thumbnail
在學術研究中,文獻整理是一項繁瑣但至關重要的任務。 我們經常需要從大量的文獻掃描件中選取關鍵資訊,進行整理和引用。 傳統的手動輸入管道不僅耗時,還容易出錯。 隨著時代的進步,科技的發展,現在有很多工具可以通過OCR文字選取科技幫我們解决這一難題。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News