一個字體,英文叫typeface or font family, 通常涉及某種設計理念,像是Helvetica,而其具體而成的(多種)商品則叫字型 (font),比方說是Helvetica可再分成Neue Helvetica BQ 跟Helvetica Neue LT Pro等等。
字型的差異重要嗎?很多讀者或許不熟悉,但全球字型市場其實相當競爭,由許多設計公司參與,買賣交易非常活躍。
在一篇由Sukjin Han、Eric Schulman、Kristen Grauman 與 Santhosh Ramakrishnan 共同撰寫的論文Shapes as Product Differentiation: Neural Network Embedding in the Analysis of Markets for Fonts,利用類神經網絡,來測量字體的差異程度,並利用字體市場的併購案件,來去推估字體差異對「字體」作為產品定位的影響。
長期以來,許多商品最關鍵的差異化特徵(例如設計、外觀、文字敘述)都是「非結構化」且高維度的資料,傳統計量模型只能把它們塞進一個純量殘差項裡,當成觀察不到的變數處理。
這一個研究團隊,於是選擇用字型(fonts)這個極為單純卻又高度視覺化的設計商品來示範一個新的計量框架:與其把字型形狀視為「觀察不到」的參數,不如用深度學習來量化,變成變成可以丟進統計分析裡的真實變數。
研究團隊取得了全球最大的羅馬字母字型線上市集 MyFonts.com(隸屬 Monotype 公司)的內部資料,涵蓋 2002 至 2017 年共 28,659 種字型與約 244 萬筆交易。
這個市場的買家多半是平面設計師、廣告主或網頁設計師,他們把字型當作中間財,用來製作海報、印刷品、網頁與數位廣告。
字型有幾個特別適合做研究的優點:第一,所謂「商品」幾乎就只是一組二維單色的字母形狀,極為單純;第二,這個視覺資訊雖然簡單,卻足以決定字型的功能與價值;第三,期間發生了一樁可供做因果分析的併購事件來探討字型的「產品差異化」是怎麼一回事。
方法上,論文借用了 Google 在 FaceNet(Schroff et al., 2015)早期論文裡用來做人臉辨識的triplet loss 訓練法。研究者把每個字型用一句包含所有 26 個英文字母的全字母句(pangram)顯示出來,再丟進深度卷積類神經網絡(CNN),輸出一個 128 維的向量,這就是該字型的embedding。訓練的邏輯是:同一個字型家族(例如 Helvetica Regular、Helvetica Bold、Helvetica Italic)的影像,在這個 128 維空間裡的歐式距離要拉近;不同家族的字型距離則要拉遠。如此一來,整個字型市場便被映射成一個低維度的「產品空間」,距離本身就代表視覺上的相似程度。
光是分類準確並不必然代表這個空間對經濟分析有意義,因此作者額外做了一個非常聰明的驗證。
MyFonts 上每個字型都有設計師與消費者自行加上的標籤(tags),例如「捲曲的」、「流動的」、「幾何的」、「有機的」等近三萬個描述詞。作者用 Word2vec 把這些文字標籤也轉成詞向量,然後計算「影像嵌入分群」與「文字嵌入分群」之間的標準化互資訊(NMI)。結果是 0.473,遠高於用傳統產業類別(襯線、無襯線、手寫、書法體等六大類)算出來的 0.261。這說明類神經網絡學到的視覺向量,確實反映了設計師與消費者主觀上「看到」的字型風格,不是隨機亂訊,對外人來說可能看不出來,但對於設計師跟神經網絡來說,其中差異相當巨大。

圖片來自該論文
他們進一步分析 2014 年 6 月 Monotype 併購德國知名字型工坊 FontFont 的對於字體差異化的效果。
併購前 FontFont 只是 MyFonts 上的第三方供應商,併購後則成為集團內部的一員。
作者用合成控制法 (synthetic control method),從 50 家未受併購影響的工坊中加權組合出一個「假想的 FontFont」,再輔以兩個差異化指標--「到平均字型 Averia 的距離」與「重力指標」--來觀察併購前後兩條軌跡的偏離。
主要的實證發現是:併購後的頭兩年,FontFont 推出的新字型在視覺風格上明顯比合成控制組更「實驗性質」、更與市場上既有字型拉開距離,效果在統計上顯著(第一年 p 值約 0.037);但到了第三年效果就消失了。
作者提出兩個可能解釋:一是併入大集團後成本下降,工坊敢做更冒險的設計;二是 Monotype 集團為了避免自家字型互相「同類相食」(cannibalization),刻意把新產品推到產品空間中比較空曠的角落。
值得玩味的是,如果改用傳統的「產品數目」或「字符數 (glyph count)」這類結構化指標,根本看不到任何併購效果,也就是說,過去整個併購與產品差異化文獻所仰賴的衡量方式,可能漏掉了視覺面向上最重要的變化。
值得注意的是,論文本身並沒有把這個 10% 左右的「位置移動」翻譯成具體的營收或利潤數字,筆者只好與AI爬蟲從併購新聞等來源搜集資料,做一些估算,資料細節可能有小誤差。
Monotype 在 2014 年以約 750 萬英鎊(約 1,200 萬美元)併購 FontShop,當年集團總營收 1.84 億美元,其中零售字型業務(Creative Professional)約 8,000 萬美元,MyFonts 平台單一通路年營收推估約 1,400 萬美元。
FontFont 在併購前估計每年在 MyFonts 上有 200–400 萬美元的銷售。若參考其他差異化商品產業的估計值,把同集團內互相蠶食(cannibalization)的比率假設為 20–40%(這是文獻上不同產業常見的範圍),而重新定位後降低 10–15 個百分點,那麼 Monotype 整體投資組合每年可以「省下」大約 40–80 萬美元的內部相食損失,兩年合計約 100–200 萬美元,相當於併購價的 8–17%,若這假設成立,字體的差異化有一定的經濟影響,而對於下游市場(使用字體)的影響是更大還更小,則跟Pass-Through的規模有關,就超出了該研究能告訴我們的了。
換言之,「設計」、「美感」、「風格」這類過去被認為難以量化的東西,透過機器學習轉換成可以放入計量模型的變數的具體做法。台灣有大量以設計與品牌為核心競爭力的產業,從文創、服飾、家具、3C 產品外觀,到 App 介面與電商商品圖,這些領域的成果,傳統上都很難做嚴謹的實證研究。但在深度學習的測量下,或許我們可具體的估計其對於產品差異化的影響。是為記。




















