專利分析-資料庫差異性

更新 發佈閱讀 2 分鐘


專利分析的資料庫差異性

其實已經有蠻多文獻、心得都有討論

這邊分享一個我自己的心得


Fig.1是我自己繪製的一個專利家族連結態樣,

在圖形的繪製上x軸方向是時間軸方向,

母案是US2009289319P(Fig.1左下角紅框框處)

可以看到這件專利家族數量非常龐大

當時(2023.01.07)在統計時有900多件申請案

Fig.1. WO2021113854專利家族_PANK繪製

Fig.1. WO2021113854專利家族_PANK繪製

後來有幸在一場演講中認識的朋友,

請他幫我從另一個商用資料庫下載這件案子的專利家族,

於是就有下面這張Fig.2的統計。


Fig.2有兩個知名的商用資料庫,

分別是DI與WIPS,

同以這件WO2021113854A1這件去抓取專利家族資料時,

產生的數據不全相同,甚至數據類型也不一樣。

Fig.2. 各資料庫與手工資料差異性_PANK繪製

Fig.2. 各資料庫與手工資料差異性_PANK繪製

DI的所提供的廣義專利家族(INPADOC資料)共有1622件公開公告號,

經系統轉換後得到合計1090件申請案。


WIPS很有趣地跟DI的資料型態不同,

WIPS在系統上顯示的是共1259件patent family members,

但實際下載檔案只有取得1117件,與系統上所顯示的1259件少了142件,

經查,這142件主要為臨時案,


DI與WIPS不同之處是,

DI提供的INPADOC資料是公開/公告號,WIPS則是申請號,

兩者在資料型態上完全不同,這是其之一差異。


另一個差異是WIPS把臨時案案號算入到家族行列中,

從專利「申請」的角度來看,

這確實是申請人在申請的意志下所產生的一個「申請趨勢」,

但從具有可做為專利權運作的實際專利文件來看,

則必須僅使用具有公開公告號之申請案,

因此,若沒有深入理解個資料庫所提供的資料上的差異,

將會導致分析結果的差異。


其之三的差異是WIPS扣除掉臨時案數量後,

得到的專利家族申請數量比DI多出27件,

此數據的差異會導致分析人員在進行專利分析時母體數據上的落差,

進而影響到後續分析(例如申請趨勢、IPC、專利權人分析、國家地區別分析...等等),

甚至。


在最後,我也運用了一些技巧,

以人工方式進行專利家族的擷取(Fig.2中handmade資料),

獲得專利家族數量共1349件申請案,合計1999件公開公告號,

與DI、WIPS系統所提供的家族數量相差又更大,

因此可推見後續的分析數據上又勢必相差更多,

一旦數據相差越多,分析結果漂移的程度會更大,

造成分析結果上的偏差甚巨。


結論1: 要充分了解所用的資料庫特性。

結論2: 如果要用到兩個以上的資料庫進行分析時,

千萬要小心資料庫差異所造成資料不匹配。

結論3: 人工抓取雖然是最完整的,但是所耗的時間跟人力卻是最高的,


留言
avatar-img
Sebastian PaNK的沙龍
2會員
2內容數
你可能也想看
Thumbnail
專利分析的資料庫差異性 其實已經有蠻多文獻、心得都有討論 這邊分享一個我自己的研究心得
Thumbnail
專利分析的資料庫差異性 其實已經有蠻多文獻、心得都有討論 這邊分享一個我自己的研究心得
Thumbnail
在AI浪潮下,009819 中信美國數據中心及電力ETF 直接卡位算力與電力雙主軸,等於掌握AI最核心基建。2008從 Apple Inc. 與 iPhone 帶動供應鏈,到如今AI崛起,主線已由應用端轉向底層。AI發展離不開算力與電力支撐,009819的價值,在於押中「沒有它不行」的核心資產。
Thumbnail
在AI浪潮下,009819 中信美國數據中心及電力ETF 直接卡位算力與電力雙主軸,等於掌握AI最核心基建。2008從 Apple Inc. 與 iPhone 帶動供應鏈,到如今AI崛起,主線已由應用端轉向底層。AI發展離不開算力與電力支撐,009819的價值,在於押中「沒有它不行」的核心資產。
Thumbnail
這一篇從「專利權」開始,下一篇則是「營業秘密」。 這兩種智慧財產權的關係比較微妙,除了有點承先啟後的味道在,到了某個時點開始還會發生互斥的關係。以下讓我娓娓道來~ 台灣《專利法》將專利權分為「發明專利」、「新型專利」、「設計專利」三種類型,依據其創意展現的高低,也有相應的保護年限。
Thumbnail
這一篇從「專利權」開始,下一篇則是「營業秘密」。 這兩種智慧財產權的關係比較微妙,除了有點承先啟後的味道在,到了某個時點開始還會發生互斥的關係。以下讓我娓娓道來~ 台灣《專利法》將專利權分為「發明專利」、「新型專利」、「設計專利」三種類型,依據其創意展現的高低,也有相應的保護年限。
Thumbnail
2.Background(發明背景) 3.Summary(發明之簡要總結) 4.Brief Description
Thumbnail
2.Background(發明背景) 3.Summary(發明之簡要總結) 4.Brief Description
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
有時提案內容,架構都出來了,就差「符合提案主題,並為主題加分」的簡報模板和分析工具、圖表。但在繁忙的工作日程中,有時真的很難拉出時間來去特別學習EXCEL的分析圖表製作,或是跳脫PPT標準”原始 ”商業模板😅。這邊介紹我最近發現的寶藏網站,供大家做參考~~~不用拉圖,數字進去,超美圖表就完成啦!
Thumbnail
有時提案內容,架構都出來了,就差「符合提案主題,並為主題加分」的簡報模板和分析工具、圖表。但在繁忙的工作日程中,有時真的很難拉出時間來去特別學習EXCEL的分析圖表製作,或是跳脫PPT標準”原始 ”商業模板😅。這邊介紹我最近發現的寶藏網站,供大家做參考~~~不用拉圖,數字進去,超美圖表就完成啦!
Thumbnail
前篇文章已透過文獻數據分析結果,與大家聊過專利被賦予IPC及CPC的實際情形,及使用CPC建立專利檢索式時會遇到的風險。 但,這可以代表我們在建立專利檢索式時,使用IPC就完全萬無一失、沒有任何風險了嗎? 本文將進一步由另一篇文獻的數據分析結果,說明使用IPC可能會遇到的風險。
Thumbnail
前篇文章已透過文獻數據分析結果,與大家聊過專利被賦予IPC及CPC的實際情形,及使用CPC建立專利檢索式時會遇到的風險。 但,這可以代表我們在建立專利檢索式時,使用IPC就完全萬無一失、沒有任何風險了嗎? 本文將進一步由另一篇文獻的數據分析結果,說明使用IPC可能會遇到的風險。
Thumbnail
進行專利分析時,選擇合適的專利分類號(如IPC與CPC)來建立專利檢索式至關重要。 但多數專利分析者往往不知道的是,不管是選用IPC還是CPC來建立專利檢索式,其實都隱藏著檢索不完全的風險… 因此,本系列文章將與大家聊聊使用專利分類號的可能面臨的風險,以及降低其使用風險的方式。
Thumbnail
進行專利分析時,選擇合適的專利分類號(如IPC與CPC)來建立專利檢索式至關重要。 但多數專利分析者往往不知道的是,不管是選用IPC還是CPC來建立專利檢索式,其實都隱藏著檢索不完全的風險… 因此,本系列文章將與大家聊聊使用專利分類號的可能面臨的風險,以及降低其使用風險的方式。
Thumbnail
在前篇文章中,已向大家彙整並簡單介紹了國際5大專利分類系統,所以本篇文章將接續前篇主題,以文獻數據分析結果,說明專利被賦予IPC及CPC的實際情形。
Thumbnail
在前篇文章中,已向大家彙整並簡單介紹了國際5大專利分類系統,所以本篇文章將接續前篇主題,以文獻數據分析結果,說明專利被賦予IPC及CPC的實際情形。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News