統計

含有「統計」共 421 篇內容
全部內容
發佈日期由新至舊
Kolmogorov-Smirnov檢定(簡稱K-S檢定)是一種基於累積分布函數(CDF)的無母數統計檢定方法,用來比較兩個經驗分佈是否相同,或比較樣本分布是否與某個理論分布(如常態分布、均一分布)一致。 K-S檢定作為分佈距離度量 K-S統計量 $$ D $$ 即為兩分布之間的最大距離(最大垂
Howard Marks :當前股市已從『高估值』變成『令人擔憂』,建議減少積極型持股,增加防禦性持股。 持股的長期報酬率和進場時的本益比高低呈現顯著的負向關係,目前美股的預估本益比為22.30的高位,雖然AI發展趨勢、減稅和FED即將降息都有利於股市多頭延續,但市場波動與評價風險亦不可忽視。
Thumbnail
2024公布的數據: 現在地球的人口可能約有78億,統計學雖能告訴我們人口的數量、分佈、種族等資訊,但因數量實在太大,單純學術性統計報告,對大多數的人是不易了解。 有人製作了這組有趣的統計報告,把世界上的 78億人濃縮成 100人,各種百分比的統計資料看起來就有意思了! 統計資料是這樣: 1
Thumbnail
你是否曾經看過這樣的新聞:「冰淇淋銷量越高,溺水人數也越高!」然後開始胡思亂想,難道吃冰淇淋會導致溺水嗎? 當然不是!我們都能直覺地想到,是因為「天氣熱」這個共同因素,導致冰淇淋熱賣,同時也讓更多人跑去游泳,從而增加了溺水機率。 在數據分析的世界裡,我們時常會遇到這種「虛假相關」的陷阱。而幫助我
Thumbnail
你是否曾看過兩個完全相反的統計結論,卻不知道該相信哪一個?這可能不是因為數據造假,而是你遇到了統計學上最著名的陷阱之一——「辛普森悖論」。 什麼是辛普森悖論? 辛普森悖論描述的是一種讓人瞠目結舌的現象:當我們把數據分組來看時,每一組都顯示出同一種趨勢;但當我們把這些組的數據合并起來看整體時,趨
Target Encoding(目標編碼)是一種用於機器學習中處理類別變數的編碼技術,特別適合高基數(高種數量)類別特徵。它通過將類別值替換成該類別在目標變量上的統計值(通常是目標的均值),使模型能夠有效利用類別與目標之間的關聯信息。 Target Encoding原理 對於分類或回歸問題,計算
線性回歸的基本假設是指在建立線性回歸模型時對數據和誤差項提出的前提條件,這些假設保證了模型的合理性和統計推論的有效性。主要有以下幾個核心假設: 1. 線性關係 應變數(Y)和自變數(X)之間存在線性關係,即模型形式可表達為 2. 誤差項期望為零 誤差項的期望值為零,表示誤差沒有系統性的偏差
總結買房貸款的三大重點:購屋者、建物與金融機構:購屋者(申貸者)就是看收入與年齡,收入越高、年齡越低,能談到較好的貸款條件;金融機構根據建物鑑估值、申貸者收入與信用分數,綜合評估放款與否與放貸條件;至於房價高低,影響因素甚多,不論是採用聯徵的哪組數據,都只能看個輪廓。
Thumbnail
對數轉換(Logarithmic Transformation)是將數據中的每個值轉換為其對數值的過程,常用於數據分析和機器學習中,以改善數據分佈、降低偏態,並使數據更接近常態分布。 對數轉換的主要目的 減少偏態(Skewness):將右偏分佈的數據拉近對稱,有利於統計模型的假設; 縮小數據範
由韓國遊戲開發商 Shift Up 打造的動作遊戲《劍星(Stellar Blade)》,自今年 6 月 11 日推出 PC 版後,迅速引發模組創作者的熱烈回應。短短兩個多月內,遊戲模組數量已超過 1,700 個,而根據知名模組分享平台 NexusMods 的統計,《劍星》模組的總下載量已突破 2,
含 AI 應用內容
#創意#平台#Riot