我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
上傳資料階段,要遵循 Hugging Face 提供的數據格式化程序,具體說明可以參考:https://huggingface.co/docs/autotrain/image_classification,在本例中,我們將加載 CIFAR-10 圖像數據集,如下圖所示:

我們有 8941 張圖像用於訓練,分為四個類別:飛機、汽車、船隻和卡車,我們需要將數據集拆分為訓練集和驗證集,當驗證數據準備就緒後,按照指示點擊 Validation Data (optional),如下圖所示進行操作:



























