我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
ResNet 是一種類似於 ConvNext 的神經網路,與本章中訓練的模型不同,ResNet 可以包含多達 1,000 層。ResNet 模型中的階段由一組卷積塊(Convolutional Blocks)組成,同一階段中的每個卷積塊具有相同數量的濾波器,隨著模型的加深,每個階段中的濾波器數量會增加。
如果要觀看 ResNet 模型的堆疊,可以使用以下程式:
model_name="Denis1976/autotrain-training-cifar-10-81128141659"
model = transformers.AutoModelForImageClassification.from_pretrained(model_name, use_auth_token = token)
print(model.config)
結果為:





























