我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
書籍:Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024 第三章,將介紹以下內容:
- Transformer Attention 機制如何產生輸出
- 用人的眼光與基準來衡量 Transformer 輸出
- 衡量的工具
- 基準任務與資料集的介紹
- 使用 SST-2 進行情緒分析
















