中國AI
含有「中國AI」共 1 篇內容
全部內容
發佈日期由新至舊
同安書室
2026/01/08
「AI罵人再道歉」為何出現?從語料人格、對齊破洞到中國AI的魔幻現代化(ChatGPT)
為什麼中國的元寶AI會出現「罵人+自動道歉」的怪異行為?本文拆解三個底層原因:語料人格外溢(prompt spillover)、安全層缺失(missing safety layer)與RLHF對齊破洞。並分析中國AI的工程論壇文化如何影響模型口氣。
#
大模型
#
RLHF
#
Prompt
8
留言