曲博、藍泉媽媽深談DeepSeek

這是近期我看過最深入的一集(當然曲博主要是引述別人論文)。雖然小白看來艱深,但囫圇吞棗後還是比小白有更多一點點概念。

至少,「蒸餾」(distillation)不等於「抄襲」,而且DeepSeek用的「教師模型」不只來自OpenAI,難怪後者改口「沒計畫」控告「深度求索」(DeepSeek)。

迴避六四或習近平的提問是應用端的設計,這不影響DeepSeek-R1對開源社群的貢獻(包括利於其他大型公司如阿里巴巴Qwen、臉書Llama3的進階),DeepSeek-R1又不會是將來唯一的終端產品。

(寫於2025年2月5日)

今天又發現藍泉媽媽影片,對DeepSeek神話拆解得好像有理有據,一併提供:

在速食片段化資訊的時代,想不被愚弄操弄,只有耐心與勤奮自己找資訊。只看別人轉傳和短影音的人,真的要小心。

可惜,新聞時效性太強,股市反應太靈敏,自媒體讓所有迷因太容易生成…所以這些事情都會一再一再發生。

我不用臉書、IG、X、脆就是不想變成「即時文化」重度被害者與加害者(輕度是免不了的啦)。自選輯多數文章寫好要排隊上,不是隨寫隨發,還來得及等子彈飛一下,慶幸慶幸。

(寫於2025年1月8日)

在〈曲博、藍泉媽媽深談DeepSeek〉中有 4 則留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料