Published inNLP系列DeepSeek R1:在強化學習,我們可以走多遠?在前一篇V3的文章中,有提到R1[1]是相對比較專注在特定領域的模型,它的研究方向比較偏重於強化學習(Reinforcement Learning)。本篇的主題就來探討R1及其系列子模型,並試著整理強化學習在目前的發展狀況。Mar 24Mar 24
Published inNLP系列DeepSeek V3技術報告:不能說抄襲,但也不是革新過年期間,兩個模型橫空出世 — 實際上在圈子裡面,也已經醞釀有一個月了 — 中國DeepSeek公司推出兩個大語言模型,DeepSeek V3和DeepSeek…Feb 28Feb 28
初探Kolmogorov–Arnold Networks (KAN):神經網路的新曙光?在今年4月,由來自麻省理工學院(MIT)、加州理工大學(CIT)以及東北大學(Northeastern…Jul 17, 2024Jul 17, 2024
機器學習模型系列 (2) — 利用Log Linear Model做多分類任務(Multiclass task)參考閱讀:機器學習模型系列(1) — Log Linear ModelMay 9, 2024May 9, 2024
領域泛化(domain generalization)和未知泛化(zero-shot domain generalization):探討模型「無所不能」背後的秘密自從GPT-4(或3.5)推出之後,大家對於以它為代表的大型語言模型(Large Language…Apr 9, 2024Apr 9, 2024
Published in機器學習系列機器學習模型系列 (1)— Log Linear Model除了深度學習,也想再從機器學習相關的理論和實作中繼續深入,有些概念背後其實兩者是相通的。因此開啟這個系列,未來也會分享更多的模型和實作給大家。Sep 12, 2023Sep 12, 2023