我們正在進行另一輪的Anthropic Fellows計劃。 如果你是一位擁有強大編程或技術背景的工程師或研究人員,你可以申請獲得來自Anthropic的資金、計算資源和指導,從今年十月開始。將會有大約32個名額。
該計劃將運行約兩個月,根據進展和表現有機會延長四個月。 請在8月17日之前申請,加入我們在以下地點的活動: - 美國: - 英國: - 加拿大:
研究員將可以訪問: - 每周津貼 2,100 美元; - ~每月 15 美元的計算和研究費用; - 來自人類研究人員的 1:1 指導; - 灣區或倫敦的共用工作空間。
研究員將與人類研究人員在以下領域合作: - 對抗魯棒性和人工智慧控制; - 可擴展的監督; - 錯位模式生物; - 機械可解釋性。
2) 工作展示「潛意識學習」——語言模型可以將其特徵傳遞給其他模型,即使在看似無意義的數據中:
Anthropic
Anthropic2025年7月23日
在與 @OwainEvans_UK 共同撰寫的論文中,作為 Anthropic Fellows Program 的一部分,我們研究了一個驚人的現象:潛意識學習。 語言模型可以將其特徵傳遞給其他模型,即使在看似無意義的數據中。
3) 在測試時計算中尋找反向縮放的案例——越多的推理導致越差的結果:
Aryo Pradipta Gema
Aryo Pradipta Gema2025年7月22日
新的Anthropic研究: “測試時間計算中的反向縮放” 我們發現,較長的推理會導致較低的準確性。 我們的研究結果表明,天真的測試時間計算縮放可能無意中加強了有問題的推理模式。 🧵
我們很高興收到來自其他組織的研究員的申請(例如,您可以在攻讀博士學位期間參加)。 最後,獲得獎學金將對您在Anthropic的角色大有裨益:我們計劃向完成獎學金的研究員提供一些全職工作機會。
276.74K