Circuit Tracing 開源電路追蹤工具 – Infer.store

Circuit Tracing 開源電路追蹤工具

在 Anthropic 最近的研究中，引入了一種追蹤大型語言模型思想的新方法。今天，他們開放該方法的源代碼，以便任何人都可以藉鑑我們的研究成果。

您可以造訪 Neuronpedia 介面來產生和查看您選擇的提示的歸因圖。對於更複雜的使用和研究，您可以查看程式碼庫。此版本使研究人員能夠：

透過產生自己的歸因圖來追蹤支援模型上的電路；
在互動前端中視覺化、註釋和共享圖表；
透過修改特徵值並觀察模型輸出如何變化來檢驗假設。