这是一个由 Brendan Bycroft 开发制作非常意义的 llm-viz 项目的中文翻译版本,对学习了解LLM非常有帮忙,也可用于教学演示。
这个项目展示的是一个GPT风格网络的工作实现的3D模型,也就是在OpenAI的GPT-2、GPT-3,甚至可能是GPT-4中使用的网络拓扑。
首先展示的带有工作权重的网络是一个微型网络,它能够对字母A、B和C的小的列表进行排序。这是来自Andrej Karpathy的 minGPT 实现的演示示例模型。
渲染器还支持可视化任意大小的网络,并且能够处理较小的 gpt2 大小,尽管权重并未下载(这需要100多MB的空间)。
- 安装依赖:
yarn
- 本地运行调试:
yarn dev
这是由 AI探索官
完成翻译,有不完善的地方或者翻译错误的地方欢迎指出,同时欢迎关注同名公众号 AI探索官
一起探索更多的AI知识 https://www.iiiai.com