- 机器学习概论
- 特征工程
- 感知机
- k近邻
- 朴素贝叶斯
- 线性模型
- 决策树
- 支持向量机
- liblinear
- 集成学习
- 降维
- EM算法
- 概率图模型
- HMM隐马尔科夫模型
- CRF条件随机场
- 聚类
- 主题模型
- 知识点
- 机器学习算法总结
- 深度学习概论
- ANN人工神经网络
- Hopfield神经网络
- 知识点
- CNN卷积神经网络
- RNN循环神经网络
- BNN贝叶斯神经网络
- GNN图神经网络
- 深度生成模型
- 深度生成模型概述
- GAN生成对抗网络
- VAE变分自编码器
- Flow-based Models流模型
- Diffusion Models扩散模型
- Few-shot Learning小样本学习
- 强化学习
- 仿真环境
- OpenAI: Gym
- MuJoCo
- Unity3D: ml-agents 简言之:行为树是适合解决复杂AI的解决方案。 对于Unity用户,Unity商店现在已经有一个比较完善的行为树设计(Behavior Designer)插件可供购买使用。
- OpenDILab: GoBigger多智能体仿真平台
- Sim2Real从仿真器到现实环境的迁移
- MCTS蒙特卡洛树搜索
- 模仿学习
- 多智能体强化学习
- Transformer+RL
- 决策大模型
- Offline RL离线强化学习
- MMRL多模态强化学习
- 业界应用
- DeepMind
- AlphaGo
- AlphaGo-Zero: Mastering the Game of Go without Human Knowledge Nature2017
- AlphaStar: Grandmaster level in StarCraft II using multi-agent reinforcement learning Nature2019
- AlphaZero
- MuZero
- AlphaFold
- AlphaCode
- AlphaTensor: Discovering faster matrix multiplication algorithms with reinforcement learning Nature2022
- Agent57 2020
- DeepNash
- OpenAI
- Emergence of grounded compositional language in multi agent populations 2017 在模拟游戏环境里从无到有进化出一种语言 OpenAI在2017年先完成了具身智能演化出语言的原理模型之后才立项GPT,Emergence of grounded compositional language in multi agent populations.现在多模态模型的关键要素在文章里都有了,而之前OpenAI还在打游戏。而且这还只是对外公开的部分,谁知道内部发生了啥,马斯克骂骂咧咧的退出了。
- OpenAI Five: Dota 2 with Large Scale Deep Reinforcement Learning 2019
- 玩魔方
- 腾讯
- InspirAI启元世界
- DeepMind
- ResNet 有捷径的(resnet的跳跃连接)
- InceptionNet 多岔路的(inception的多分支)
- DenseNet 通往多个地点的捷径的(densenet的密集连接)
- YOLO
- 图像标注工具
- Vision Transformer
- Swin Transformer
- 自然语言处理概论
- 自然语言
- 语言模型和中文分词
- TF-IDF词频-逆文档频率
- word2vec
- Seq2Seq模型和Attention机制
- Self-Attention和Transformer
- BERT
- LLM大语言模型
- RLHF基于人工反馈的强化学习方法
- Alpaca 斯坦福大学
- Alpaca 近日,斯坦福基于 Meta 的 LLaMA 7B 模型微调出一个新模型 Alpaca。该研究让 OpenAI 的 text-davinci-003 模型以 self-instruct 方式生成 52K 指令遵循(instruction-following)样本,以此作为Alpaca的训练数据。研究团队已将训练数据、生成训练数据的代码和超参数开源,后续还将发布模型权重和训练代码。 斯坦福70亿参数开源模型媲美GPT-3.5,100美元即可复现
- ColossalChat By ColossalChat开源了第一个完整的RLHF pipeline,斯坦福Alpaca没有做RLHF
- Alpaca 斯坦福大学
- Prompt Learning
- Emergence涌现现象
- 自己训练ChatGPT
- 业界应用
- OpenAI
- GTP系列介绍
- GPT前身Unsupervised Sentiment Neuron
- GPT1
- GPT2
- GPT3 语言生成模型 根据Lambda官网数据,微软为OpenAI设计了一个包含10000块Nvidia V100 GPU的分布式集群进行GPT-3的模型训练,由于模型参数量较大(共1750亿参数),训练完成共耗费30天,消耗总算力为 3640PF-days。以Nvidia Tesla V100的 Lambda GPU实例定价为1.50 美元/小时测算,GPT-3的完整训练成本将达到466万美元/次。
- Codex
- GPT-3.5
- instructGPT
- ChatGPT 聊天机器人
- GPT-4 202303 输入图/文,输出文
- MiscroSoft
- Copilot MiscroSoft和OpenAI联合打造的AI编程工具,基于OpenAI的大模型Codex,基于GPT-3框架进行训练
- Kosmos-1 20230227发布,第二种才是真正的多模态LLM,才是GPT-4的魅力,他的原理目前OpenAI没有公布细节,但是大家可以参考微软在2月27日发布的Kosmos-1的论文(想一想,为什么偏偏是OpenAI的深度合作伙伴发了这篇论文)。
- Meta
- Google
- LaMDA 发布于202105 I/O大会
- PaLM 202204 5400亿参数
- LaMDA-2 202205 I/O大会
- T5
- Bard 聊天机器人,对标OpenAI的ChatGPT,发布于202302
- ReAct是来自谷歌论文《Synergizing Reasoning and Acting in Language Models》中的一个方法,它是2022年12月发表的。这是一种eason+Act(ReAct)的方式,让大模型的行动和推理一起协同,提高大模型解决问题的能力。也就是让模型在访问外部知识的情况下和自己的模型能力结合。其实这就是Bing中的ChatGPT的运行方式!这个简单的方法可以让模型有更强的能力。而它的实现其实只需要简单的几行代码即可。因此,在前面的低成本+浏览器运行的基础上,加上ReAct改造,几乎可以得到一个与ChatGPT类似或者甚至更好的对话模型!
- Together
- OpenChatKit ChatGPT的开源平替来了,源代码、模型权重和训练数据集全部公开。由前OpenAI研究员共同打造。如何看待 Together 推出的开源聊天大模型 OpenChatKit?能否替代 ChatGPT?,ChatGPT开源平替来了,开箱即用!前OpenAI团队打造
- 阿里达摩院
- 中文GPT3 对标GPT-3的开源项目
- 元语智能
- PromptCLUE1.0 202210
- PromptCLUE1.5 202211
- ChatYuan 202212
- 百度
- ERNIE-Bot文心一言 202302
- BlinkDL
- ChatRWKV 对标ChatGPT的开源项目,基于RNN架构 202208
- HPC-AI Tech
- ColossalAI 对标ChatGPT的开源项目 202302
- 复旦大学自然语言处理实验室邱锡鹏团队
- MOSS 对标ChatGPT已开源 202302
- 智谱AI
- ChatGLM 近日,由清华技术成果转化的公司智谱AI开源了GLM系列模型的新成员——中英双语对话模型ChatGLM-6B,支持在单张消费级显卡上进行推理使用。这是继此前开源GLM-130B千亿基座模型之后,智谱AI再次推出大模型方向的研究成果。与此同时,基于千亿基座模型的ChatGLM也同期推出,初具问答和对话功能 ChatGLM:千亿基座的对话模型启动内测,单卡版模型已全面开源
- 开源
- OpenAI
- RLHF基于人工反馈的强化学习方法
- Foundation Models基础模型
- 业界应用
- OpenAI
- DALL·E 图像生成平台
- CLIP
- DALL·E2
- Point-E 202212 文本生成3D点云模型
- Stability.ai
- Stable Diffusion开源
- Salesforce Research
- BLIP-2 图像生成文字,能力堪比ChatGPT
- OpenAI
- AutoML介绍
- 自动数据清理AutoClean
- 自动特征工程AutoFE
- 超参数优化HPO
- 元学习MetaLearning
- 神经网络架构搜索NAS
- 推荐系统概述
- 基础知识
- 协同过滤
- 用户画像
- 进阶知识
- 业界应用
- YouTube
- Alibaba
- TDM: Learning Tree-based Deep Model for Recommender Systems KDD2018
- DIN: Deep Interest Network for Click-Through Rate Prediction KDD2018
- DSIN: Deep Session Interest Network for Click-Through Rate Prediction IJCAI2019
- ESMM: Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate SIGIR2018
- 机电系统
- 感知
- 决策
- 规划
- 基于LLM大语言模型的规划
- Socratic Models: Composing Zero-Shot Multimodal Reasoning with Language arXiv2022 Google
- Towards Helpful Robots: Grounding Language in Robotic Affordances Google2022
- Value Function Spaces: Skill-Centric State Abstractions for Long-Horizon Reasoning arXiv2022 Google
- Inner Monologue: Embodied Reasoning through Planning with Language Models arXiv2022 Google
- Interactive Language: Talking to Robots in Real Time arXiv2022 Google
- 基于LLM大语言模型的规划
- 制导
- 控制
- PID控制
- 基于强化学习的控制
- 基于LLM大语言模型的控制
- Code as Policies: Language Model Programs for Embodied Control arXiv2022 Google
- RT-1: Robotics Transformer for Real-World Control at Scale arXiv2022 Google
- Performer MPC: Learning Model Predictive Controllers with Real-Time Attention for Real-World Navigation Google2022
- ChatGPT for Robotics: Design Principles and Model Abilities MicroSoft2023 ***
- PaLM-E: An Embodied Multimodal Language Model arXiv2023 Google ***
- Towards a Robotics Foundation Model ML-Collective协会2023
- 导航
- 动力学模型
- 六自由度动力学与运动学模型
- 仿真环境