/AITop

Daily AI News

MIT LicenseMIT

[TOC]

4-3

  • Streaming Video Model:提出将视频理解任务统一为一种新型的流式视频架构。首先使用具有内存的时间感知空间编码器生成帧级特征,以服务于基于帧的视频任务。然后将帧特征输入到与任务相关的时间解码器中,以获取用于序列任务的时空特征。
  • DERA: Enhancing Large Language Model Completions with Dialog-Enabled Resolving Agents:如何设计有效的prompt,如何通过GPT4自己不断的判断自己的输出,来优化输出,用于医疗场景。
  • “ChatGPT们”的淘金时代:公司分为以下五类:AI 内核(AI Core)、AI 赋能(AI Enabler)、AI 原生(AI Native)、AI 特色(AI Featured)和 AI 驱动(AI Powered)。小资本创业核心在AI能力的产品化,做好用户体验,积累用户。
  • From Deep to Long Learning?:如今实现LLM的长文本输入能力?文章是对目前“increase sequence length”的综述。
  • Ecosystem Graphs: The Social Footprint of Foundation Models:斯坦福构建大模型生态系统图,用于跟踪大模型的足迹。
  • **ColossalChat: An Open-Source Solution for Cloning ChatGPT With a Complete RLHF Pipeline:**ColossalChat:用于克隆 ChatGPT 和完整 RLHF 管道的开源解决方案。包括微调数据集与代码。
  • Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90% ChatGPT Quality*:90%ChatGPT能力的小羊驼。Alpaca时候作者华人只有两个,这里直接全华班!
  • LMFlow:LMFlow代码库不仅仅是一个简单的模型; 它包括完整的训练流程、模型权重和测试工具。 您可以使用它来构建各种类型的语言模型,包括对话模型、问答模型和文本生成模型等。

4月

2023