AI Journey 2020

создание прототипов с помощью ruGPT3

https://ai-journey.ru/contest

Соревнование NLP-моделей на основе ruGPT3

Постановка задачи

Необходимо разработать прототип системы, которая использует модель ruGPT3 для создания рабочего прототипа продукта.

Идея оценивается по 3 параметрам: бизнес-применение, инновационность, эмоциональное вовлечение

  • необходим рабочий код решения

Все три параметра оценивает жюри (ODS, Сбер, Альянс и тд) по шкале от 1 до 10, подробные критерии ниже.

Критерий-1: Бизнес-применение

• Суть: В критерии оценивается бизнес-потенциал проекта, его реализуемость, наличие целевой аудитории.
• Пример: 
    ◦ приложение для создания макетов сайтов по их словесному описанию https://twitter.com/jsngr/status/1287026808429383680
    ◦ робот-юрист переписывает жалобы и показания людей на официальный юридический язык https://twitter.com/f_j_j_/status/1283349995144359937 
• Шкала: от 0 до 10, где 10 – наилучший результат, 0 -наихудший. 

Критерий-2: Эмоциональное вовлечение

• Суть: в этом критерии оценивается эмоциональное вовлечение пользователей в концепцию прототипа. Ваш прототип может быть основам на социально-ответственной тематике, 
• Пример: Стартап LearnFromAnyone создает автоматизированную систему для обучения детей предметным знаниям от первого лица: хотите изучить ракетостроение? Илон Маск расскажет  как. https://learnfromanyone.com/ https://news.ycombinator.com/item?id=23870595 
• Шкала: от 0 до 10. 

Критерий-3: Инновации

• Суть: в критерии оценивается способность предложенного проекта оптимизировать существующие процессы с помощью современных технологий, и/или улучшать качество предоставляемых услуг.
• Пример: GPT-3 Tailwind CSS Code Generator (https://gpt-tailwind.com/) позволяет генерировать элементы  CSS для сайта по их описанию на английском языке. Проекты такого рода 
• Шкала: от 0 до 10. 

Примеры

Разрешается взять за основу идеи из репозитория awesome-GPT3:

App and layout tools

Search and data analysis

Program generation and analysis

Text generation

Content creation

Model

ruGPT large (760M parameters) based on GPT3 paper

репозиторий с моделями

Обучена на:

  • common crawl
  • wiki
  • github
  • stackoverflow
  • news
  • social media
  • books

Пример работы модели - генерация сочиннения ЕГЭ по заданной теме:

Предмет: литература
Тема: Кем является Чацкий: победителем или побежденным? (по комедии А.С. Грибоедова «Горе от ума»)
Сочинение: В соответствии с теми характеристиками образа, которые дает Грибоедов Чацкому в комедии «Горе от ума», он оказывается так или иначе победителем, поскольку удаляется от людей и не видит их. У Чацкого один путь — к самоубийству. Однако при этом он не производит впечатления побежденного героя. Второй путь Чацкого (эгоцентрический) — сохранить достоинство, и он не рассматривает самоубийство как путь к бессмертию.  Поэтому, на наш взгляд, читателю важно понять, кто такой Чацкий и на каком пути он живет.
На каком пути живет Чацкий? На его взгляд, Чацкому свойственна не только всеядность: способность говорить как человек, не чуждый эгоизму и самолюбованию. В его внутренней «темнице» развиваются внутренние конфликты, связанные с его судьбой. Чацкий хотел быть «добрым помещиком». Он хотел служить обществу, но оказался неудачником. Можно ли назвать его победителем? Нам представляется, что нет. Чацкий живет в противоречии с самим собой. Будучи членом дворянского общества, он должен служить ему, но не может соответствовать его требованиям. Человек чести должен служить своей стране, но при этом не хочет быть для общества слугой. Только вера в лучшие идеалы может помочь человеку сохранить свое достоинство.

Данные

Участникам разрешается использовать любые другие текстовые данные для дообучения модели и реализации своей идеи.

Дополнительные данные от организаторов:

Формат решений

Организаторам необходимо прислать:

  • презентацию о своей идее проекта
  • архив с решениями
  • архив с воспроизводимым кодом/Colab-ноутбук с обучением и генерацией