/ubbook

Путеводитель C++ программиста по неопределенному поведению

Путеводитель C++ программиста по неопределенному поведению

Паникуй!


Коротко о том, зачем и почему

Все начинается просто и незатейливо: обычный десятиклассник увлекается программированием, знакомится с алгоритмическими задачками, решения которых должны быть быстрыми. Узнает о языке C++, учит минимальный синтаксис, основные конструкции, контейнеры, решает задачи с предопределенным и всегда корректным форматом ввода и вывода, и горя не знает...

В это же время, где-то в большом мире, матерые разработчики каждый день ругают то одни языки программирования, то другие. По самым разным причинам: не удобно, нет какой-то возможности, много лишних букв писать, ошибки в стандартной библиотеке... Но есть язык, который ругают за все и особенно за такую непонятную и таинственную вещь как неопределенное поведение (undefined behavior, UB).

Спустя лет пять или шесть наш простой десятиклассник, горя не видавший в море оторванных от реальности программ, внезапно узнает, что тем самым горячо нелюбимым языком всегда был, остается и будет его C++.

А потом еще в течение нескольких лет он наткнется на самые кошмарные и невероятные ужасы, поджидающие программистов на C++ почти на каждом шагу. Так и появится эта серия заметок, собирающая наиболее отвратительные примеры, на которые очень легко наткнуться при решении повседневных задач.


«Преждевременная оптимизация — корень всех зол» (Д. Кнут или Э. Хоар — в зависимости от того, какой источник смотрите). Язык С++, пожалуй, наиболее яркая тому демонстрация: огромное количество ошибок в C++ программах связаны с неопределенным поведением, заложенным в фундаменте языка просто для того, чтобы дать простор оптимизациям на этапе компиляции.

Если вы собираетесь писать на C++ код, в работоспособности которого хотите быть хоть немного уверенными, стоит знать о существовании различных подводных камней и ловко расставленных мин в стандарте языка, его библиотеке, и всячески их избегать. Иначе ваши программы будут работать правильно только на конкретной машине и только по воле случая.

Важно: этот сборник не является учебным пособием по языку и рассчитан на тех, кто уже знаком с программированием, с C++, и понимает основные его конструкции.


Содержание

  1. Что такое UB и как оно проявляется
  2. Как искать UB?
  3. Сужающие преобразования
  4. Целые и вещественные числа
    1. Переполнение знаковых целых чисел
    2. Числа с плавающей точкой
    3. Integer promotion
    4. char и знаковое расширение
    5. Унарный минус для беззнаковых чисел
  5. Нарушения lifetime объектов
    1. Висячие ссылки — общие случаи
    2. Автовывод типов и висячие ссылки
    3. std::string_view
    4. Range-based for
    5. Cамоинициализация
    6. std::vector и инвалидация ссылок
    7. Висячие ссылки в лямбдах
    8. Создание кортежей
    9. Внезапная мутабельность
    10. Proxy-объекты и ссылки
    11. use-after-move
    12. lifetime extension
  6. (Не)работающий синтаксис
    1. Most Vexing Parse
    2. Const
    3. std::move
    4. Потерянный return
    5. Эллипсис и функции с произвольным числом аргументов
    6. operator ,
    7. function-try-block
    8. Пустые структуры и типы нулевого размера
    9. (Не)явное приведение типов
    10. Многомерный operator[]
  7. Стандартная библиотека
    1. NULL-терминированные строки
    2. Конструирование std::shared_ptr
    3. потоки ввода/вывода
    4. std::aligned_storage
    5. функции стантарной библиотеки как параметры
    6. std::ranges::views
    7. operator[] ассоциативных контейнеров
    8. std::enable_if/std::void_t
    9. Конструкторы контейнеров
    10. std::uniform_int_distribution
    11. std::ranges::transform | filter
  8. Исполнение программы
    1. Бесконечные циклы
    2. Рекурсия
    3. Ложный noexcept
    4. Переполнение буфера
    5. Сборщик мусора
    6. RAII vs (N)RVO
    7. Разыменование nullptr
    8. Static initialization order fiasco
    9. Static inline
    10. ODR violation
    11. Зарезервированные имена
    12. Тривиальные типы и ABI
    13. Неинициализированные переменные
    14. Ranges. Unreachable sentinel
    15. Невиртуальные виртуальные функции
    16. Variable length array
    17. ODR violation и разделяемые библиотеки
  9. Происхождение указателей
    1. Невалидные указатели
    2. Placement operator new[]
  10. Параллелизм
    1. Race condition
    2. shared_ptr
    3. thread::join
    4. Повторный захват mutex
    5. Signal-unsafe
    6. condition_variable

Помощь

В тексте могут быть ошибки, опечатки, неточности, он может устаревать. Пожелания, предложения и замечания приветствуются: можно завести issue или сделать pull request.

И еще кое-что

Бегать за вами и судиться автор сего сборника не будет, но все-таки:

На этот проект можно ссылаться. Можно приводить примеры из него, со ссылками, конечно же.

Для копирования и иного воспроизведения надо получить согласие автора

Нельзя использовать в платных сервисах или взимать плату за обучение по этим материалам.

Ну и самое последнее примечание

Черновое название этой работы, "Ружье достаточной огневой мощи, чтобы на нем повеситься", как могли догадаться искушенные читатели, было эдаким реверансом в сторону известного (но очень плохо состарившегося) сборника по C++ "Веревка достаточной длины, чтобы выстрелить себе в ногу" от Алана Голуба. Но, к сожалению, мы живем в нежном мире победивших алгоритмов ранжирования и надзорных органов, то и дело стремящихся кого-нибудь от чего-нибудь защитить.

Автор, конечно, очень бы хотел защитить всех от C++, и именно этому и служит данных сборник, но с заблокированным и пессимизированным репозиторием прогресса в этом направлении не будет.

Copyright 2020-2024 Dmitry Sviridkin