Меня зовут Алексей Зиновьев и я пишу приложения имеющие дело с обработкой данных с 2008 года. Позволь мне рассказать тебе, как решить несколько задач, характерных для современной Big Data разработки, а также попутно построить несколько незамысловатых, но добротных архитектур.
Все примеры кода, используемые в этой книге будут доступны по адресу https://github.com/zaleslaw/Spark-Tutorial
Пожелания по развитию книги и примеров кода приветствуются!
Я буду постепенно вводить персонажей, задавать тебе вопросы, иногда давать на них ответы, тем самым, укрепляя твой дух и решимость на пути великой битвы с "большими данными".
Также, я надеюсь, ты читал некоторые известные книги или смотрел доклады на конференциях об обработке данных
{% youtube %}
https://www.youtube.com/watch?v=dXKs26ySPHw
{% endyoutube %}
о работе с Hadoop или
{% youtube %}
https://www.youtube.com/watch?v=TtsBOBXJnyE
{% endyoutube %}
о выходе Spark 2
{% youtube %}
https://www.youtube.com/watch?v=FE7Vo8QqEYw
{% endyoutube %}
Если нет, то потрать 1-2 часа на это и двигайся дальше.