FEW SKILLS
Все о продуктивности

ЧТО ЧИТАТЬ НАЧИНАЮЩЕМУ DATA SCIENTIST?

31

Какой бы хорошей ни была практика, иногда нужно открыть учебник и покопаться в теоретической базе. Если же вы только начинаете погружаться в IT, то изучение книг и статей вообще должно стать чем-то вроде любимого хобби. Читать много и постоянно означает быть в курсе последних обновлений и подходить в практическим занятиям с мощным бэкграундом.

Одна из наших самых популярных статей – про обучение Data Science с нуля. В ней мы уже касались того, какие книги лучше читать начинающему data scientist. В этом материале мы раскроем эту тему более детально, перечислим какие книги о data science для начинающих выбрать в качестве настольных и где их скачать.

Если вы уже читаете часть из этих книг – можете перейти к разделу Data Science в нашем каталоге онлайн-курсов в IT и подобрать там для себя что-то интересное

книга

Д. Грас – «Data Science. Наука о данных с нуля».

Автор подает материал так, чтобы даже новичок в data science понял, о чем идет речь. В процессе чтения можно впервые погрузиться в программирование, алгебру, математический анализ и другие необходимые темы.

Грас описывает основы машинного обучения. Обращает внимание на полезные способы обработки, сбора и объединения данных. Кроме этого в каждой главе автор рекомендует полезные ссылки, которые будут полезны в дальнейшем обучении. Все примеры, которые приводит Грас, написаны на Python.

Купить и скачать: ЛитРес

учебник Анналин Ын и Кеннет Су

Анналин Ын, Кеннет Су – «Теоретический минимум по Big Data. Всё что нужно знать о больших данных»

Одна из первых книг, которую должен прочитать будущий спец по data science. Авторы легко и интересно рассказывают, что такое Big Data, а также о ее алгоритмах и механизмах работы. Каждому алгоритму посвящена отдельная глава, где объясняются основные принципы работы и даются примеры использования в реальных задачах.

«Теоретический минимум по Big Data. Всё что нужно знать о больших данных» будет полезной для тех, кто только начал заниматься наукой о данных и постигать азы анализа. А уже после прочтения этой книги можно браться за что-то посерьезней.

Купить и скачать: ЛитРес

учебное пособие

В. В. Степаненко, А. А. Барсегян, И. И. Холод, М. С. Куприянов – «Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP»

Одно из основных учебных пособий, которое рекомендуют к прочтению в университетах сами преподаватели – второе, обновленное и дополненное издание книги «Методы и модели анализа данных. OLAP и Data Mining».

Это самый настоящий учебник, который вводит начинающего разработчика в data science. Авторы говорят об основных направлениях в области разработки корпоративных систем. Это организация хранилищ данных, распределенный, оперативный (OLAP), интеллектуальный (Data Mining), визуальный (Visual Mining) и текстовый (Text Mining) анализ данных. Самое то для начала обучения.

Купить и скачать: ЛитРес

учебник

Кэти О’Нил, Рэйчел Шатт – «Data Science. Инсайдерская информация для новичков. Включая язык R»

Если бы мы сейчас говорили об университетских курсах по data science, эта книга могла бы стать первой лекцией в самом начале семестра. И действительно она основана на вводном курсе по data science для начинающих из Колумбийского университета. Ее авторы уверены, что начинающему специалисту-аналитику «Data Science. Инсайдерская информация для новичков. Включая язык R» необходима.

О’Нил и Шатт доступным языком говорят о важных вещах: статистических алгоритмах, визуализации данных, финансовом моделировании и не только. При этом начинающему data scientist придется немного потрудиться и подтянуть некоторые свои знания самостоятельно, чтобы лучше понять материал. Не стоит бояться – в будущем они обязательно пригодятся.

Купить и скачать: ЛитРес

книга

Уэс Маккини – «Python и анализ данных»

Многие современные компании требуют от data scientist знания именно Python (в той статье мы уже подробно разобрали, почему). Именно поэтому Уэс Маккини написал современное практическое введение в разработку научных приложений на Python, которые ориентированы именно на обработку данных. Автор описывает те части Python с библиотеками, которые нужны именно для эффективного решения аналитических задач.

«Python и анализ данных» можно назвать настольной книгой начинающего data scientist. Она отлично подойдет тем разработчикам, которые занимаются data science и планируют работать с машинным обучением и анализом данных.

Купить и скачать: ЛитРес

Себастьян Рашка, учебник. Python и машинное обучение

Себастьян Рашка – «Python и машинное обучение»

В своей книге Себастьян представляет начинающему data scientist доступ в мир предиктивной аналитики. Он подробно рассказывает, почему Python считают одним из основных языков науки о данных. В книге вы узнаете о крутых и мощных библиотеках этого языка программирования, в том числе Scikit-learn, Theano и Keras.

Во время чтения вы найдете руководство и советы по всем вопросам, среди которых анализ мнений и подробное описание, что такое нейронные сети и как с ними работать. «Python и машинное обучение» расскажет о всех основных моделях машинного обучения и поможет лучше разобраться в data science.

Купить и скачать: ЛитРес

Франсуа Шолле

Франсуа Шолле – «Глубокое обучение на Python»

Автор этой книги, Франсуа Шолле, работает в Google и занимается проблематикой глубокого обучения – совокупностью методов машинного обучения, основанных на имитации работы человеческого мозга. Он же и создал Keras — библиотеку глубокого обучения.

В своей книге «Глубокое обучение на Python» Франсуа говорит о наборах алгоритмов машинного обучения, которые моделируют высокоуровневые абстракции в данных. Автор знакомит читателя с глубоким обучением на практических примерах (от простого к сложному) из разных областей, подробно рассказывая о каждом случае.

«Глубокое обучение на Python» разделено на две части: теоретическую и практическую. Она станет отличной настольной книгой для начинающего data scientist.

Купить и скачать: ЛитРес

Книга

Бенджамин Бенгфорт, Ребекка Билбро, Тони Охеда – «Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка»

В аннотации «Прикладной анализ текстовых данных на Python» говорят следующее: «Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения». Нейросети сейчас умеют очень многое. Но что делать, если Сири не понимает вопроса, а Google выдает непонятный перевод? Все просто: обращать внимание на алгоритмы.  

Авторы книги как раз рассказывают, как применять методы машинного обучения для анализа текста с использованием библиотек Python. В главах подробно расписываются примеры анализа текста, много пояснений. Будет сложно, но интересно. И попрактиковаться можно.

Купить и скачать: ЛитРес

книга

Адитья Бхаргава – «Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих»

Слово «грокать» в 1961 году изобрел еще писатель-фантаст Роберт Хайнлайн. Оно означает процесс понимания, познания до самого основания и вникания в самую суть объекта. Именно это и сделал в своем романе Адитья Бхаргава, когда написал простым языком полное и иллюстрированное пособие для программистов, дополнив его интересными задачами.

В своей книге Адитья рассказывает об алгоритмах и показывает, как их решать. Можно подумать, что автор несерьезен, но так он подает сложный материал о data science для начинающих. Здесь много теории, но и практики тоже хватает.

Купить и скачать: ЛитРес

Обложка книги

Энтони Молинаро – «SQL. Сборник рецептов»

При освоении data science отдельное внимание стоит уделить SQL (Structured Query Language). Это язык структурированных запросов. Он используется в качестве эффективного способа сохранения данных, поиска их частей, обновления, удаления и извлечения из базы.

Книга Энтони Молинаро – учебно-практическое пособие по SQL. При этом она будет очень полезна для новичков и тех, кто уже знаком с языком запросов и хочет повысить свой профессиональный уровень.

В своем «сборнике рецептов» Молинаро систематично и подробно рассказывает, как решать задачи для разных Систем управления базами данных: DB2, Oracle, PostgreSQL, MySQL и SQL Server. Автор также говорит о расширенных методах работы с хранилищами данных (визуализация, резюмирование данных).

Для тех, кто только начал изучать data science, «SQL. Сборник рецептов» станет хорошим стартовым пособием.

Купить и скачать: ЛитРес

манга

Мана Такахаси – «Занимательное программирование. Базы данных»

Образовательная манга Маны Такахаси, в которой говорится об SQL, немного отличается от стандартных учебников. Во-первых, в ней главные герои, во-вторых, прописан сюжет.

Начинающий разработчик познакомится с SQL вместе с принцессой Руруной и Кейном, у которых возникла большая проблема. В их империи, торгующей фруктами, царит полная неразбериха из-за противоречивых данных. Дыни подменились яблоками и клубникой, что вызвало большие трудности в работе. Чтобы решить эту проблему, герои должны создать базу данных, которая поможет продажам. И дыни подменяются яблоками и клубникой.

В ходе этой истории вы узнаете, как работает база данных, изучите все необходимые термины и даже повторите пройденное.

Ссылка: ЛитРес

Онлайн-курсы для начинающего data scientist

Самое главное, конечно же, это практика. Когда вы начинаете осваивать новую профессию, не забывайте подкреплять теорию действиями. Так вы лучше поймете материал, а живое общение с коллегами и наставниками поможет разобраться в каком-то сложном моменте, который вы не понимаете.

Профессия Data Scientist PRO от SkillBox

Это большой и серьезный курс для тех, кто начал изучать data science. Преподаватели расскажут подробно, что такое Big Data, расскажут про Python и помогут с нуля освоить SQL. Новые знания всегда подкрепляются практикой и домашними заданиями.

Начальный курс SQL от Udemy

Этот курс рассказывает с нуля о SQL для тех, кто ступил на путь data science для начинающих. Как говорят создатели, не нужно даже начальных знаний – всему научат. Несмотря на то, что это компактный курс, он содержит достаточное количество информации и практики, чтобы освоить SQL.

Профессия: Data Scientist от ProductStar

Большой и подробный онлайн-курс о профессии data scientist с нуля. Во время обучения наставники помогут подтянуть теорию, подробно познакомят с SQL и подтянут ваше знание Python. После обучения вам гарантированно помогут с трудоустройством.

Факультет Data Science в медицине от GeekBrains

Хороший курс (длится больше года) для новичков в data science, который в итоге позволит сделать карьеру в медицине. Школа предлагает разные форматы обучения, в том числе по медицинской специализации. Итогом станет наличие 15-ти работ в портфолио о трудоустройство после получения диплома.

Почему важно читать книги о Data Science?

В первую очередь потому что это наука о данных. А наука требует мощного теоретического базиса. Но есть и свои нюансы.
Всех книг по data science для начинающих не перечитаешь. Поэтому расширяйте свою картину мира и другими путями – общайтесь с коллегами и перенимайте их опыт, подписывайтесь на интересные каналы и группы (не только о data science, но и смежные темы), смотрите обзоры и изучайте онлайн-курсы. Это обязательно поможет вам на пути изучения data science.

Читать дальше:

ЛУЧШИЕ КНИГИ ПО УПРАВЛЕНИЮ И МЕНЕДЖМЕНТУ

ЛУЧШИЕ АУДИОКНИГИ ПО САМОРАЗВИТИЮ

С ЧЕГО НАЧАТЬ ИЗУЧЕНИЕ ПРОГРАММИРОВАНИЯ?

ОБУЧЕНИЕ DATA SCIENCE С НУЛЯ – С ЧЕГО НАЧАТЬ?

Комментарии закрыты.