Какой бы хорошей ни была практика, иногда нужно открыть учебник и покопаться в теоретической базе. Если же вы только начинаете погружаться в IT, то изучение книг и статей вообще должно стать чем-то вроде любимого хобби. Читать много и постоянно означает быть в курсе последних обновлений и подходить в практическим занятиям с мощным бэкграундом.
Одна из наших самых популярных статей – про обучение Data Science с нуля. В ней мы уже касались того, какие книги лучше читать начинающему data scientist. В этом материале мы раскроем эту тему более детально, перечислим какие книги о data science для начинающих выбрать в качестве настольных и где их скачать.
Если вы уже читаете часть из этих книг – можете перейти к разделу Data Science в нашем каталоге онлайн-курсов в IT и подобрать там для себя что-то интересное
Д. Грас – «Data Science. Наука о данных с нуля».
Автор подает материал так, чтобы даже новичок в data science понял, о чем идет речь. В процессе чтения можно впервые погрузиться в программирование, алгебру, математический анализ и другие необходимые темы.
Грас описывает основы машинного обучения. Обращает внимание на полезные способы обработки, сбора и объединения данных. Кроме этого в каждой главе автор рекомендует полезные ссылки, которые будут полезны в дальнейшем обучении. Все примеры, которые приводит Грас, написаны на Python.
Купить и скачать: ЛитРес
Анналин Ын, Кеннет Су – «Теоретический минимум по Big Data. Всё что нужно знать о больших данных»
Одна из первых книг, которую должен прочитать будущий спец по data science. Авторы легко и интересно рассказывают, что такое Big Data, а также о ее алгоритмах и механизмах работы. Каждому алгоритму посвящена отдельная глава, где объясняются основные принципы работы и даются примеры использования в реальных задачах.
«Теоретический минимум по Big Data. Всё что нужно знать о больших данных» будет полезной для тех, кто только начал заниматься наукой о данных и постигать азы анализа. А уже после прочтения этой книги можно браться за что-то посерьезней.
Купить и скачать: ЛитРес
В. В. Степаненко, А. А. Барсегян, И. И. Холод, М. С. Куприянов – «Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP»
Одно из основных учебных пособий, которое рекомендуют к прочтению в университетах сами преподаватели – второе, обновленное и дополненное издание книги «Методы и модели анализа данных. OLAP и Data Mining».
Это самый настоящий учебник, который вводит начинающего разработчика в data science. Авторы говорят об основных направлениях в области разработки корпоративных систем. Это организация хранилищ данных, распределенный, оперативный (OLAP), интеллектуальный (Data Mining), визуальный (Visual Mining) и текстовый (Text Mining) анализ данных. Самое то для начала обучения.
Купить и скачать: ЛитРес
Кэти О’Нил, Рэйчел Шатт – «Data Science. Инсайдерская информация для новичков. Включая язык R»
Если бы мы сейчас говорили об университетских курсах по data science, эта книга могла бы стать первой лекцией в самом начале семестра. И действительно она основана на вводном курсе по data science для начинающих из Колумбийского университета. Ее авторы уверены, что начинающему специалисту-аналитику «Data Science. Инсайдерская информация для новичков. Включая язык R» необходима.
О’Нил и Шатт доступным языком говорят о важных вещах: статистических алгоритмах, визуализации данных, финансовом моделировании и не только. При этом начинающему data scientist придется немного потрудиться и подтянуть некоторые свои знания самостоятельно, чтобы лучше понять материал. Не стоит бояться – в будущем они обязательно пригодятся.
Купить и скачать: ЛитРес
Уэс Маккини – «Python и анализ данных»
Многие современные компании требуют от data scientist знания именно Python (в той статье мы уже подробно разобрали, почему). Именно поэтому Уэс Маккини написал современное практическое введение в разработку научных приложений на Python, которые ориентированы именно на обработку данных. Автор описывает те части Python с библиотеками, которые нужны именно для эффективного решения аналитических задач.
«Python и анализ данных» можно назвать настольной книгой начинающего data scientist. Она отлично подойдет тем разработчикам, которые занимаются data science и планируют работать с машинным обучением и анализом данных.
Купить и скачать: ЛитРес
Себастьян Рашка – «Python и машинное обучение»
В своей книге Себастьян представляет начинающему data scientist доступ в мир предиктивной аналитики. Он подробно рассказывает, почему Python считают одним из основных языков науки о данных. В книге вы узнаете о крутых и мощных библиотеках этого языка программирования, в том числе Scikit-learn, Theano и Keras.
Во время чтения вы найдете руководство и советы по всем вопросам, среди которых анализ мнений и подробное описание, что такое нейронные сети и как с ними работать. «Python и машинное обучение» расскажет о всех основных моделях машинного обучения и поможет лучше разобраться в data science.
Купить и скачать: ЛитРес
Франсуа Шолле – «Глубокое обучение на Python»
Автор этой книги, Франсуа Шолле, работает в Google и занимается проблематикой глубокого обучения – совокупностью методов машинного обучения, основанных на имитации работы человеческого мозга. Он же и создал Keras — библиотеку глубокого обучения.
В своей книге «Глубокое обучение на Python» Франсуа говорит о наборах алгоритмов машинного обучения, которые моделируют высокоуровневые абстракции в данных. Автор знакомит читателя с глубоким обучением на практических примерах (от простого к сложному) из разных областей, подробно рассказывая о каждом случае.
«Глубокое обучение на Python» разделено на две части: теоретическую и практическую. Она станет отличной настольной книгой для начинающего data scientist.
Купить и скачать: ЛитРес
Бенджамин Бенгфорт, Ребекка Билбро, Тони Охеда – «Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка»
В аннотации «Прикладной анализ текстовых данных на Python» говорят следующее: «Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения». Нейросети сейчас умеют очень многое. Но что делать, если Сири не понимает вопроса, а Google выдает непонятный перевод? Все просто: обращать внимание на алгоритмы.
Авторы книги как раз рассказывают, как применять методы машинного обучения для анализа текста с использованием библиотек Python. В главах подробно расписываются примеры анализа текста, много пояснений. Будет сложно, но интересно. И попрактиковаться можно.
Купить и скачать: ЛитРес
Адитья Бхаргава – «Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих»
Слово «грокать» в 1961 году изобрел еще писатель-фантаст Роберт Хайнлайн. Оно означает процесс понимания, познания до самого основания и вникания в самую суть объекта. Именно это и сделал в своем романе Адитья Бхаргава, когда написал простым языком полное и иллюстрированное пособие для программистов, дополнив его интересными задачами.
В своей книге Адитья рассказывает об алгоритмах и показывает, как их решать. Можно подумать, что автор несерьезен, но так он подает сложный материал о data science для начинающих. Здесь много теории, но и практики тоже хватает.
Купить и скачать: ЛитРес
Энтони Молинаро – «SQL. Сборник рецептов»
При освоении data science отдельное внимание стоит уделить SQL (Structured Query Language). Это язык структурированных запросов. Он используется в качестве эффективного способа сохранения данных, поиска их частей, обновления, удаления и извлечения из базы.
Книга Энтони Молинаро – учебно-практическое пособие по SQL. При этом она будет очень полезна для новичков и тех, кто уже знаком с языком запросов и хочет повысить свой профессиональный уровень.
В своем «сборнике рецептов» Молинаро систематично и подробно рассказывает, как решать задачи для разных Систем управления базами данных: DB2, Oracle, PostgreSQL, MySQL и SQL Server. Автор также говорит о расширенных методах работы с хранилищами данных (визуализация, резюмирование данных).
Для тех, кто только начал изучать data science, «SQL. Сборник рецептов» станет хорошим стартовым пособием.
Купить и скачать: ЛитРес
Мана Такахаси – «Занимательное программирование. Базы данных»
Образовательная манга Маны Такахаси, в которой говорится об SQL, немного отличается от стандартных учебников. Во-первых, в ней главные герои, во-вторых, прописан сюжет.
Начинающий разработчик познакомится с SQL вместе с принцессой Руруной и Кейном, у которых возникла большая проблема. В их империи, торгующей фруктами, царит полная неразбериха из-за противоречивых данных. Дыни подменились яблоками и клубникой, что вызвало большие трудности в работе. Чтобы решить эту проблему, герои должны создать базу данных, которая поможет продажам. И дыни подменяются яблоками и клубникой.
В ходе этой истории вы узнаете, как работает база данных, изучите все необходимые термины и даже повторите пройденное.
Ссылка: ЛитРес
Онлайн-курсы для начинающего data scientist
Самое главное, конечно же, это практика. Когда вы начинаете осваивать новую профессию, не забывайте подкреплять теорию действиями. Так вы лучше поймете материал, а живое общение с коллегами и наставниками поможет разобраться в каком-то сложном моменте, который вы не понимаете.
Профессия Data Scientist PRO от SkillBox
Это большой и серьезный курс для тех, кто начал изучать data science. Преподаватели расскажут подробно, что такое Big Data, расскажут про Python и помогут с нуля освоить SQL. Новые знания всегда подкрепляются практикой и домашними заданиями.
Начальный курс SQL от Udemy
Этот курс рассказывает с нуля о SQL для тех, кто ступил на путь data science для начинающих. Как говорят создатели, не нужно даже начальных знаний – всему научат. Несмотря на то, что это компактный курс, он содержит достаточное количество информации и практики, чтобы освоить SQL.
Профессия: Data Scientist от ProductStar
Большой и подробный онлайн-курс о профессии data scientist с нуля. Во время обучения наставники помогут подтянуть теорию, подробно познакомят с SQL и подтянут ваше знание Python. После обучения вам гарантированно помогут с трудоустройством.
Факультет Data Science в медицине от GeekBrains
Хороший курс (длится больше года) для новичков в data science, который в итоге позволит сделать карьеру в медицине. Школа предлагает разные форматы обучения, в том числе по медицинской специализации. Итогом станет наличие 15-ти работ в портфолио о трудоустройство после получения диплома.
Почему важно читать книги о Data Science?
В первую очередь потому что это наука о данных. А наука требует мощного теоретического базиса. Но есть и свои нюансы.
Всех книг по data science для начинающих не перечитаешь. Поэтому расширяйте свою картину мира и другими путями – общайтесь с коллегами и перенимайте их опыт, подписывайтесь на интересные каналы и группы (не только о data science, но и смежные темы), смотрите обзоры и изучайте онлайн-курсы. Это обязательно поможет вам на пути изучения data science.
Читать дальше:
ЛУЧШИЕ КНИГИ ПО УПРАВЛЕНИЮ И МЕНЕДЖМЕНТУ
ЛУЧШИЕ АУДИОКНИГИ ПО САМОРАЗВИТИЮ
С ЧЕГО НАЧАТЬ ИЗУЧЕНИЕ ПРОГРАММИРОВАНИЯ?
ОБУЧЕНИЕ DATA SCIENCE С НУЛЯ – С ЧЕГО НАЧАТЬ?
Комментарии закрыты.