7 книг для начинающего специалиста по анализу данных


Оглавление (нажмите, чтобы открыть):

Книги для бизнес аналитика и системного аналитика

Книги по бизнес анализу (база):

  • Дин Лэффенгуэлл, Дон Уидриг — Принципы работы с требованиями к программному обеспечению (2002)
  • Карл Вигерс- Разработка требований к программному обеспечению (Software Requirements) 3-е идание (2020/2014)
    • Software-Requirements-Developer-Best-Practices
  • Алистер Коберн — Современные методы описания функциональных требований к системам (2005)
  • Илья Корнипаев — Требования для программного обеспечения: Рекомендации по сбору и документированию (2014) (для начинающих)
  • А. Перерва, В. Иванова — Путь аналитика. Практическое руководство IT-специалиста
  • Л. Басс, П. Клементс, Р. Кацман Архитектура программного обеспечения на практике (NFR)
  • Джамшид Гараедаги. Системное мышление. Как управлять хаосом и сложными процессами. Платформа для моделирования архитектуры бизнеса
  • Итан М. Расиел. Метод McKinsey. Использование техник ведущих стратегических консультантов для решения личных и деловых задач
  • Итан М. Расиел, Пол Н. Фрига. Инструменты McKinsey. Лучшая практика решения бизнес-проблем
  • UML. Основы, Третье издание. М. Фаулер. 2005 год.

Бесплатный онлайн-курс для начинающих аналитиков

  • «Постановка задачи на разработку ПО» на Stepic.org

Сообщества бизнес аналитиков

Книги, развивающие системное мышление

  • Алан Купер. Психбольница в руках пациентов.
  • Барбара Минто. Принцип пирамиды Минто. Золотые правила мышления, делового письма и устных выступлений.
  • Майкл Ротер, Джон Шук. Учитесь видеть бизнес-процессы. Практика построения карт потоков создания ценности.
  • Элияху Голдрат. Цель-1, Цель-2 (Теория ограничений.)

Ресурсы для аналитиков на нашем сайте

Доклады на тему бизнес анализа в нашем блоге.

Каждый месяц мы делаем рассылку с полезными материалами и анонсами. Оставьте свой email ниже!

Какие книги стоит почитать аналитику? Книги по анализу данных.

Thinking, Fast and Slow, Daniel Kahneman («Думай медленно… решай быстро»)
Financial Times в своем обзоре назвала эту книгу шедевром. Автор, Даниэль Канеман, лауреат Нобелевской премии по экономике, рассказывает как мы совершаем ошибки, хотя нам кажется, что принимаемое нами решение абсолютно верное. Книга стала бестселлером, переведена на многие языки, в том числе на русский:
https://www.ozon.ru/context/detail/id/24286114/

Customer and Business Analytics, Daniel S. Putler («Клиенты и бизнес-аналитика«)
Эта книга — для владельцев малого и среднего бизнеса. Издание рассказывает, как Data Mining помогает принимать управленческие решения и увеличивает эффективность работы компаний:
https://www.amazon.co.uk/Customer-Business-Analytics-Applied-Decision/dp/1466503963

Show Me the Numbers, Stephen Few («Покажите мне цифры»)
Книга для общего знакомства с анализом информации: как правильно складывать столбцы и записывать строки,как сформировать из отчетов и данных схемы и диаграммы, которые сделают работу прозрачнее и расскажут, что ждет бизнес в будущем. Незаменимое издание для новичков бизнес-аналитики:
https://www.amazon.co.uk/SHOW-ME-NUMBERS-STEPHEN-FEW/dp/0970601972/ref=la_B001H6IQ5M_1_1?s=books&ie=UTF8&q >

Now You See It, Stephen Few («Теперь вы видите это»)
Эту книгу можно назвать продолжением «Покажите мне цифры». Издание рассказывает о принципах количественного анализа данных и содержит много графиков и практических примеров:
https://www.amazon.co.uk/Now-You-See-Stephen-Few/dp/0970601980/ref=asap_bc?ie=UTF8

The Visual Display of Quantitative Information, Edward Tufte («Визуальное отображение количественной информации»)
Второе издание классического пособия по изучению визуального отображения данных. В книге 250 графических примеров, которые наглядно рассказывают обо всех возможных видах графиков, правилах их состояния и частых ошибках:
https://www.edwardtufte.com/tufte/books_vdqi

Signal, Stephen Few («Сигнал»)
Чем больше бизнес, тем больше данных поступают в офис компании. Со временем информации может стать так много, что руководители и аналитики могут не заметить важную или даже тревожную информацию. Эта книга рассказывает, как не «оглохнуть» в информационном шуме и научиться видеть действительно важные данные:
https://www.amazon.co.uk/gp/product/1938377052?keywords=signal%20stephen%20few&q >

Statistics Done Wrong, Alex Reinhart («Неправильная статистика»)
Работая с большим количеством хранилищ данных любой пользователь, от начинающего маркетолога до опытного аналитика или директора компании, может допустить ошибку. Одну, может быть, самую незначительную. Но тогда возникает риск того, что все отчеты и принятые на их основании решения неверны. Избежать этого поможет полное руководство Алекса Рейнхарта по самым распространенным статистическим ошибкам. Книга распространяется бесплатно, скачать ее можно по ссылке:
https://www.statisticsdonewrong.com/index.html

The Functional Art, Alberto Cairo («Функциональное искусство»)
Если вдуматься, нас окружает огромное количество данных, компании могут собирать информацию буквально отовсюду. «Функциональное искусство» — книга о магии цифр. Альберто Каир рассказывает, как данные могут указывать на слабые и сильные стороны в работе бизнесменов, ученых и политиков. Книга выпущена вместе с диском, содержащим видеоуроки:
https://www.amazon.com/gp/product/0321834739/

The Truthful Art , Alberto Cairo («Истинное искусство»)
Еще одна книга автора Альберто Каиро рассказывает про невероятные возможности инфорграфики. Возможности, которые мы упускаем. Речь в книге идет не только о бизнесе, но и любых других составляющих нашей жизни. Цифры окружают людей повсюду и преобразование этой информации в инофграфику дает возможность увидеть скрытое:
https://www.amazon.com/gp/product/0321934075

Tableau — это мощная система интерактивной аналитики, с помощью которой глубокий анализ больших данных делается быстро и наглядно. Tableau не требует дорогостоящего внедрения.

Книги по аналитике данных на русском

Книги по анализу данных, которые стоит прочитать

Как извлекать информацию из массивов данных и эффективно их использовать.

  • литература по системному анализу;
  • книги для маркетологов-аналитиков;
  • графический анализ данных;
  • Big Data, Data Science, Deep Learning.

Здесь можно скачать лучшие книги для аналитиков бесплатно для ознакомления, почитать онлайн или купить полную электронную версию в форматах FB2, PDF, EPUB, TXT, DOC, MOBI.

Только легальный контент от правообладателей!

Смотрите также подборки книг по темам:

15 книг по тестированию программного обеспечения

Учиться тестированию можно по-разному. Хорошие книги — источник базовых знаний и практического опыта экспертов.

Автор в сфере IT, digital, экономики и финансов. Ведет некоммерческий проект для начинающих писателей «ЛитЦех».

Книги на русском языке

Святослав Куликов

«Тестирование программного обеспечения. Базовый курс»

Одна из лучших книг по тестированию программного обеспечения для начинающих. Книга рассматривает все основные понятия, необходимые для работы junior-тестировщика, и дает ответы на вопросы, с которыми часто сталкиваются новички. Форма изложения материала доступна людям без какого-либо опыта. Однако в конце книги есть главы, посвященные фреймворкам автоматизирования, которые предназначены уже для состоявшихся тестировщиков.

Роман Савин

«Tестирование dot com»

Это пособие для тех, кто только начинает свой путь в тестировании. Оно дает самые общие представления о профессии, погружает в суть процесса и описывает его простыми словами, без излишнего академизма и трудных для восприятия понятий.

Учебник можно рассматривать как некий гейтвей в тестирование, поскольку автор знакомит читателя с основными терминами, соотносит англоязычные понятия с русскими, попутно раскрывая и объясняя каждое из них.

Преимущество книги Романа Савина «tестирование dot com» еще и в русском языке оригинала, что исключает проблему неточностей перевода.

Канер Сэм, Фолк Джек, Нгуен Енг Кек

«Тестирование программного обеспечения»

Книга больше подойдет не новичкам, а специалистам с опытом — как минимум проработавшим в профессии год и близко знакомым с тестированием. Ее можно назвать библией тестировщика: это объемный, сложный, охватывающий все концепции тестирования труд, требующий глубокого вдумчивого чтения. Из-за сложного тяжеловесного языка не многие доходят даже до середины текста.

Авторы рассматривают тестирование масштабно в связи с другими направлениями разработки, приводят много примеров из опыта реальных компаний и раскладывают по полочкам основы.

Борис Бейзер

«Тестирование черного ящика»

Технологии функционального тестирования программного обеспечения и систем

Классический монументальный учебник по поведенческому тестированию Бориса Бейзера. Книга посвящена базовым методикам тестирования приложений. Некоторые из них на сегодняшний день уже устарели, так как книга не переиздавалась с 2004 года, однако общие принципы и подходы остались прежними и все еще актуальны.

Учебник можно рекомендовать начинающим, если они готовы воспринимать серьезный научный стиль изложения материала. По глубине и методичности рассмотрения основных вопросов и понятий ей нет равных, поэтому она станет отличным подспорьем для желающих изучить тестирование досконально и с разных точек зрения.

Гленфорд Майерс, Том Баджетт, Кори Сандлер

«Искусство тестирования программ»

Универсальный учебник, переживший третье переиздание на русском языке. Книге уже больше 30 лет, но она дополняется от издания к изданию. Несмотря на столь почтенный возраст, она не теряет актуальности благодаря глубине изложенного материала. Книга посвящена не методикам или языкам тестирования. Авторы поставили своей целью рассказать об основополагающих принципах тестирования:

  • мобильных приложений;
  • веб-приложений;
  • удобства использования;
  • сквозного и гибкого тестирования;
  • коллективного, то есть с привлечением пользователей, подхода.

По уровню знаний и навыков она больше подходит начинающим специалистам, хотя может и значительно расширить кругозор уже работающих тестировщиков.

Рекс Блэк

«Ключевые процессы тестирования»

Оптимизация ресурсов и временных затрат на тестировании — важная и острая тема для команд разработки. Книга Рекса Блэка через контроль рисков рассказывает о 12 процессах тестирования.

Многим книга может показаться излишне подробной и затянутой, однако ее стоит прочитать прежде всего ведущим тестировщикам и тест-менеджерам. Они смогут адаптировать советы к российским реалиям и своей конкретной задаче, чтобы сэкономить время на тестировании ПО и сделать процесс разработки более эффективным.

Лиза Криспин, Джанет Грегори

«Гибкое тестирование»

Практическое руководство для тестировщиков ПО и гибких команд

Книга посвящена методике гибкого тестирования: это использование квадрантов гибкого тестирования, набор средств для него, требования к команде QA-специалистов, итерация гибкой разработки и факторы успеха применяемой стратегии.

Рекомендуется ведущим тестировщикам и специалистам среднего уровня.

Элфрид Дастин, Джефф Рэшка, Джон Пол

«Автоматизированное тестирование программного обеспечения»

Без автоматизации в тестировании сегодня никуда: чем сильнее ускоряется темп разработки и растут объемы задач, тем больше командам требуются новые быстрые технологии.

Эта книга представляет собой полное руководство по применению приемов, методов и инструментов автоматизированного тестирования и охватывает весь жизненный цикл автоматизации. Для ее чтения и понимания нужна база, поэтому книга рекомендуется только работающим специалистам с опытом в качестве инструмента повышения квалификации.

Арбон Джейсон, Каролло Джефф, Уиттакер Джеймс

«Как тестируют в Google»

Еще одна книга для сеньоров и ведущих тестировщиков. В отличие от пособий, где приводятся примеры из работы вымышленных компаний, в издании рассказывается о реальной организации процессов и управления командами тестирования в корпорации Google.

Книга будет полезна тем, кто мечтает там работать, так как содержит главы о прохождении собеседований и другие подобные рекомендации. Подача материала — легкая с профессиональным юмором, иллюстрациями и примерами. Оценивать ее стоит скорее как средство расширения кругозора, нежели учебное пособие, а читать рекомендуется на английском языке, хотя существует и перевод.

Книги на английском языке

Cem Kaner, James Bach, Bret Pettichord

«Lessons Learned in Software Testing»

Книга привлекает практической направленностью: авторы с богатейшим опытом собрали 293 урока, где коснулись основных вопросов тестирования ПО. Будет полезна и для новичков, и для опытных специалистов.

Авторы дают конкретные практические советы по всем аспектам тестирования: планирование стратегии, методики и техники, правила написания отчетов, автоматизация, взаимодействие разработчиков и тестировщиков, документирование, управление командой и карьерный рост. Из-за особенности поурочной структуры ее можно читать с любого места.

Boris Beizer

«Software Testing Techniques»

Классический учебник Бориса Бейзера, хорошо известный за рубежом и у нас. Его отличает целостный и методичный подход к изложению информации, понятный язык и широкий охват тем тестирования.

Пособие не только поможет новичкам освоить профессию, но и останется с ними в качестве настольной книги тестировщика на долгие годы.

Ajay Balamurugadas, Sundaresan Krishnaswami

«Mobile Testing: Ready Reckoner»

Книга содержит советы и четкие инструкции по тестированию мобильных приложений от практикующих специалистов. С помощью их рекомендаций, скриншотов и понятных объяснений начинающий легко разберется в процессе тестирования продуктов для операционных систем Android и iOS.

Mike Andrews, James A. Whittaker

«How to break web software»

Базовая книга об атаках в тестировании программного обеспечения. Подходит и начинающим, и опытным специалистам, но первые испытают сложности из-за трудного языка. Для вторых же она идеальна и даст множество полезных знаний.

Ее можно перечитывать много раз и находить новые способы решения насущных задач. Автор рассказывает о различных типах атак: на сервер, на клиент, state based и других. Описание атаки состоит из вводной части, сферы применения и инструкции о том, как ее проводить.

James A. Whittaker

«How to Break Software Security»

Вторая книга Витакера — пошаговое руководство по тестированию безопасности приложений. Ее лучше читать после «How to break web software».

Подходит уже работающим специалистам с базовыми навыками в тестировании в целом, но не знающим ничего о защищенности.

Автор рассказывает о верхнеуровневых классах проверок, например, на уровне кода или GUI, и приводит 19 атак на защищенность приложения. Каждое описание атаки или инъекции состоит из вводной части, описания случаев применения и руководства по нему.

Gerald M. Weinberg

«Perfect Software and other illusions about testing»

Очень интересная книга, которая понравится всем уже работающим в команде тестировщикам, а новичков может спустить с небес на землю. Увы, только в учебниках и абстрактных компаниях проекты всегда задокументированы, а в архитектуре царит полный порядок. Эта книга рассказывает о жестокой реальности и развенчивает иллюзии в тестировании.

Автор приводит реальные типичные ошибки в подходах, а учиться на ошибках — самое полезное дело. В совместной работе специалисты часто переводят стрелки друг на друга и отказываются фиксить и документировать баг, ссылаясь на то, что это не их зона ответственности. Что с этим делать и как с этим жить — в том числе рассказывает Gerald M. Weinberg.

Заключение

Мы предложили вам 15 испытанных временем книг по тестированию программного обеспечения, которые помогут освоиться в этой профессии. А еще рекомендуем наш обучающий курс по тестированию. Здесь в доступной интерактивной форме под руководством наставников вы изучите актуальный материал, научитесь использовать его на практике и получите новую профессию с возможностью трудоустройства.

Анализ данных: 74 книги — скачать в fb2, txt на андроид или читать онлайн

Анализ данных

Слишком много книг? Вы можете уточнить книги по запросу «Анализ данных» (в скобках показано количество книг для данного уточнения)


Работа с данными в любой сфере

Что общего у аналитика данных и Шерлока Холмса? Как у Netflix получилось создать 100 %-ный хит – сериал «Карточный домик»? Ответ кроется в правильном использовании данных. Эта книга – практическое руководство и увлекательное путешествие в науку о данных, независимо от того, хотите ли вы использовать…

Big data простым языком

Наш телефон знает о нас больше, чем мы думаем. Он умеет собирать и анализировать информацию о том, как мы передвигаемся по городу, какие посты лайкаем и какими приложениями пользуемся. Он сообщит о пробках и поторопит на работу, чтобы мы не опоздали; подберет музыку под наше настроение и составит сп…

Сталинский план преобразования природы и его осуществление на Южном Урале

Данная исследовательская работа посвящена сталинскому плану преобразования природы. Это система политико-хозяйственных мероприятий послевоенного времени, направленная на увеличение урожайности, очищение от последствий войны, исследования в области природопользования и ресурсов СССР. Проводился в сел…

Капиталистическое отчуждение труда и кризис современной цивилизации

В монографии исследуются эволюция капиталистического отчуждения труда в течение последних ста лет, возникновение новых форм отчуждения, влияние растущего отчуждения на развитие образования, науки, культуры, личности. Исследование основывается на материалах философских, социологических и исторических…

Мастер Йода рекомендует:  Android Studio для начинающих установка и настройка

Основное достоинство практических руководств Андрея Ветрова – невероятный, фантастический уровень доходчивости. По этим книгам ученик среднего школьного возраста сможет изучить и Word, и Excel. Эта книга научит вас пользоваться офисной программой от компании Microsoft – Excel.…

Статистика и котики

Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы, а также многое и многое другое. И все это – на простых и понятных примерах из жизни милых и пушистых котиков, кото…

Русская национальная мысль. Том 5

В содержании тома вы будете приятно удивлены гармоничным сочетанием в процессе анализа событий истории философии, физиологии и самой истории. Акцент сделан на то, что мир вращается вокруг абсолюта, которому сформулировано определение.…

Русская национальная мысль. Том 3

Этот том интересен будет для тех, кто увлекается занимательной археологией. Интересные факты в поведении древних проливают свет на современный мир. Рекомендовано для тех читателей, кто любит увлекательное чтение взахлеб. Познавательно и поучительно. Хорошо взрослым детям о прочитанном рассказывать.…

Русская философия. Анализ истории. Том 2. Часть 2

Три части второго тома для тех, кто по роду своей проф. деятельности привязан к точным наукам. Тут нет каких-то домыслов. Приятного проведения времени.…

Возрастные особенности счастливой жизни в России и Европе: эконометрический подход

В работе проведен сравнительный анализ влияния возраста на уровень счастья в России и европейских странах. Использовались данные European Social Survey по 29 странам за 2012 г. На основе логит-моделей упорядоченного выбора для уровня счастья получены оценки от возраста для каждой анализируемой стра…

Математическая статистика для психологов. Учебник

Учебник представляет практическое руководство по математической статистике для психологов, не имеющих специальных математических знаний. В доступной иллюстративной форме на примерах рассматриваются основные методы обработки данных, включая непараметрические и параметрические критерии оценки различи…

Гиперспектральное дистанционное зондирование в геологическом картировании

Книга посвящена применению мульти- и гиперспектрального зондирования Земли для решения задач геологического картирования. Рассматриваются современные методы обработки и анализа данных гиперспектрального дистанционного зондирования земной поверхности из космоса. Изложены преимущества гиперспектральн…

Основы нечеткой технологии и примеры решения аналитических задач в государстве и бизнесе

Сегодня несоответствие между теорией и практикой решения аналитических проблем становится все более очевидным. С одной стороны, совершенство методов решения прикладных задач, в том числе и нечеткой технологии, повышается каждый год. С другой – большинство аналитиков предпочитает использовать описан…

Применение возможностей Microsoft Excel в моделировании рисков инвестиционных проектов

На эффективность инвестирования влияют факторы, которые меняются случайным образом либо не подвержены воздействию со стороны инвестора. Проанализировать риски инвестиционной деятельности можно с помощью применения имитационного моделирования по методу Монте-Карло. Сделать это эффективно можно в сре…

1С:Предприятие 8.1. Учимся программировать на примерах (3-е издание)

Обучение разработке конфигураций и программированию на платформе 1С:Предприятие 8.1 построено на практических примерах различной сложности. Основной упор сделан на подробное описание технологии разработки конфигураций с использованием конструкторов и встроенного языка программирования. Большое вним…

Анализ данных на компьютере

В учебном пособии без лишнего формализма излагаются основные идеи и понятия математической статистики, необходимые на практике для анализа данных. На примерах подробно рассмотрены важнейшие постановки статистических задач и методы их решения, включая расчеты на компьютере в пакете SPSS. Рекомендуе…

Анализ больших наборов данных

Эта книга написана ведущими специалистами в области технологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining). В книге описываются алгоритмы, которы…

В учебном пособии рассмотрены теоретические основы интеллектуальных систем, модели и методы интеллектуального анализа данных. Теоретический материал дополнен примерами и программной реализацией интеллектуальных задач, вопросами и тестами для проверки усвоения материала. …

Microsoft SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных

Книга, написанная разработчиками Microsoft SQL Server 2005 Analysis Services, дает читателю полное представление об его функционировании и устройстве. В ней рассмотрены основы многомерного анализа данных и дано глубокое представление о многомерных моделях данных и устройстве OLAP-сервера. Описаны о…

Покер. Курс техасского холдема

Данная книга написана на основе специальных методических разработок авторов и призвана дать читателю необходимую и достаточную теоретическую подготовку как для самостоятельного освоения игры в покер, так и для дальнейшего совершенствования его покерного мастерства. Игра в покер требует от игрока ин…

Персональный компьютер. Лучший самоучитель

В седьмом издании книги описывается устройство современного ПК. Рассказывается о новейшей операционной системе Microsoft Windows 7, популярном текстовом редакторе Word 2010 и редакторе электронных таблиц Excel 2010. Описываются средства записи CD/DVD, словари и переводчики, программы обработки фото…

Статистический анализ данных в психологии

В учебном пособии описываются основные математические методы, предлагаемые математической теорией и широко применяемые на практике в современных психолого-педагогических исследованиях. Излагаются основные понятия теории вероятностей и описываются конкретные математические методы обработки данных. …

Вычисления в Matlab

В учебном пособии дано описание основных функций Matlab, которые могут быть использованы для исследования функций, численного решения задач линейной алгебры, поиска корней произвольных уравнений, решения задачи Коши и краевых задач для систем обыкновенных дифференциальных уравнений. Приведены приме…

Корреляционная грамматика сербского, хорватского и бошняцкого языков. Часть 1: Фонетика – Фонология

В настоящей книге рассматриваются фонетические, фонологические и просодические корреляции между сербским, хорватским и бошняцким языками. В центре внимания находятся совпадения, сходства и различия между этими языками, а также сравнение с остальными славянскими языками (особенно русским) и немецким…

Data mining, или Интеллектуальный анализ данных для занятых. Практический курс

Что такое информация? Как можно проанализировать данные, которые у вас есть? А если данных очень много и они требуют вычислительной мощи современных компьютеров? Какие выводы можно сделать из этого массива данных? Может – никаких, а может – это неиссякаемый источник, приносящий все новые возможност…

Организационно-экономическое моделирование. Часть 3. Статистические методы анализа данных

Изложены современные методы анализа статистических данных. Рассмотрены начала выборочных исследований и основные задачи описания данных, оценивания и проверки гипотез, статистические методы анализа числовых данных, многомерный статистический анализ и статистические методы анализа динамики. Приведен…

Анализ неопределенности выделения информативных признаков и представлений изображений

В монографии на единой методической основе проанализированы неопределенности, связанные с выделением информативных признаков и формированием представлений изображений. Книга будет полезна: разработчикам новых алгоритмов и систем анализа и распознавания изображений; студентам, бакалаврам и магистрам…

Python и анализ данных

Книгу можно рассматривать как современное практическое введение в разработку научных приложений на Python, ориентированных на обработку данных. Описаны те части языка Python и библиотеки для него, которые необходимы для эффективного решения широкого круга аналитических задач: интерактивная оболочка…

Искусство визуализации в бизнесе. Как представить сложную информацию простыми образами

Визуализация в бизнесе – это умение представить данные в таком виде, который позволит их быстро анализировать, эффектно подавать, ну и конечно, применять в жизни. Прочитав эту книгу, вы научитесь собирать и форматировать информацию, создавать на ее основе диаграммы, графики и карты высокого качеств…

Осваиваем язык Julia

Julia – это хорошо структурированный язык программирования с большим быстродействием, устраняющий классическую проблему выполнения анализа на одном языке и трансляции его результатов на второй с целью повышения производительности. Приведены этапы инсталляции и выполнения Julia в разных операционных…

Система автоматического анализа мнений покупателей

Рассматриваются основные этапы создания и структура лингвистической онтологии и грамматики, предназначенных для системы автоматического анализа мнений покупателей о коммерческих продуктах. Онтология включает синтаксические и семантические термины, их подкатегории, группы и классы и позволяет вычисл…

Определение априорного распределения в байесовском анализе при наличии исходной информации, основанн

В статье предлагается формальное правило, основанное на минимизации информационной метрики Кульбака–Лейблера, для определения априорного распределения при наличии информации, полученной из предыдущих наблюдений. В отличие от обычных предположений в эмпирическом байесовском анализе, в данной работе …

Microsoft Access 2013

Самоучитель позволяет освоить интерфейс и инструменты новой версии Access 2013, а также научиться разрабатывать базу данных и приложение для собственной предметной области пользователя. Описаны новые средства разработки веб-приложения пользователя, автоматически публикуемого на сайтах SharePoint ор…

Сравнительная политология. Политическая власть и политическое выражение

Учебное пособие разработано в соответствии с требованиями Федерального образовательного стандарта высшего профессионального образования по направлению 030201.62 «Политология». Основное внимание уделяется характеристике теоретико-методологических основ сравнительного анализа в политологии по двум кл…

1С:Предприятие 8.3. Бухгалтерия предприятия. Управление торговлей. Управление персоналом

Книга состоит из трех частей, посвященных трем программам системы «1С:Предприятие 8.3». В первой части обсуждаются вопросы работы в «1С:Бухгалтерия 8.3», вторая часть знакомит с программой «1С:Управление торговлей 8.3», в третьей части книги рассказано об использовании «1С:Зарплата и Управление пер…

Методы анализа биосигналов

Изложены теоретические основы и практические рекомендации реализации спектральных преобразований применительно к обработке биомедицинских сигналов. Особое внимание уделено сигналам, получаемым при помощи неинвазивных диагностических методик, и их характеристикам. Показаны особенности преобразований…

Расчетно-графические работы по дисциплине «Компьютерные технологии в науке и образовании в отрасли ф

Учебное пособие по учебной дисциплине «Компьютерные технологии в науке и образовании в отрасли физической культуры и спорта» цикла естественнонаучных дисциплин предназначено для магистрантов I курса направления 032100 «Физическая культура». …

Изучаем Spark. Молниеносный анализ данных

Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные про…

Ментальные карты: способы анализа, погрешность и пространственная метрика

Данная статья посвящена изучению и обобщению существующих способов анализа ментальных карт. Несмотря на широкое распространение этого метода исследования представлений о пространстве, в литературе крайне мало внимания уделяется способам интерпретации полученных данных. В статье автор сопоставляет р…

Оценивание средних и ковариаций нечетко-случайных величин

В настоящее время методы нечеткой математики широко применяются в различных прикладных исследованиях. Например, при составлении портфелей, когда для некоторых активов нет достаточно длинных рядов цен, относящихся к предыдущим периодам, для моделирования доходностей этих активов могут использоваться…

Драйверы инновационной активности промышленных компаний в России

Данная работа выявляет ключевые факторы, влияющие на инвестиции российских компаний в НИОКР. Исследование опирается на выборку из 474 промышленных предприятий за 2005–2010 гг. Панельная структура данных повышает качество анализа, а также позволяет выявить изменения в условиях инновационной деятельн…

Прогноз спортивных достижений в плавании

В учебном пособии изложены положения по прогнозу спортивныхрезультатов пловцов. Дана характеристика видов прогноза. Рассмотреныпрактические действия по построению прогноза. …

Общий психологический практикум. Наблюдение. Учебное пособие

«Наблюдение» – часть первого раздела общего психологического практикума. В рамках курса студенты получают знания и умения в области разработки средств наблюдения, осуществления профессионального наблюдения и подготовки психологических отчетов о проделанной работе. Предназначе…

Понятный самоучитель Excel 2013

Эта книга научит вас работать в Microsoft Excel – одной из самых популярных и востребованных офисных программ. Книга написана простым, доступным языком, снабжена практическими примерами и заданиями для самостоятельного освоения материала и предназначена для самого широкого круга пользователей. В из…

Цитируемость ученых и сети научного соавторства: анализ данных Google Scholar

В работе анализируются корреляции между параметрами сети соавторства и библиометрическими характеристиками ученых в Google Scholar. Оценивание проводилось с помощью моделей счетных данных по выборке, состоящей из более чем 30 тысяч авторов с первым цитированием после 2007 года. Найдена положительна…

Планирование аналитического исследования при помощи методов анализа качественных данных

В статье рассматривается применение методов анализа качественных данных для построения концептуального каркаса исследования, уточнения его целей, задач и вопросов, на которые оно должно ответить. Подобный подход применим для широкого круга исследований, хорошо показывает себя в условиях неопределен…

IBM SPSS Statistics 20 и AMOS: профессиональный статистический анализ данных

Книга представляет собой практическое руководство по анализу данных с помощью самой мощной и популярной программы статистической обработки информации – IBM SPSS Statistics 20. В издании подробно описываются основы работы с пакетом SPSS, рассматривается большинство методов обработки и анализа данных…

О чем говорят цифры. Как понимать и использовать данные

Неважно, чем вы интересуетесь, в какой сфере работаете и каких размеров ваша компания – цифры и аналитика сегодня повсюду, и всем приходится иметь с ними дело. Эта книга в доступной форме познакомит вас с количественным анализом, его терминами и методами, поможет развить аналитические навыки и разг…

Фрейм-аналитическая модель коммуникации: возможности и ограничения

Данная статья содержит аргументацию того, каким образом теория фреймов И. Гофмана может быть использована для построения модели коммуникации, с помощью которой можно анализировать коммуникации во внешне похожих контекстах. Автор использует метафору присутствия / отсутствия, для того чтобы прояснить…

Как использовать анализ данных о добавленной стоимости для улучшения обучения школьников: руководств

Книга посвящена объяснению, способам применения и интерпретирования технологии оценивания деятельности как образовательных институтов (региональных и муниципальных органов управления образованием), так и участников образовательного процесса (в первую очередь учителей и учеников) методом измерения д…

Просчитать будущее. Кто кликнет, купит, соврёт или умрёт

Прогнозная аналитика ― новое оружие в арсенале ведущих мировых компаний и органов государственного управления. Благодаря развитию информационных технологий открылись новые возможности по использованию больших массивов данных для прогнозирования поведения обычных людей. Это помогает эффективне…

Построение нечетких лингвистических переменных с использованием методов кластерного анализа данных

В статье изложен подход к построению нечетких лингвистических переменных, основанный на использовании методов кластерного анализа данных. Основное предположение при использовании этого метода – при удалении от центра кластера степень принадлежности элемента нечеткому множеству уменьшается. …

В книге освещаются теоретико-методологические вопросы, которые обязан знать будущий социолог-профессионал, и базовые темы отраслевых направлений социологии. Рассмотрены виды и методы социологических исследований, теория и методология выборки, особенности анализа эмпирических данных. Учебное пособи…

Теоретическая информатика и ее основания

Во втором томе представлены методы решения обратных задач исследования, проектирования, управления при искажениях фактической и априорной информации, определяются границы информативности числовых данных и моделей. Предложены эффективные методы обращения линейных систем с неопределенными и случайным…

Геронтология in Silico: становление новой дисциплины. Математические модели, анализ данных и вычисли

Книга посвящена развитию кибернетических моделей в геронтологии, описывающих согласованную динамику характеристик биологических систем на различных уровнях организации. Эти модели позволяют прояснить молекулярно-генетическую и физиологическую основу наблюдаемых изменений динамики индивидуального и …

Управление на основе данных. Как интерпретировать цифры и принимать качественные решения в бизнесе

В последние годы популярность обрела тема «больших данных» (big data). Но многие люди не способны справиться даже с малым объемом данных – и, следовательно, не в состоянии принять взвешенное решение. Из книги вы узнаете, как собирать, классифицировать, анализировать данные; использовать их в работ…

Анализ социологических данных с помощью пакета SPSS

В основе учебного пособия лежит курс лекций по анализу социологических данных, читавшийся автором на протяжении ряда лет на факультете социологии Государственного университета – Высшей школы экономики. Рассматриваются методы, используемые социологами на практике: построение и анализ одномерных и д…

Построение систем машинного обучения на языке Python

Применение машинного обучения для лучшего понимания природы данных – умение, необходимое любому современному разработчику программ или аналитику. Python – замечательный язык для создания приложений машинного обучения. Благодаря своей динамичности он позволяет быстро производить разведочный анализ д…

В пособии рассмотрены методы сбора данных, методы вариационного, корреляционного и регрессионного анализа, индексный метод, анализ временных рядов. Помимо теоретического материала в пособии содержится задание к контрольной работе, реализация типовых задач и тесты. …

Структуры данных и алгоритмы их обработки на языке программирования Паскаль

Учебное пособие предназначено для изучения теоретического материала и выполнения лабораторных работ при изучении дисциплин «Алгоритмы и алгоритмические языки», «Структуры и алгоритмы обработки данных». Материал книги условно разбит на две части: язык программирования Паскаль и структуры данных. Опи…

Статистический анализ и визуализация данных с помощью R

Сегодня язык R является безусловным лидером среди свободно распространяемых систем статистического анализа. Ведущие университеты мира, аналитики крупнейших компаний и исследовательских центров регулярно используют R при проведении научно-технических расчетов и создании крупных информационных проект…

Демократия и декаданс медиа

Мы живем в революционную эпоху коммуникационного изобилия, когда многие инновации в области медиа, начиная со спутникового вещания и заканчивая умными очками или электронными книгами, вызывают немалое восхищение. В политической сфере большие надежды возлагаются на цифровую демократию, киберграждан …

Методы и алгоритмы анализа данных и их моделирование в MATLAB

Рассматриваются модели, методы и алгоритмы анализа данных, используемые в современных системах обработки информации. Приводятся основные понятия и определения общей теории информационных систем, анализируется типовая структура систем извлечения информации и систем обработки информации, рассматриваю…

Введение в статистическое обучение с примерами на языке R


Книга представляет собой доступно изложенное введение в статистическое обучение – незаменимый набор инструментов, позволяющих извлечь полезную информацию из больших и сложных наборов данных, которые начали возникать в последние 20 лет в таких областях, как биология, экономика, маркетинг, физика и д…

Анализ данных и процессов

Излагаются основные направления в области разработки корпоративных систем: организация хранилищ данных, оперативный (OLAP) и интеллектуальный (Data Mining) анализ данных. В третьем издании по сравнению со вторым, выходившем под названием «Технологии анализа данных: Data Mining, Text Mining, Visual …

Сбор данных в Интернете на языке R

Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, за…

Визуализация данных с помощью ggplot2

Визуализация данных играет важную роль на всех этапах статистического анализа – от первичного ознакомления со свойствами данных до диагностики качества построенных моделей и представления полученных результатов. Из всего разнообразия статистических программ выделяется R – интенсивно развивающаяся и…

Методика научных исследований в землеустройстве

В методических указаниях приводятся темы лабораторных занятий, порядок их выполнения, задания по каждой теме, литература, рекомендуемая для выполнения работ студентами. …

Анализ панельных данных и данных о длительности состояний

Учебное пособие охватывает темы эконометрики продвинутого уровня. В нем изложены теория и практика применения актуальных методов вероятностно-статистического анализа экономических и социологических данных, используемых для оценивания зависимостей по пролонгированным выборкам объектов, в роли которы…

Анализ применимости наукометрических показателей в качестве критериев для оптимизации сети диссертац

В России начата паспортизация диссертационных советов, по результатам которой будет проведена оптимизация их сети. К членам экспертных советов Высшей аттестационной комиссии и диссертационных советов, а также к организациям, на базе которых создаются советы, в самое ближайшее время будут предъявлен…

Экспертный анализ данных в молекулярной фармакологии

Фармакология и медицина являются одними из крайне перспективных областей для применения современных методов интеллектуального анализа данных и распознавания образов. В этих областях существует значительное количестве задач распознавания, эффективное решение которых весьма важно для фундаментальных …

Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики

Мастер Йода рекомендует:  Ищем уязвимости на сайте министерства обороны США

По убеждению Билла Фрэнкса, ведущего аналитика всемирно известной компании Teradata, уже сейчас наступила эпоха совершенно новых подходов в аналитической сфере и в использовании больших объемов данных. Что такое большие данные, каково их значение, каковы методы, технологии и принципы новейшей анали…

Основы теории медицинских технологических процессов. Часть 2

Монография посвящена исследованию моделей лечебно-диагностических процессов и методам извлечения их из данных. Лечебно-диагностические процессы рассматриваются в монографии как потоки работ. Описываются основные методы и задачи моделирования потоков и систем управления потоками работ. Дан обзор мет…

Excel 2007. Секреты и трюки

Эта книга научит вас профессиональной работе в популярнейшей офисной программе – Microsoft Excel 2007. Наряду со стандартными средствами описываются всевозможные хитрости и трюки, позволяющие быстро и эффективно выполнять расчеты любой сложности, а также примеры автоматизации и решения повседневных…

7 лучших книг для начинающего специалиста по анализу данных

7 книг для начинающего специалиста по анализу данных

Книги, прочитав которые, вы сможет разобраться в основах анализа и обработки данных и стать специалистом в данной области.

Комментарии (5)

Александр Костылев

Не нравится связка начинающий специалист

Антон Антонов

Как выяснили, что именно они лучшие?

Gribo Cat

Антон, методом научного тыка видимо.��

Геннадий Шевченко

Антон, по количеству слова «статистика» встречающегося в тексте книги

Фупотвора Штробфельтроттэльман

От графиков, рябит в глазах. Оптимизируй! Упрощай!

О проекте

Данный сайт является агрегатором контента из популярных социальных сетей. Добавление новых материалов производится в автоматическом режиме. Администрация проекта не несет ответственности за их содержание.

30 книг о Big Data и анализе данных

На волне популярности Big Data появилось такое количество изданий, посвященных этой теме, что выбрать действительно хорошие книги по big data очень сложно. Мы отобрали для вас лучшие.

Работа с Big Data требует хорошей теоретической подготовки и опыта. Набраться последнего можно на коммерческом проекте, перебирая массивы открытых данных или выполняя задания на Kaggle. За теорией добро пожаловать в мир обучающих ресурсов, курсов и блогов, посвященных работе с информацией. Мне больше нравится, когда умные люди уже собрали, переварили и разложили по полочкам всё что нужно. Поэтому я предпочитаю книги.

Первое знакомство с технологиями Big Data

1 «The Human Face of Big Data», Rick Smolan и Jennifer Erwitt

Книга рассказывает о том, как большие данные способны приносить пользу и менять мир к лучшему. Как работа с информацией повлияла на бизнес, науку, деятельность правительства, здравоохранение и повседневную жизнь. Содержит множество фотографий, поэтому легко воспринимается.

Отзывы читателей:

В целом, восторженные. Читатели называют эту книгу, прежде всего, захватывающей. Легко читается, содержит изумительные иллюстрации, рисует прекрасное и светлое будущее, которое принесет миру анализ данных. Одним словом, издание будет отличным подарком гику или любому человеку, связанному с анализом данных.

2 «Big Data: A Revolution That Will Transform How We Live, Work, and Think», Viktor Mayer-Schönberger и Kenneth Cukier

Книга начинается с истории о Google, который в 2009 году сопоставил данные американского Центра по контролю и профилактике заболеваний с частотой поисковых запросов вроде «сопли кашель температура» и научился предсказывать эпидемию гриппа. Авторы — оксфордский профессор Виктор Майер-Шонбергер и редактор The Economist Кеннет Какьер — называют себя вестниками божьими Big Data и утверждают, что мир скоро изменится. Но книга — не просто гимн новым технологиям: в ней нашлось место и восторгам насчет возможностей применения Big Data на благо людей, и опасениям за их безопасность и право на тайну личной переписки.

«Big Data…» написана для широкой публики и не требует для чтения специальных познаний. В большей степени представляет собой рассуждения авторов, но содержит и примеры использования технологий анализа данных в бизнесе.

Отзывы читателей:

Издание хвалят за доступное изложение сложных примеров, которые будут понятны любому читателю. В то же время, кто-то ругает автора за слишком долгое «раскачивание» и большой размер вводных глав. Один из главных минусов — маленькое количество реальных примеров и частое повторение одних и тех же мыслей.

3 «Data Analytics Made Accessible», Anil Maheshwari

Книга написана разговорным языком, читается легко. Она охватывает основные аспекты активно развивающейся отрасли анализа данных: хранилища, алгоритмы выявления взаимосвязей, способы визуализации, социальные графы, нейросети и разбор неструктурированного текста. Каждая часть начинается с примера из реальной жизни — Netflix, WhatsApp, IBM Watson — и заканчивается тематическими заданиями. В качестве бонуса прилагается руководство по языку R для начинающих.

После прочтения вы сможете самостоятельно реализовать все этапы анализа данных: от планирования исследования до выдвижения гипотезы и ее проверки.

Отзывы читателей:

В основном положительные, почти все отмечают чрезвычайно понятное изложение сложных терминов и алгоритмов, что сильно снижает входной порог для новичков.

4 «Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die», Eric Siegel и Thomas H. Davenport

Автор «Предсказательной аналитики» — редактор The Predictive Analytics Times Эрик Сигель, рассказывает удивительные вещи:

  • Facebook перебирает по 1500 публикаций на каждого человека, определяя самые интересные для него новости;
  • Microsoft умеет предсказывать местоположение человека в определенной точке на несколько лет вперед, отталкиваясь от генерируемых им повседневных GPS-данных;
  • cтраховые компании в США за 18 месяцев до вероятной даты смерти человека предлагают заключить договор медицинского обслуживания последних лет жизни.

Книга пронизана примерами использования предсказательной аналитики компаниями и государственными учреждениями: от механизма подбора контактов на LinkedIn до подробностей применения данной технологии в ходе избирательной кампании Барака Обамы.

Отзывы читателей:

В основном отмечают полезность информации о том, где именно применяются конкретные алгоритмы (деревья решений, регрессия ).

Интеллектуальный анализ данных, алгоритмы, майнинг

5 «Data Smart: Using Data Science to Transform Information into Insight», John W. Foreman

Автор утверждает, что большинство руководителей фирм подходят к аналитике неправильно: закупают дорогие программные комплексы и нанимают консультантов. Они тратят немалые деньги еще до того, как поймут, что на самом деле желают получить в результате. Стоп, говорит автор — ведущий аналитик Mailchimp, который раньше работал на Coca-Cola, Intercontinental и ФБР — вдохните и выдохните, всё куда проще. Для большинства случаев достаточно обычного Excel, ведь он куда мощнее, чем кажется на первый взгляд.

Эта книга — не о хранилищах данных, навороченных программных комплексах и суровом программировании. Она фокусируется, прежде всего, на методах. Вы познакомитесь с математической оптимизацией и генетическими алгоритмами, методами кластеризации данных, прогнозирования, способами сезонных корректировок и другими подходами, которые с помощью Excel помогут превратить набор данных в источник полезной информации.

Книга ориентирована на руководителей, маркетологов и аналитиков компаний различных масштабов. Она научит не бояться массива данных и подскажет, как его использовать для принятия грамотных управленческих решений.

Отзывы читателей:

Примечателен один отзыв, который написал друг автора. Он лучше всего описал суть. Есть три типа книг об анализе данных:

  • Слишком технические с большим количеством греческих букв и знаков суммы
  • Бизнес книги о том, как данные совершат революцию
  • Технические книги о последних популярных технологиях анализа (R, Hadoop)

Эта же книга — для простых людей, которые хотят научиться анализу данных, прочитав описанные на пальцах алгоритмы.

6 «The Elements of Statistical Learning: Data Mining, Inference, and Prediction», Trevor Hastie, Robert Tibshirani и Jerome Friedman

«Элементы статистического обучения» — фундаментальный теоретический труд, который описывает принципы, лежащие в основе работы с большими данными. В этой книге вы не встретите ни строчки на Python или R. Вас ожидают формулы, графики и еще раз формулы.

Книга предназначена суровым теоретикам и тем практикам-энтузиастам, кто хотел бы углубить познания в математической статистике. Она охватывает большое количество смежных областей: машинное обучение с учителем и без, нейронные сети, деревья решений, метод опорных векторов и ансамбли моделей. Издание считается одним из стандартов области, ссылки на него часто встречаются в статьях и книгах об анализе данных.

На сайте Стэнфордского университета её можно скачать бесплатно и, что немаловажно, законно.

Отзывы читателей:

Книга не содержит готовых рецептов, которые можно применить для своих задач. Нет, она предназначена для глубокого понимания анализа данных и его фундаментальных основ.

7 «Introduction to Data Mining», Pang-Ning Tan, Michael Steinbach и Vipin Kumar

Книга погружает читателя в технологии анализа данных постепенно, от простого к сложному. Первые главы посвящены тому, что такое данные, какими они бывают, как подготовить их к обработке, что такое сводная статистика, визуализация и OLAP — описывают минимум, необходимый для быстрого извлечения знаний из массива информации. Затем авторы переходят к методам классификации, кластеризации и ассоциативному анализу.

Подходит для тех, кто сталкивается с анализом данных впервые. Минимум математики, максимум внятных разъяснений и иллюстраций.

Отзывы читателей:

Еще одна книга с поэтапным, визуальным и понятным объяснением сложных алгоритмов без слишком большого количества непонятных формул.

8 «Big Data: Principles and best practices of scalable realtime data systems», Nathan Marz и James Warren

Автор этой книги — Натан Марц — один из пяти членов команды социального агрегатора BackType, который в 2011 году был куплен Twitter. Всего 5 человек справлялись с оперативной аналитикой 100 терабайт данных, настройкой, мониторингом и обслуживанием кластера из сотен машин. На вопрос коллег, как им это удается столь малыми силами, Марц обычно отвечал: «Дело не в том, что мы делаем, а в том, что не делаем».

Стандартная архитектура систем обработки данных слишком сложна и уязвима, и чем данных больше, тем больше проблем. Марц предлагает новый подход к организации хранения и обработки данных — простую и надежную лямбда-архитектуру, которую он подробно описывает в книге. Для ее реализации автор использует открытые инструменты: Hadoop, Cassandra, Cascalog, ElephantDB и Storm с Trident.

Как говорит автор: «Было бы здорово, если бы я мог прочитать эту книгу перед началом моей работы с Big Data. Это сделало бы ее простой и увлекательной».

Отзывы читателей:

Профессионалы отмечают полезность технологий организации обработки больших массивов данных и грамотного построения архитектуры таких систем.

Big Data и бизнес

Технологии Big Data позволяют обрабатывать значительные объемы информации, накопленные организациями и принимать на их основе более взвешенные управленческие решения, лучше понимать своих клиентов и бизнес-процессы. Книги из этого раздела популярно рассказывают о том, зачем использовать Big Data и как создать необходимую инфраструктуру внутри компании, демонстрируют реальные примеры использования аналитики для повышения эффективности организаций.

9 «Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking», Foster Provost и Tom Fawcett

Книга основана на материалах курса MBA, который Фостер Провост читал в Нью-Йоркском университете. Описанные автором принципы иллюстрируются решением реальных проблем, стоявших перед компаниями. Эта книга учит относиться к большим данным как к бизнес-активу, и помогает понять, как наладить связь между менеджментом и аналитиками-технарями.

В книге нет загадочной телепортации от пункта «проблема» до пункта «решение». В ней не только описана каждая проблема и то, что позволило с ней справиться, но и ход мыслей специалиста, который привел к выбору того или иного способа решения задачи. Ведь принципы и идеи иногда важнее готовых рецептов.

Книга была отмечена Harvard Business Review, как одна из лучших работ по этой теме. Она довольно насыщена материалом и ее чтение потребует высокого уровня концентрации, но вам не потребуется техническое образование, чтобы получить пользу от изложенного в ней материала.

Отзывы читателей:

Лучше всего книгу характеризует список того, чего в ней нет:

  • Это не сборник дифференциальных уравнений
  • Здесь не будет пошаговых рецептов без объяснения их сути
  • Это не книга для менеджеров, которым нужно разобраться в новом хайпе

10 «Big Data at Work: Dispelling the Myths, Uncovering the Opportunities», Thomas H. Davenport

Книга «Big Data at Work» идеальна для управленцев, которые планируют интегрировать аналитический отдел в структуру компании. В ней представлено множество советов: дан поэтапный план внедрения методик анализа больших данных в компании, описаны технологии обработки информации и процесс найма специалистов. Словом, книга ориентирована на управляющих, перед которыми стоит задача поставить процесс анализа данных на поток. Один из отзывов лучше всего описывает ее достоинства:

«Big Data at Work» — первая и единственная книга, описывающая, как реальные организации применяют технологии анализа Больших Данных, извлекая из них ценность

В книге приведено много полезных примеров от таких компаний, как UPS, GE, Amazon, United Healthcare, Citigroup и др.

11 «Too Big to Ignore: The Business Case for Big Data», Phil Simon

Too Big to Ignore ориентирована на CIOs, CEOs и ITшников. Автор книги, Phil Simon обладает сверхъестественной способностью соединять бизнес кейсы со сложными техническими терминами, и, что самое важное, ясно объяснять, как все взаимодействует. В своей книге он демистифицирует термин «Big Data», раскладывая по полочкам технологии, решения, ПО и их вендоров и др.

Отзывы читателей:

Проста для понимания, подойдет специалистам с любым уровнем знаний.

Spark

Apache Spark — программное обеспечение с открытым исходным кодом для реализации распределённой обработки неструктурированных и слабоструктурированных данных.

12 «Learning Spark: Lightning-Fast Big Data Analysis», Holden Karau, Andy Konwinski, Patrick Wendell и Matei Zaharia

Книга написана разработчиками Apache Spark и будет полезна инженерам и специалистам, работающим с большими объемами данных. В издании представлены приемы обработки данных с помощью простых API в Python, Java и Scala. Кроме того, это издание включает в себя информацию о Spark SQL, Spark Streaming, и Maven. Вы научитесь запускать параллельные задачи несколькими строками кода и написанию приложений, которые выполняют как простые задачи, так и требующие методов машинного обучения. Короткий список преимуществ книги:

  • Быстрое погружение в возможности Spark, такие как распределенные массивы данных, кеширование в памяти, и работа с командной строкой
  • Использование одной программной парадигмы вместо смешивания таких инструментов, как Hive, Hadoop, Mahout, и Storm
  • Развертывание интерактивных, пакетных и потоковых приложений
  • Коннекторы к различным источникам данных: HDFS, Hive, JSON, и S3

Примеры, описанные в книге, вы сможете найти на github.

Отзывы читателей:

Некоторые программисты отмечают поверхностность примеров и их скупое объяснение. Тем не менее, все отмечают, что книга будет хорошим началом для погружения в Spark.

13 «Advanced Analytics with Spark: Patterns for Learning from Data at Scale», Sandy Ryza, Uri Laserson, Sean Owen и Josh Wills

Эта книга написана четырьмя специалистами компании Cloudera и представляет современную платформу для управления данными и их анализа. «Advanced Analytics with Spark» — это руководство, в котором собраны различные шаблоны для анализа больших объемов данных с помощью Spark.

Начав с общего знакомства с технологией, вы постепенно углубитесь в методы классификаций, коллаборативной фильтрации и методы поиска аномалий, которые применяются в генетике и в сфере финансовой безопасности. Для реализации примеров используются Java, Python и Scala.

В книге описаны 9 тематических исследований в различных областях, основанные на реальных данных. Вы узнаете:

  • Как исследуется трафик такси в Нью-Йорке
  • Алгоритмы рекомендации музыки
  • Как предсказывается состояние лесного покрова с помощью алгоритма «деревья решений»
  • Понимание контента Википедии
  • Анализ данных генома и проекта BDG
  • Моделирование финансового риска с помощью метода Монте-Карло
  • Применение анализа данных в нейробиологии с помощью PySpark и Thunder.


Отзывы читателей:

Прекрасное пошаговое руководство для глубокого погружения в анализ данных и Spark.

Аналитика на Python

Python — гибкий язык с простым синтаксисом, для которого создано огромное количество мощных библиотек для машинного обучения и визуализации данных с открытым исходным кодом.

14 «Python Machine Learning», Sebastian Raschka

Это руководство создано для тех, кто стремится расширить свое понимание технической стороны работы с предсказательной аналитикой на языке Python. Книга выгодно отличается от похожих изданий шириной охватываемых вопросов и большим количеством наглядных примеров, которые помогут освоить излагаемые методы и инструменты.

Издание подойдет для инженеров с любым уровнем знаний в машинном обучении: от начального до профессионального. Вы научитесь:

  • Использовать различные аналитические модели
  • Строить нейронные сети с помощью Pylearn 2 and Theano
  • Применять регрессионный анализ
  • Улучшать веб-приложения с помощью машинного обучения
  • Открывать скрытые паттерны и структуры в данных с помощью кластеризации
  • Эффективной предварительной обработке данных
  • Применять анализ социальных данных для определения настроений аудитории

Отзывы читателей:

Эту книгу описывают не иначе, как текстовый эквивалент нейронной сети с тысячами скрытых слоев, которую запустили на Nvidea GPU последнего поколения. Она подойдет программистам с любым уровнем знаний: и начинающий, и профессионал откроют для себя много новых алгоритмов на Python.

15 «Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython», Wes McKinney

Еще одна книга о Python в контексте Big Data, но она не об аналитических методах и не о концепциях и методах работы с данными, а об инструментах, которые Python может дать аналитику. Книга написана ведущим автором библиотеки «Pandas» (Python Data Analysis Library).

Вы научитесь использовать интерактивную оболочку IPython как основную среду разработки, освоите функции NumPy, познакомитесь с аналитическими инструментами, входящими в Pandas, и другими возможностями этой библиотеки.

Автор предполагает, что вы в достаточной степени знакомы с используемым языком и не останавливается на базовых моментах.

Вы научитесь использовать высокоэффективные инструменты для загрузки, хранения и обработки данных, познакомитесь со статичной и интерактивной визуализацией, а в качестве бонуса увидите, как решаются сложные задачи в веб-аналитике, социальных науках, финансах и экономике.

Отзывы о книге:

Самые разные. Положительные стороны, которые отмечают читатели: проста для понимания, дает хорошие фундаментальные знания. Отрицательные моменты: ошибки в коде (ближе к концу книги).

16 Data Science from Scratch: First Principles with Python

Библиотеки, фреймворки и различные инструменты для работы с данными безусловно, хороши для погружения в практический анализ данных, но есть шанс того, что вы будете их применять без фактического понимания науки о данных (Data science). С этой книгой вы изучите применение инструментов и алгоритмов с нуля.

Если у вас есть способности к математике и практические навыки программирования, автор поможет разобраться с математикой и статистикой науки о данных. Краткое содержание книги:

  • Вводный курс в Python
  • Изучение основ линейной алгебры, статистики и понимание того как и где они применяются в науке о данных
  • Сбор, исследование, очистка и др. манипуляции с данными
  • Погружение в фундаментальные основы машинного обучения
  • Написание на Python различных моделей: k-nearest Neighbors, Naive Bayes, линейная и логистическая регрессия, деревья решений, нейронные сети, и кластеризация данных
  • Рекомендательные системы, обработка естественного языка, MapReduce и др.

Отзывы читателей:

Положительные. Один программист с 10-ти летним опытов отметил книгу лучшей среди похожих для тех, кто хочет научиться анализу данных на Python.

Визуализация данных

Визуализация данных — неотъемлемый аспект big data. Грамотное представление данных, собранных в результате исследования, значительно упрощает процесс формирования и обоснования гипотезы, помогает объяснить свою позицию коллегам и упрощает обработку данных.

17 «Storytelling with Data: A Data Visualization Guide for Business Professionals», Cole Nussbaumer Knaflic

Книга научит вас основам визуализации данных и покажет, как сделать их эффективным подспорьем для создания различных презентаций. Вы будете учиться визуализировать данные на реальных примерах, улучшите свое понимание контекста и аудитории, сможете легко определять оптимальный способ подачи информации, научитесь очищать свои презентации от загромождающих элементов и привлекать внимание аудитории к ключевым моментам.

Мастер Йода рекомендует:  Java Challengers #1 Перегрузка методов в JVM

Автор делает акцент на эстетическом аспекте представления результатов, предлагая вам взглянуть на это глазами дизайнера, и научит вас использовать дизайнерские концепции для визуализации.

Hadoop

Hadoop — проект, созданный Apache Software Foundation. Это набор инструментов, распространяющийся на бесплатной основе, основная задача которого — разработка и выполнение распределённых программ, работающих на кластерах из сотен и тысяч узлов.

18 «Hadoop for Dummies», Dirk Deroos, Paul C. Zikopoulos, Roman B. Melnyk

Этот учебник, как понятно из названия, ориентирован на тех, кто только начинает свое знакомство с Hadoop. Издание простым языком объясняет ценность Big Data и рассказывает историю появления Hadoop, описывает его преимущества, функциональность и показывает приемы его практического использования. Кроме того, книга знакомит вас с кластерами, шаблонами проектирования и экосистемой Hadoop.

В этой книге вы найдете:

  • Описание экосистемы Hadoop 2 и Yarn;
  • Примеры реального использования, которые помогут вам начать работу;
  • Подробную информацию об установке кластера;
  • Руководство по использованию Oozie для планирования рабочих процессов;
  • Информацию о том, как добавить структуру из Hive или HBase;
  • Подробную информацию о работе с SQL и Hive;
  • Информацию о развертывании Hadoop в облаке;
  • Информацию о проблемах, с которыми сталкиваются администраторы.

Отзывы читателей:

Их практически нет, а те что есть, довольно скупы.

19 «Hadoop: The Definitive Guide», Tom White

Это практическое руководство по использованию одного из самых мощных наборов инструментов, распространяющихся на бесплатной основе. Разработчики найдут полезную информацию об анализе больших массивов данных, а администраторы научатся создавать и настраивать кластеры Hadoop.

В книге представлено огромное количество тематических исследований, иллюстрирующих то, как Hadoop решает конкретные задачи. Она научит вас использовать Hadoop Distributed File System (HDFS) для хранения больших массивов данных и выполнения распределенных вычислений над ними. Расскажет о возможностях использования MapReduce и распространенных ошибках, которые встречаются при работе с этой моделью. Вы узнаете, как спроектировать, создать и настроить кластер Hadoop, как запустить Hadoop в облаке и многое другое. Последнее издание включает в себя разделы, посвященные таким инструментам экосистемы, как Pig, Hive, HBase, ZooKeeper и Scoop.

Отзывы читателей:

Есть несколько негативных отзывов, которые отмечают различные недостатки: мешанина различных стилей, примеры кода без названия файлов, устаревшая местами информация и др.

20 «Hadoop Operations», Eric Sammer

Если вы планируете работать с большими и сложными кластерами Hadoop, эта книга обязательна для вас. Она написана Эриком Заммером, главным архитектором Cloudera, и охватывает все этапы от планирования и создания, до настройки и постоянного сопровождения кластера.

В первую очередь книга рассчитана на администраторов, но и разработчики найдут в ней много интересного. Ваше знакомство с Hadoop начнется с установки и настройки всего исчерпывающее представление о HDFS и MapReduce; пройдете все этапы развертывания Hadoop, начиная с выбора аппаратного обеспечения и операционной системы; научитесь управлять ресурсами с помощью разделения входных данных между непересекающимися группами; узнаете о поддержке и резервном копировании созданных систем на реальных примерах.

Отзывы читателей:

Положительные. Так как книга написана архитекторов Cloudera, в ней отражен весь опыт работы этой компании с Hadoop. Рассматривается множество ньюансов, узких мест экосистемы и возможных проблем.

21 «Hadoop in Practice», Alex Holmes

Руководство содержит в себе 85 проверенных примеров, поданных в формате проблема-решение. Автор достаточно хорошо балансирует между описанием фундаментальных основ и практических примеров с погружением в аспекты технологии. Вы будете изучать каждое решение поэтапно, что поможет лучше понять принципы построения той или иной модели.

Книга научит вас не только решать практические задачи, но и думать таким образом, чтобы суметь превратить набор данных в четко структурированную базу, с которой легко работать.

В книге вы найдете:

  • Исчерпывающий обзор Hadoop и MapReduce;
  • 85 практических, проверенных методик;
  • Реальные проблемы и их решения;
  • Подробную инструкцию для интеграции MapReduce и R.

Отзывы читателей:

Купившие книгу отмечают устаревшую местами информацию, поэтому будьте внимательны при выборе: покупайте только самое последнее издание, выпущенное не более чем год назад.

22 «Professional Hadoop Solutions», Boris Lublinsky, Kevin T. Smith и Alexey Yakubovich

Эта книга, написанная командой опытных разработчиков, представляет собой подробное руководство о Hadoop и интеграции API для решения реально возникающих проблем. Книга рассказывает о хранении данных в HDFS и Hbase, обработке данных с помощью MapReduce и автоматизации работы с информацией с помощью Oozie.

Ее можно назвать исчерпывающим руководством для системных администраторов и разработчиков, работающих с Hadoop:

  • Подробно рассматривает создание стабильных MapReduce приложений, их тестирование и отладку
  • Объясняет, как расширить Oozie и использовать ее для интеграции с enterprise приложениями
  • Описывает как спроектировать Hadoop приложения, которые обрабатывают запросы в реальном времени
  • Показывает, как использовать инструменты безопасности Hadoop: шифрование, аутентификация, авторизация, SSO и аудирование
  • Рассматривает способы запуска Hadoop приложений в облаке Amazon

Отзывы читателей:

Отмечают хорошую «проработку в глубину» описанных выше тем, не рассмотренных в других книгах (Hadoop: The Definitive Guide, Hadoop In Practice).

23 HBase: The Definitive Guide: Random Access to Your Planet-Size Data

HBase используется в экосистеме Hadoop и эта книга научит вас управлять огромными массивами данных с помощью мощного инструмента. HBase является opensource разработкой, которая реализует архитектуру BigTable, которая используется внутри Google. Она устроена таким образом, что может масштабироваться горизонтально для обработки миллионов строк и столбцов без потери скорости чтения и записи. В книге рассматривается большое количество узких вопросов, которые чаще всего возникают при внедрении базы данных в IT инфраструктуру компании:

  • Вы узнаете, как тонко интегрировать Hadoop с HBase, чтобы обеспечить простое масштабирование
  • Как распределять большие наборы данных по большому количеству дешевых однотипных серверов
  • Изучите различные способы подключения к HBase: как стандартные Java клиенты, так и специализированные API интерфейсы для доступа из других сред
  • Узнаете о различных составляющих архитектуры HBase (формат хранения, логи, вторичные индексы, реализация транзакций, интеграция с поиском и др.)
  • Рассмотрите разные вопросы развертывания кластера, его обслуживания и мониторинга
  • И, наконец, сможете углубиться в вопросы быстродействия и управления памятью

24 MapReduce Design Patterns: Building Effective Algorithms and Analytics for Hadoop and Other Systems

Шаблоны проектирования приложений на фреймворке MapReduce разбросаны по различным исследовательским статьям и блогам. Эта книга избавит вас от необходимости перелопачивать различные источники: в ней собраны основные принципы проектирования и построения программ на MapReduce.

Каждый пример рассматривается в определенном контексте, чтобы вы смогли избежать частые ошибки, с которыми можно столкнутся. Вот некоторые типы шаблонов, которые описываются:

  • Группировка и агрегирование
  • Фильтрация данных от определенных пользователей
  • Шаблоны структурирования для работы с другими системами и упрощения анализа
  • Шаблоны соединения — анализ различных наборов данных вместе для поиска взаимосвязей
  • Мета-шаблоны: соединение вместе нескольких шаблонов для задач анализа в одном процессе
  • Шаблоны загрузки, выгрузки и хранения данных

Отзывы читателей:

Есть несколько негативных отзывов, которые указывают на низкое качество технической составляющей книги. «Издательство O’Reilly еще никогда не было столь непрофессионально» — самый безобидный из эпитетов читателей.

25 Programming Hive: Data Warehouse and Query Language for Hadoop

Книга в подробностях описывает работу с Hive — надстройкой над MapReduce, которая позволяет писать SQL-подобные запросы к распределенной системе. Эта книга — самое исчерпывающее руководство по Hive, включает в себя все аспекты работы с технологией:

  • Создание таблиц, изменение их структуры, партиционирование и другие действия, знакомые из SQL
  • Различные манипуляции с данными
  • Синтаксис запросов, похожий на SQL
  • Создание представлений (Views), индексов, тем (schema)
  • Написание функций и управление потоками
  • Вопросы безопасности
  • Интеграция Hive с Oozie, Amazon Web Services и др.

26 Programming Pig

Книга посвящена Apache Pig. Этот инструмент позволяет легко организовать параллельные потоки данных в экосистеме Hadoop. С Pig вы сможете легко создавать несколько параллельных сценариев обработки данных.

Издание подойдет как начинающим, так и продвинутым программистам. В нем описаны основы и полностью рассмотрены различные аспекты Pig:

  • Модели данных: скалярные и сложные типы
  • Написание Pig Latin скриптов для сортировки, группировки, фильтрации и др. методов обработки
  • Использование Grunt в Hadoop
  • Встраивание скриптов Pig Latin в Python для выполнения итеративных алгоритмов
  • Создание своих функций загрузки и хранения данных
  • Вопросы быстродействия

Отзывы читателей: Отрицательные. Отмечают сумбурность изложения, которая больше похожа на записи в блоге, нежели последовательное введение в тему.

27 Hadoop Application Architectures: Designing Real-World Big Data Applications

В то время как многие книги рассказывают только о применении различных компонентов экосистемы Hadoop, эта научит вас построению грамотной архитектуры конкретно под ваши задачи.

Вторая часть посвящена подробному описанию наиболее часто встречающихся архитектур существующих приложений на Hadoop. Книга также покрывает следующие вопросы:

  • Факторы, которые указывают на необходимость использования Hadoop
  • Лучшие практики загрузки и выгрузки данных из системы
  • Различные фреймворки обработки данных: MapReduce, Spark, Hive
  • Часто встречающиейся шаблоны обработки данных
  • Giraph, GraphX и др. инструменты для обработки больших графов на Hadoop
  • Использование различных инструментов планировки задач (Apache Oozie и др.)
  • Обработка больших объемов данных в реальном времени с помощьюApache Storm, Apache Spark Streaming, and Apache Flume

Отзывы читателей:

Крайне мало отзывов, в основном положительные.

Язык R

R — язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU.

28 «R Cookbook (O’Reilly Cookbooks)», Paul Teetor

Книга содержит в себе более чем 200 практических рецептов быстрого и эффективного анализа данных с помощью языка R. Этот язык довольно сложен для полного освоения, но применение готовых решений из этого издания поможет вам начать использовать всю его мощь уже сегодня, начиная с задач ввода и вывода данных, заканчивая статистическим анализом и регрессией. Каждый рецепт решает конкретную проблему, что придает изучению языка прикладной характер, способствующий скорейшему усвоению материала. Если вы новичок, эта книга поможет вам начать практическое использование возможностей R, а если у вас уже есть значительный опыт разработки на этом языке — вы сможете улучшить качество своего кода и найти новые способы решения определенных задач.

Материал поможет пройти вам каждый этап обработки данных. В ней приведены техники извлечения данных из CSV и HTML, а потом и из баз данных. Позже вы научитесь использовать средства языка для организации хранения и управления данными.

Если вы ищите книгу для начала знакомства со статистикой, это издание вам определенно не подойдет. R Cookbook предполагает знание различных основных статистических методов и алгоритмов, и только покажет вам, как применять эти методы и алгоритмы в окружении R. Но если вы решили сконцентрироваться на изучении различных методов и инструментов, например, R Graphics, тогда Cookbook от O`Reilly — именно то, что вам нужно.

29 The Art of R Programming: A Tour of Statistical Software Design

Еще одна книга об аналитике на языке R. В ней рассматриваются все аспекты программирования: от самых простых особенностей языка до продвинутых тем (замыкания, рекурсия, анонимные функции и др.). Для того, чтобы начать, вам не потребуются специальные знания статистики или большого опыта программирования. Книга поэтапно расскажет о функциональном и объектно-ориентированном программировании, математическом моделировании, преобразовании данных в разные форматы.

Несколько тем, которые затрагиваются в книге:

  • Создание графики и визуализация
  • Написание параллельного кода на R
  • Интерфейсы для R на C/C++ и Python для увеличения скорости и функциональности
  • Различные пакеты для анализа текста, изображений и многого другого
  • Продвинутые техники отладки

Отзывы читателей:

Один из отзывов написал программист с 12-ти летним опытом работы с языком R. Он отметил, что никогда не встречал ничего подобного знаменитой «K&R», The C Programming Language. Но именно эта книга оказалась достаточно хорошей, чтобы сравнить с «K&R» по уровню качества.

30 R: Easy R Programming for Beginners, Your Step-By-Step Guide To Learning R Progr

Довольно хороший выбор для желающих начать изучать язык R. Книга написана простым языком, без технических жаргонизмов и других вещей, которые делают сложным понимание материала. Авторы придерживаются поэтапного стиля изложения материала, чтобы читатель легко усваивал все тонкие непонятные моменты языка. Короткий список того, что вы изучите с после прочтения:

  • Как установить R и R Studio, а также другие редакторы
  • Основы синтаксиса R
  • Подключение пакетов
  • Представление данных в виде векторов
  • Работа с матрицами, списками и другими структурами
  • Базовая работа с графическим представлением данных и много другое

Топ 20 книг по бизнес-анализу для бизнес-аналитиков

В данной статье приведена подборка 20 книг как для начинающих бизнес-аналитиков и системных аналитиков, так и состоявшихся профессионалов в данной сфере. Книги будут полезны для людей, которые хотят развить системное видение решения проблем.
Бизнес-аналитик — специалист, использующий методы бизнес-анализа для аналитики потребностей деятельности организаций с целью определения проблем бизнеса и предложения их решения.
Международный Институт Бизнес-Анализа (IIBA, International Institute of Business Analysis) определяет бизнес-аналитика «как посредника между заинтересованными лицами для сбора, анализа, коммуницирования и проверки требований по изменению бизнес-процессов, регламентов и информационных систем. Бизнес-аналитик понимает проблемы и возможности бизнеса в контексте требований и рекомендует решения, позволяющие организации достичь своих целей».
Термин не является устоявшимся, часто для наименования специалистов, выполняющих функции бизнес-аналитика используются синонимы — системный аналитик, аналитик требований.
В консалтинговом бизнесе бизнес-аналитиком называется низшая позиция для консультанта.

Перечень книг по бизнес-анализу, по системному анализу, по сбору и обработке требований и других полезных книг:
1. Илья Корнипаев. Требования для программного обеспечения: рекомендации по сбору и документированию — М.: Издательство «Книга по требованию», 2013 — 118 с.
2. Дин Лэффенгуэлл, Дон Уидриг — Принципы работы с требованиями к программному обеспечению
3. Алистер Коберн Современные методы описания функциональных требований к системам
4. Алан Купер Психбольница в руках пациентов
5. Барбара Минто Принцип пирамиды Минто. Золотые правила мышления, делового письма и устных выступлений
6. Карл Вигерс. Разработка требований к программному обеспечению.
7. Александр Остервальдер, Ив Пинье. Построение бизнес-моделей. Настольная книга стратега и новатора
8. Элияху Голдрат Теория ограничений
9. Цель. Процесс непрерывного совершенствования
10. Цель-2. Дело не в везении
11. Питер Сенге Пятая дисциплина. Искусство и практика обучающейся организации
12. Л. Басс, П. Клементс, Р. Кацман Архитектура программного обеспечения на практике (NFR)
13. Майкл Ротер, Джон Шук Учитесь видеть бизнес-процессы. Практика построения карт потоков создания ценности
14. Расселл Л. Акофф, Джейсон Магидсон, Герберт Дж. Эддисон. Идеализированное проектирование. Как предотвратить завтрашний кризис сегодня. Создание будущего организации
15. Расселл Л. Акофф. Искусство решения проблем
16. Джамшид Гараедаги. Системное мышление. Как управлять хаосом и сложными процессами. Платформа для моделирования архитектуры бизнеса
17. Основы бизнес – анализа: учебное пособие. / под ред. В.И. Бариленко. – М.: КНОРУС, 2013.
18. Паклин Н.Б. Орешков В.И. Бизнес-аналитика: от данных к знаниям, 2013.
19. Итан М. Расиел. Метод McKinsey. Использование техник ведущих стратегических консультантов для решения личных и деловых задач
20. Итан М. Расиел, Пол Н. Фрига. Инструменты McKinsey. Лучшая практика решения бизнес-проблем

Книги для начинающих

В теме 41 ответ, и 21 участник, последнее обновление сделано пользователем Sergey 1 г, 7 мес. назад.

· человек, который еще не работал, но получил образование (наверное, студент выпускных курсов) в одной из нужных областей (ИТ, экономика и т.д.)
· программист или QA, который хочет стать аналитиком
· любой другой человек уже с опытом, который хочет стать аналитиком
· аналитик, который только-только начал работать

Только не пишите просто «Букварь Аналитика». Напишите, почему вы считаете эти книги будут полезными.

Я бы посоветовал следующее (и не секрет, что именно данные книги мы рекомендуем/обязуем к прочтению для всех аналитиков-стажеров в нашей команде):

1. Karl E. Wiegers — Software Requirements. Данная книга полезна в особенности тем, кто пока еще не в курсе, кто такой БА/СА. Прочитав эту книгу получаешь довольно полное представление о процесса работы с требованиями (включая все этапы этого процесса), шаблонах документации, изучаешь best practices и получаешь кучу новых знаний о процессе разработки ПО в целом. Минус книги — ее относительная сложность (вообщем не из серии для чайников и разжевывать по несколько раз простейшие вещи тут никто не будет).

2. Muska and Lipman — UML for the IT Business Analyst. Книга предназначена не только для штудирования UML, но и в целом описывает работу IT аналитика и процесс разработки ПО. Полезна для ознакомления с UML (но не для углубленного изучения), применением UML для OO программирования (что в принципе — целевое использования данной нотации) и деталям процесса разработки ПО. Написана живым языком с интересными примерами.

Эти 2 — основные. Кроме этого я бы порекомендовал активно использовать Википедию. Начав с просмотра Business Analysis можно по ссылкам зайти весьма и весьма глубоко.

2. Muska and Lipman — UML for the IT Business Analyst. Лично мне книга не очень понравилась, и преведение примеров в Rational Rose, как мне кажется, не очень актуально.
Скачать можно тут:
Muska and Lipman — UML for the IT Business Analyst

Библиотека T&P: 6 книг для тех, кто хочет понимать статистику

Теории и практики

Каждую неделю «Теории и практики» публикуют списки литературы от номинантов премии «Просветитель» этого года. Владимир Савельев в книге «Статистика и котики. Самая дружелюбная книга об анализе данных» объясняет, что такое дисперсия, как найти t-критерий Стьюдента и для чего используется регрессионный анализ, на примерах из жизни котов. Для «Библиотеки T&P» он посоветовал еще пять книг, которые помогут разобраться в теме.

Владимир Савельев

ассистент кафедры клинической психологии и психофизиологии ИСПН УрФУ

Книга про машинное обучение, которая позволяет довольно неплохо сориентироваться в теме. Понравилось, как структурирован материал; примеры из самых различных областей. Машинное обучение — это шаг вперед по отношению к статистике, поэтому для всех, кто хочет быть в тренде, маст-хэв.

Объемная книга, охватывающая большую часть статистических методов. Написана легко. Радует подробное объяснение того, как все работает, а также разделы про специфические методы для медицины, бизнеса, педагогики. Не радует качество переплета — нужно быть предельно аккуратным, чтобы книга не развалилась на части.

Абсолютно чудесная книга, способная привить любовь к математике как детям, так и взрослым. Пара идей оттуда сильно пригодилась в практической работе. Много сильных и ярких примеров. Научиться, правда, ничему не получится, но вдохновиться — пожалуй.

Книга о том, как статистики обманывают других людей. Хороша как прививка от дезинформации. Правда, действительно сложных мошеннических схем там не найти. Написана доступно. В первую очередь рекомендую студентам, выступающим с научными докладами. Просто потому, что они порой неосознанно делают то, что в ней написано. Пару вещей из этой книги включил в свою.

Грейди Клейн и Алан Дебни. «Статистика в комиксах»

Мой экземпляр этой книги еще лежит в магазине. Но лежать ему недолго: то, что я успел увидеть, мне крайне понравилось. Ярко, с юмором и по делу. Однако набор методов сильно ограничен: формат позволяет включить только основную информацию.

Добавить комментарий