Перед вами первая книга, в которой рассматриваются базовые навыки программирования и статистики, охватывающие весь жизненный цикл. Она адресована всем желающим работать в области Data Science или любой другой смежной области, а также аналитикам данных, преодолевающим разрыв между техническими и нетехническими областями. Если вы обладаете базовыми знаниями программирования на Python, вы научитесь работать с данными при помощи стандартных инструментов вроде pandas.
Прочитав книгу, вы сможете:
- сформулировать задачу так, чтобы ее можно было решить с помощью данных;
- выполнить сбор данных, включая обработку текста, веб-скрапинг и т.д.;
- извлекать полезную информацию путем очистки, исследования и визуализации данных;
- использовать моделирование при описании данных;
- обобщать результаты, выходящие за рамки данных.
Гонсалес Джозеф — доцент кафедры EECS Калифорнийского университета Беркли, член исследовательской группы Berkeley AI Research и один из основателей лаборатории Berkeley RISE Lab. Также является соучредителем компаний Turi Inc. и Aqueduct — разработчиков инструментария для работы с данными.
Лау Сэм — ассистент профессора института Halıcıoğlu Data Science Institute в Калифорнийском университете Сан-Диего. Имеет десятилетний опыт преподавания, занимался подготовкой и преподаванием флагманских курсов по Data Science в Калифорнийских университетах Беркли и Сан-Диего.
Нолан Дебора— заслуженный профессор статистики, заместитель декана по работе со студентами в колледже вычислительных технологий Калифорнийского университета Беркли.